
Глобальнаястенасообщенийс3-слойнойAI-модерацией
Публичная анонимная стена «посланий будущему ИИ», открытая всему миру на любом языке. Сайт — простая часть. Тяжёлое — удержать открытую анонимную стену от превращения в помойку, и сделать это за копейки. За неделю собрали 3-слойный каскад модерации и раскатили на прод.
Клиент пришёл с идеей: публичная стена, куда любой человек в мире пишет анонимное послание будущему сверхинтеллекту. Никакой регистрации, любой язык, real-time лента. Очевидная проблема — открытая анонимная стена за день превращается в спам, оскорбления и атаки. Нужна модерация, которая ловит реальное зло в любом языке, пропускает эмоцию и политику, не стоит как полноценный trust-and-safety отдел и работает без человека в цикле. Собрали за неделю: идея в понедельник, проверка гипотез к среде, прод к выходным.
Проблема
Анонимная стена, открытая всему миру на любом языке. Без модерации она мертва за сутки: спам, оскорбления, призывы к насилию, prompt-injection.
Ограничения
Бюджет стартапа — нельзя нанимать модераторов и платить за enterprise trust-and-safety. Модерация без человека в цикле, на любом языке, за копейки.
Цель
Ловить реальное зло (CSAM, насилие, угрозы), но пропускать эмоцию, мат и политику. И всё это — за неделю до запуска.
Как это собрали
Каскад, а не одна модель
Дёшево и быстро в начале, умно и дорого в конце. Regex → OpenAI Moderation → LLM-судья → хардкод-safety-net. Большинство сообщений отсеиваются на дешёвых слоях.
Правила стены, не общая мораль
LLM-судья знает контекст стены: политика — ок, мат как эмоция — ок, идеология ≠ призыв к людям, prompt-injection — отбой.
Любой язык из коробки
Детект языка на чистом regex по Unicode-скриптам, без зависимостей. Safety-net знает паттерны насилия на славянских и CJK языках.
Privacy-first
Бэкенд вообще не читает и не хранит IP. Edge-защита делегирована CDN. Privacy Notice честно это отражает.
Каскад модерации
Три слоя: дешёвый отсев → специализированный классификатор → LLM-судья с правилами стены. Четвёртый слой — хардкод-safety-net на случай, когда оба провайдера недоступны. Кэшируются только ACCEPT-вердикты (TTL 24ч), реджекты всегда переоцениваются.
Стек и инфраструктура
Намеренно лёгкий стек: ванильный фронт без фреймворка, FastAPI + SQLite на бэке (5 зависимостей), Caddy с авто-TLS на 3 домена, бэкап в Cloudflare R2. Ноль SaaS-подписок на модерацию — только API по запросу.
Что получилось
«Клиент просил сайт. Сайт — это вечер работы. Настоящий продукт — каскад, который держит открытую миру стену чистой без единого модератора и почти без счёта за API.»
Igor Golikov
Igor Golikov
Vitaly Kust
Yuka Kust
Система AI-агентов для управления франчайзинговой сетью
Для сети из 180 точек внедрили систему из 12 AI-агентов для продаж, поддержки, закупок и маркетинга — чтобы сократить ручную нагрузку back-office и связать процессы в единую управляемую модель.
