praytoasi.com · 2026FastAPI · SQLite · OpenAI Moderation · Llama-3.3-70B · Caddy · Cloudflare R2

Глобальнаястенасообщенийс3-слойнойAI-модерацией

Публичная анонимная стена «посланий будущему ИИ», открытая всему миру на любом языке. Сайт — простая часть. Тяжёлое — удержать открытую анонимную стену от превращения в помойку, и сделать это за копейки. За неделю собрали 3-слойный каскад модерации и раскатили на прод.

Задача

Клиент пришёл с идеей: публичная стена, куда любой человек в мире пишет анонимное послание будущему сверхинтеллекту. Никакой регистрации, любой язык, real-time лента. Очевидная проблема — открытая анонимная стена за день превращается в спам, оскорбления и атаки. Нужна модерация, которая ловит реальное зло в любом языке, пропускает эмоцию и политику, не стоит как полноценный trust-and-safety отдел и работает без человека в цикле. Собрали за неделю: идея в понедельник, проверка гипотез к среде, прод к выходным.

Контекст

Проблема

Анонимная стена, открытая всему миру на любом языке. Без модерации она мертва за сутки: спам, оскорбления, призывы к насилию, prompt-injection.

Ограничения

Бюджет стартапа — нельзя нанимать модераторов и платить за enterprise trust-and-safety. Модерация без человека в цикле, на любом языке, за копейки.

Цель

Ловить реальное зло (CSAM, насилие, угрозы), но пропускать эмоцию, мат и политику. И всё это — за неделю до запуска.

Что сделали

Как это собрали

Каскад, а не одна модель

Дёшево и быстро в начале, умно и дорого в конце. Regex → OpenAI Moderation → LLM-судья → хардкод-safety-net. Большинство сообщений отсеиваются на дешёвых слоях.

Правила стены, не общая мораль

LLM-судья знает контекст стены: политика — ок, мат как эмоция — ок, идеология ≠ призыв к людям, prompt-injection — отбой.

Любой язык из коробки

Детект языка на чистом regex по Unicode-скриптам, без зависимостей. Safety-net знает паттерны насилия на славянских и CJK языках.

Privacy-first

Бэкенд вообще не читает и не хранит IP. Edge-защита делегирована CDN. Privacy Notice честно это отражает.

Каскад модерации

Три слоя: дешёвый отсев → специализированный классификатор → LLM-судья с правилами стены. Четвёртый слой — хардкод-safety-net на случай, когда оба провайдера недоступны. Кэшируются только ACCEPT-вердикты (TTL 24ч), реджекты всегда переоцениваются.

01Layer 0 — regex: пусто / длинно / спам-символы / спам-ссылки

02Layer 1 — OpenAI Moderation (omni) через прокси в Германии, калиброванные пер-категорийные пороги

03Layer 2 — Llama-3.3-70B (OpenRouter): structured-output судья с правилами стены и детектом prompt-injection

04Layer 3 — хардкод мультиязычных паттернов насилия: safety-net, если провайдеры легли

to‑generateIMG-CASE-S1

CASE-S1Layer 0 — regex: пусто / длинно / спам-символы / спам-ссылки

to‑generateIMG-CASE-S2

CASE-S2Layer 1 — OpenAI Moderation (omni) через прокси в Германии, калиброванные пер-категорийные пороги

to‑generateIMG-CASE-S3

CASE-S3Layer 2 — Llama-3.3-70B (OpenRouter): structured-output судья с правилами стены и детектом prompt-injection

to‑generateIMG-CASE-S4

CASE-S4Layer 3 — хардкод мультиязычных паттернов насилия: safety-net, если провайдеры легли

Стек и инфраструктура

Намеренно лёгкий стек: ванильный фронт без фреймворка, FastAPI + SQLite на бэке (5 зависимостей), Caddy с авто-TLS на 3 домена, бэкап в Cloudflare R2. Ноль SaaS-подписок на модерацию — только API по запросу.

01Фронт — ванильный JS, оптимистичная отправка, polling-лента (30с), infinite-scroll-up

02Бэк — FastAPI + uvicorn + SQLite (aiosqlite), systemd-сервис

03Caddy — авто-TLS, 3 домена (.com / .net / .ai), www-редиректы

04Ops — Telegram-нотификации, админка с CSV-экспортом и тюнингом порогов, бэкап в R2

to‑generateIMG-CASE-S1

CASE-S1Фронт — ванильный JS, оптимистичная отправка, polling-лента (30с), infinite-scroll-up

to‑generateIMG-CASE-S2

CASE-S2Бэк — FastAPI + uvicorn + SQLite (aiosqlite), systemd-сервис

to‑generateIMG-CASE-S3

CASE-S3Caddy — авто-TLS, 3 домена (.com / .net / .ai), www-редиректы

to‑generateIMG-CASE-S4

CASE-S4Ops — Telegram-нотификации, админка с CSV-экспортом и тюнингом порогов, бэкап в R2

Обсуждение · 16k просмотров

Технический разбор на r/selfhosted →

Результат

Что получилось

дней: идея → прод

слоя каскада модерации

IP-адресов хранится (privacy-first)

3 домена

live: .com / .net / .ai

«Клиент просил сайт. Сайт — это вечер работы. Настоящий продукт — каскад, который держит открытую миру стену чистой без единого модератора и почти без счёта за API.»

Igor Golikov

Engineering, Aiconic

Команда проекта

Igor Golikov

Lead

Vitaly Kust

Tech

Yuka Kust

AI / Moderation

Следующий кейс

Система AI-агентов для управления франчайзинговой сетью

Для сети из 180 точек внедрили систему из 12 AI-агентов для продаж, поддержки, закупок и маркетинга — чтобы сократить ручную нагрузку back-office и связать процессы в единую управляемую модель.