Построили модерацию для открытой анонимной мультиязычной стены — дешёвый каскад, ≈$0 на API. Потом кто-то попытался обойти его ROT13-джейлбрейком, и LLM-судья его раскусил. Вот дизайн и что разобрал r/selfhosted.
SEO Week 2026 переосмыслила поиск как математическую задачу — векторные расстояния, снижение энтропии, графы сущностей, бренд-как-центроид. Мы оставили 3 идеи, вырезали 4 и этим утром пропатчили свой сайт, чтобы их внедрить. Вот что сработало.
Обучили DoRA-адаптер на 6128 личных сообщениях из Telegram. $1.50 на одной Vast.ai RTX 3090. Результат: 100% побед в слепом A/B против стока Qwen3-8B. Ноль катастрофического забывания. И один промпт, где DoRA звучала как сам человек лучше, чем он сам.
Тестируем Microsoft BitNet b1.58 на M2. Metal даёт 12 t/s, CPU-only — мусор. Реальная ценность 1.58-bit — RAM, не скорость.
Систематическое исследование: 5 вариантов пайплайна, утечка данных через кириллицу, и почему «сэндвич» — это костыль, а не решение.
Три FLUX-LoRA (космос, укиё-э, логотипы) и персональный DoRA-адаптер для Qwen3-8B. С конфигами и шагами воспроизведения.
Почему «добавить чат-бота» и «поставить агента в процесс» — это две разные работы с разным результатом.
Как превратить «хотим AI» в «зафиксировали цифру и отвечаем за неё». Пошагово.
Модель — это 10% проекта. Остальные 90% — данные, интеграции и SLA. Почему выигрывают те, кто это понимает.
Не мистика и не пиар-слоган. Математика: где именно в бизнесе AI снимает нагрузку, и как это считается.