Лонгрид · май 2026 · @tk_3826
Как мы собирали «Токенизаторную 3826» — от названия до бота, который пишет за вас
История проекта: личный Telegram-канал про нейроновости с полигона, исследования в «дешёвых» чат-ботах, цифровой двойник из переписки и редактор @AdLibMe_Writer_bot, который не публикует без вашего «в канал».
Зачем вообще отдельный канал
Идея была простой и честной: не ещё один «дайджест ИИ-новостей на тысячу ссылок», а кураторский поток для своих. Всё, что автор реально смотрит на полигоне REBEL / AdLib: что стоит внимания, что пробует руками, что можно пересказать с мнением — без NDA-шной сухости и без обязательного лонгрида на каждый чих.
Параллельно взросла вторая мысль: раз постов будет много, нужен не только канал, а конвейер — чтобы черновик собирался в авторском голосе, правился в диалоге, а в ленту уходило только то, что вы сознательно отпустили. Так родилась связка «канал + бот-райтер», а не «ещё один ChatGPT в личке».
Имя и лицо: турнир моделей (и победа Grok)
С названием мы не бросались в код. Сначала — отдельный заход на все популярные LLM: одна и та же задача («канал для своих, нейро, полигон, без корпоративного занудства») ушла в разные чаты. На выходе — десяток вариантов; из них человек выбирал то, что звучит своим, а не «как у всех SaaS-блогов».
- ИИ без NDA
- Контекстное окно
- Токены и пельмени
- Нейрошёпот
- RAG для своих
- Галлюцинации запрещены
- Промпт на кухне
- Слой внимания
- ЛЛМ после работы
- Нейропанк для друзей
- Токенизаторная 3826
Победило «Токенизаторная 3826» — с намёком на лабораторию, токены и внутренний инсайд (цифру 3826 можно один раз объяснить в закрепе «для своих»).
Описание канала для Telegram тоже гоняли через несколько моделей. Здесь лучше всех сработал Grok: он из коробки менее чопорный, нормально переваривает «нейронные» абсурды и не стыдится живого языка. Итоговый текст короткий и по делу:
Нейроновости и всё, что удалось вынести с полигона. Делюсь из разных источников тем, что, на мой взгляд, стоит внимания: иногда репост, иногда — с мыслями и комментариями. Плюс рассказываю, что сам пробую и юзаю.
Канал живёт здесь: @tk_3826. Обо мне — adlibme.ru.
Отдельный воркспейс и дорожная карта
Чтобы не смешивать канал с сайтом AdLibMe и другими автоматизациями, весь контекст переехал в отдельную папку проекта и отдельный воркспейс в Cursor. Там же появился журнал итераций — не роман в чате, а короткие факты: что решили, что сломалось, что задеплоено.
Дорожную карту разложили на фазы: сначала исследования, потом «цифровой двойник» из Telegram, потом Style Bible и код бота, потом живая калибровка на реальных постах. Так агент в IDE не перескакивал сразу в код, пока не закрыта этика репостов и выбор модели.
Исследования в Gemini (и зачем так — экономия агентных кредитов)
Глубокую разведку сознательно не гоняли через Cursor-агента на максимальных моделях. Вместо этого — пять тематических промптов (R-DT, R3, R1, R5, R4) в Gemini Deep Research в браузере: цифровой двойник, этика репостов, архитектура бота, стоимость API, парсинг ссылок.
Результаты легли в файлы docs/research/, сводка решений — в SYNTHESIS.md.
Оттуда без сюрпризов вытекло главное:
- MVP без RAG и fine-tune: system prompt + Style Bible + few-shot;
- жёсткая этика: источник, не копипаст, «что пробую» — с минусами;
- стек бота: Python, aiogram 3, SQLite, long polling, один владелец в личке;
- черновики через OpenRouter (GPT-4.1-mini + fallback Gemini Flash), порядка доллара в месяц на десятки постов.
Цифровой двойник: экспорт Telegram без паранойи
Чтобы бот звучал как автор, а не как «вежливый корпорат», нужен был корпус реальной переписки.
Взяли официальный экспорт Telegram (result.json, сотни мегабайт) — но в работу пошла не вся свалка,
а белый список чатов: воркшопы Nord, лички про ИИ с коллегами, без случайного шума.
Скрипт extract_telegram_style.py отфильтровал 1018 сообщений в data/exports/selected/.
Из них собрали Style Bible, профиль автора, анти-паттерны («в современном мире», канцелярит),
глоссарий и первые few-shot примеры для промпта.
Важное правило для LLM: zero-trust к фактам — не выдумывать цифры и имена, пересказывать новость своими словами, в конце — строка «Источник: …», если материал чужой.
Бот-райтер: три режима и разделение «думает» / «публикует»
Бот @AdLibMe_Writer_bot — это личный редактор, не публичный чат. Работает только у владельца; в канал он ходит только по команде.
публикация без LLM — в ленту уходит ровно тот текст, который вы утвердили
Три режима поста (задаются командой или контекстом):
- signal — короткий сигнал: что случилось и зачем смотреть;
- repost+ — новость своими словами + позиция «по мне»;
- polygon — личный опыт с полигона: что пробовал, плюсы, минусы, кому зайдёт.
Можно кинуть текст, ссылку (опционально — вытащить через Jina Reader), ответить реплаем на пересланное. Голосовые тоже завели: расшифровка → тот же конвейер, что и с текстом.
Самообучение без переобучения модели
Fine-tune модели не поднимали — вместо этого память в промпте.
Каждая правка и каждая публикация пишутся в базу событий; после «В канал» лёгкая дистилляция вытаскивает
0–3 правила в preferences.md («короче», «без списков», «вопрос в конце»).
Команда /learn … добавляет правило вручную. Эталонные посты копятся в
few_shot.pending.json — чтобы потом перенести лучшие в few-shot, когда накопится практика.
Отдельно в правила постинга вписали: если уместно — один вопрос аудитории в конце (перед «Источник:»), без «ты/вы», чтобы в комментариях шла живая реакция, а не монолог в пустоту.
Деньги, кнопки, честный отчёт после поста
OpenRouter отдаёт стоимость каждого вызова. Бот считает прогон целиком: от первого черновика через все правки до дистилляции после публикации. В ответе после «Опубликовано» — две строки: «Потрачено на пост: $…» и «Баланс OpenRouter: $…» (остаток кредитов, без простыни про ключи и «потрачено за всё время»).
Внизу чата — постоянное меню: новый пост, баланс, в канал, черновик, отмена, помощь. Под черновиком — inline-кнопки. После публикации — «новый пост» и снова баланс.
Хронология в одном списке
-
СтартИдея канала «для своих», brainstorm названий на разных LLM, выбор «Токенизаторная 3826», описание (лучше всего — Grok).
-
ПланОтдельный репозиторий, ROADMAP, research-промпты → Gemini Deep Research (R-DT … R4) → SYNTHESIS.
-
ГолосЭкспорт Telegram, whitelist чатов, 1018 сообщений → Style Bible, профиль, system prompt, few-shot.
-
MVPБриф (аудитория смешанная, без ты/вы, OpenRouter), бот aiogram: черновик → правки → publish в @tk_3826.
-
СейчасБот крутится 24/7, самообучение, учёт стоимости прогона, вопросы аудитории, калибровка на живых постах.
Где мы сейчас
Конвейер рабочий: вы кормите бота сырьём, спорите с черновиком в личке, публикуете одной кнопкой. Канал — @tk_3826, редактор — @AdLibMe_Writer_bot.
Следующий естественный шаг — не «ещё фича ради фичи», а 10–20 реальных постов: по ним подтянуть few-shot, уточнить preferences и понять, где бот уже попадает в голос, а где ещё «пахнет ChatGPT».