← Все лонгриды

Лонгрид · май 2026 · @tk_3826

Как мы собирали «Токенизаторную 3826» — от названия до бота, который пишет за вас

Аватар канала Токенизаторная 3826

История проекта: личный Telegram-канал про нейроновости с полигона, исследования в «дешёвых» чат-ботах, цифровой двойник из переписки и редактор @AdLibMe_Writer_bot, который не публикует без вашего «в канал».

Зачем вообще отдельный канал

Идея была простой и честной: не ещё один «дайджест ИИ-новостей на тысячу ссылок», а кураторский поток для своих. Всё, что автор реально смотрит на полигоне REBEL / AdLib: что стоит внимания, что пробует руками, что можно пересказать с мнением — без NDA-шной сухости и без обязательного лонгрида на каждый чих.

Параллельно взросла вторая мысль: раз постов будет много, нужен не только канал, а конвейер — чтобы черновик собирался в авторском голосе, правился в диалоге, а в ленту уходило только то, что вы сознательно отпустили. Так родилась связка «канал + бот-райтер», а не «ещё один ChatGPT в личке».

Имя и лицо: турнир моделей (и победа Grok)

С названием мы не бросались в код. Сначала — отдельный заход на все популярные LLM: одна и та же задача («канал для своих, нейро, полигон, без корпоративного занудства») ушла в разные чаты. На выходе — десяток вариантов; из них человек выбирал то, что звучит своим, а не «как у всех SaaS-блогов».

  • ИИ без NDA
  • Контекстное окно
  • Токены и пельмени
  • Нейрошёпот
  • RAG для своих
  • Галлюцинации запрещены
  • Промпт на кухне
  • Слой внимания
  • ЛЛМ после работы
  • Нейропанк для друзей
  • Токенизаторная 3826

Победило «Токенизаторная 3826» — с намёком на лабораторию, токены и внутренний инсайд (цифру 3826 можно один раз объяснить в закрепе «для своих»).

Описание канала для Telegram тоже гоняли через несколько моделей. Здесь лучше всех сработал Grok: он из коробки менее чопорный, нормально переваривает «нейронные» абсурды и не стыдится живого языка. Итоговый текст короткий и по делу:

Нейроновости и всё, что удалось вынести с полигона. Делюсь из разных источников тем, что, на мой взгляд, стоит внимания: иногда репост, иногда — с мыслями и комментариями. Плюс рассказываю, что сам пробую и юзаю.

Канал живёт здесь: @tk_3826. Обо мне — adlibme.ru.

Отдельный воркспейс и дорожная карта

Чтобы не смешивать канал с сайтом AdLibMe и другими автоматизациями, весь контекст переехал в отдельную папку проекта и отдельный воркспейс в Cursor. Там же появился журнал итераций — не роман в чате, а короткие факты: что решили, что сломалось, что задеплоено.

Дорожную карту разложили на фазы: сначала исследования, потом «цифровой двойник» из Telegram, потом Style Bible и код бота, потом живая калибровка на реальных постах. Так агент в IDE не перескакивал сразу в код, пока не закрыта этика репостов и выбор модели.

Исследования в Gemini (и зачем так — экономия агентных кредитов)

Глубокую разведку сознательно не гоняли через Cursor-агента на максимальных моделях. Вместо этого — пять тематических промптов (R-DT, R3, R1, R5, R4) в Gemini Deep Research в браузере: цифровой двойник, этика репостов, архитектура бота, стоимость API, парсинг ссылок.

Логика экономии: тяжёлый «подумай час и напиши отчёт» — в подписке/режиме research у чат-бота; агент в IDE тратит кредиты на короткие итерации: свести отчёты, написать код, поправить баг.

Результаты легли в файлы docs/research/, сводка решений — в SYNTHESIS.md. Оттуда без сюрпризов вытекло главное:

  • MVP без RAG и fine-tune: system prompt + Style Bible + few-shot;
  • жёсткая этика: источник, не копипаст, «что пробую» — с минусами;
  • стек бота: Python, aiogram 3, SQLite, long polling, один владелец в личке;
  • черновики через OpenRouter (GPT-4.1-mini + fallback Gemini Flash), порядка доллара в месяц на десятки постов.

Цифровой двойник: экспорт Telegram без паранойи

Чтобы бот звучал как автор, а не как «вежливый корпорат», нужен был корпус реальной переписки. Взяли официальный экспорт Telegram (result.json, сотни мегабайт) — но в работу пошла не вся свалка, а белый список чатов: воркшопы Nord, лички про ИИ с коллегами, без случайного шума.

Скрипт extract_telegram_style.py отфильтровал 1018 сообщений в data/exports/selected/. Из них собрали Style Bible, профиль автора, анти-паттерны («в современном мире», канцелярит), глоссарий и первые few-shot примеры для промпта.

Важное правило для LLM: zero-trust к фактам — не выдумывать цифры и имена, пересказывать новость своими словами, в конце — строка «Источник: …», если материал чужой.

Бот-райтер: три режима и разделение «думает» / «публикует»

Бот @AdLibMe_Writer_bot — это личный редактор, не публичный чат. Работает только у владельца; в канал он ходит только по команде.

сырой материалчерновик v1 (LLM)правки текстом (LLM) → … → /publish или «В канал» → @tk_3826
публикация без LLM — в ленту уходит ровно тот текст, который вы утвердили

Три режима поста (задаются командой или контекстом):

  • signal — короткий сигнал: что случилось и зачем смотреть;
  • repost+ — новость своими словами + позиция «по мне»;
  • polygon — личный опыт с полигона: что пробовал, плюсы, минусы, кому зайдёт.

Можно кинуть текст, ссылку (опционально — вытащить через Jina Reader), ответить реплаем на пересланное. Голосовые тоже завели: расшифровка → тот же конвейер, что и с текстом.

Самообучение без переобучения модели

Fine-tune модели не поднимали — вместо этого память в промпте. Каждая правка и каждая публикация пишутся в базу событий; после «В канал» лёгкая дистилляция вытаскивает 0–3 правила в preferences.md («короче», «без списков», «вопрос в конце»).

Команда /learn … добавляет правило вручную. Эталонные посты копятся в few_shot.pending.json — чтобы потом перенести лучшие в few-shot, когда накопится практика.

Отдельно в правила постинга вписали: если уместно — один вопрос аудитории в конце (перед «Источник:»), без «ты/вы», чтобы в комментариях шла живая реакция, а не монолог в пустоту.

Деньги, кнопки, честный отчёт после поста

OpenRouter отдаёт стоимость каждого вызова. Бот считает прогон целиком: от первого черновика через все правки до дистилляции после публикации. В ответе после «Опубликовано» — две строки: «Потрачено на пост: $…» и «Баланс OpenRouter: $…» (остаток кредитов, без простыни про ключи и «потрачено за всё время»).

Внизу чата — постоянное меню: новый пост, баланс, в канал, черновик, отмена, помощь. Под черновиком — inline-кнопки. После публикации — «новый пост» и снова баланс.

Хронология в одном списке

  1. Старт
    Идея канала «для своих», brainstorm названий на разных LLM, выбор «Токенизаторная 3826», описание (лучше всего — Grok).
  2. План
    Отдельный репозиторий, ROADMAP, research-промпты → Gemini Deep Research (R-DT … R4) → SYNTHESIS.
  3. Голос
    Экспорт Telegram, whitelist чатов, 1018 сообщений → Style Bible, профиль, system prompt, few-shot.
  4. MVP
    Бриф (аудитория смешанная, без ты/вы, OpenRouter), бот aiogram: черновик → правки → publish в @tk_3826.
  5. Сейчас
    Бот крутится 24/7, самообучение, учёт стоимости прогона, вопросы аудитории, калибровка на живых постах.

Где мы сейчас

Конвейер рабочий: вы кормите бота сырьём, спорите с черновиком в личке, публикуете одной кнопкой. Канал — @tk_3826, редактор — @AdLibMe_Writer_bot.

Следующий естественный шаг — не «ещё фича ради фичи», а 10–20 реальных постов: по ним подтянуть few-shot, уточнить preferences и понять, где бот уже попадает в голос, а где ещё «пахнет ChatGPT».

Мораль истории: дорогой агент в IDE — для сборки и правок кода; тяжёлые исследования и креатив названий — в те чаты, где это дешевле и удобнее; публикация в канал — всегда за человеком, а не за моделью.