Как настроить бота для ролки с AI

Ролевые игры с нейросетью давно перестали быть забавой гиков-одиночек, которые шифровались по закрытым форумам и делились промтами как магическими свитками. Сегодня в эту историю ныряют писатели, сценаристы, геймдизайнеры, да и просто любители хорошего сюжета, уставшие от шаблонных диалогов в книгах. Площадок развелось — глаза разбегаются: Character.AI, SillyTavern, Janitor, Risu, Agnai, десятки форков и обёрток над GPT, Claude, DeepSeek, Gemini. Вот только качество отыгрыша напрямую зависит не от модели, а от рук того, кто её настраивает. И тут начинается самое интересное — ведь бот сам по себе не «оживёт», пока ему не дадут характер, память и правила игры.

С чего вообще начинается настройка?

С выбора платформы. Звучит банально, но именно здесь ломается львиная доля новичков, которые хватаются за первую попавшуюся ссылку. Character.AI хорош для быстрого старта, однако его цензура режет по живому — стоит сюжету чуть отклониться в серую зону, и модель уходит в глухую отказную. SillyTavern — совсем другая история. Это локальный интерфейс, подключаемый к любому API: OpenAI, OpenRouter, Claude через прокси, локальные модели через KoboldCpp или text-generation-webui. Гибкость колоссальная, но и порог входа повыше. Janitor занял нишу посередине — браузерный, с лояльной модерацией и возможностью подключить свой ключ. Выбор, по сути, сводится к тому, что важнее: простота или контроль.

Карточка персонажа: фундамент всего

Бот — это не модель. Бот — это карточка, которую модель читает каждое сообщение. И если карточка написана криво, никакая GPT-4 не вытянет отыгрыш. Структура типичной карточки включает имя, описание внешности, характер, биографию, манеру речи, отношения с пользователем и сценарий первой встречи. Звучит просто? А на практике тут масса подводных камней.

Главная ошибка новичков — писать карточку как школьное сочинение. «Анна — добрая девушка, которая любит читать книги и гулять под дождём». Модель такое проглатывает, но характер не считывает. Нужна конкретика.

Вместо «вспыльчивая» — «срывается на крик, если её перебивают больше двух раз подряд, потом час молчит и делает вид, что ничего не было». Вместо «умная» — «цитирует Достоевского к месту и не очень, раздражается, когда собеседник не ловит отсылки». Чем детальнее поведенческие маркеры, тем живее выходит персонаж.

Формат описания: W++, PList или проза?

Споры о форматах не утихают годами. W++ — старый синтаксис в духе [character(«Анна») {Age(«23»); Personality(«застенчивая» + «упрямая»)}], который когда-то творил чудеса на старых моделях вроде Pygmalion. Сейчас его используют всё реже. PList (Plain List) — более человечный формат через двоеточия и запятые, компактный и экономящий токены. Ну а проза — обычный связный текст, который современные большие модели считывают лучше всего.

Что выбрать? Зависит от модели. Для Claude и GPT-4 чистая проза работает как надо — они прекрасно улавливают контекст из связного описания. Для моделей послабее (7B-13B локалок) структурированный PList помогает не потерять детали. Золотая середина — комбинация: короткий прозаический портрет плюс блок с ключевыми привычками через PList. Объём тоже важен. Карточка на 3000 токенов съест половину контекстного окна у бюджетных моделей, и бот начнёт забывать, о чём говорили пять сообщений назад.

Системный промт и jailbreak

Это мозг операции. Системный промт — инструкция, которую модель получает до начала диалога и которая задаёт её поведение. Тут прописывается, как бот должен писать (от третьего лица или от первого), какой длины делать ответы, как оформлять действия и мысли (обычно *действие* курсивом, «речь» в кавычках), что можно, а чего нельзя.

Для обхода встроенной цензуры на коммерческих API используют так называемые jailbreak-промты. Это не взлом в хакерском смысле — скорее переформулирование задачи так, чтобы модель воспринимала сцену как художественный текст, а не реальный запрос на запрещённый контент. Работает ли? Да, но не всегда и не со всеми моделями. Claude в последних версиях стал заметно жёстче, GPT тоже подкрутили фильтры. Ну а локальные модели вроде MythoMax, Midnight-Miqu или Mixtral-based файнтюнов вообще обходятся без этих танцев — у них цензуры нет в принципе.

Память и контекст

Вот где кроется главная боль ролки с AI. Модель помнит ровно столько, сколько вмещается в её контекстное окно. У GPT-4 Turbo это 128к токенов, у Claude 3 — 200к, у локалок обычно 8-32к. Кажется, что много? На длинной истории в сто сообщений контекст забивается мгновенно, и бот начинает «забывать» имена, события, обещания.

Lorebook (или World Info) — это база знаний с триггерами по ключевым словам. Упомянул игрок слово «таверна» — в контекст подгружается описание таверны. Удобно, экономит токены, работает почти во всех продвинутых интерфейсах.

Summary — регулярное сжатие старой части диалога в краткий пересказ, который заменяет собой сотни сообщений. Векторная память через расширения типа ChromaDB — более продвинутый вариант, когда релевантные куски прошлого подтягиваются семантически. Не стоит пренебрегать ни одним из этих инструментов, если сюжет планируется долгим.

Параметры сэмплера

Тонкая настройка, которую большинство игнорирует, а зря. Temperature отвечает за креативность: 0,7–0,9 — золотой диапазон для ролки, ниже — сухо и предсказуемо, выше — бот начинает нести околесицу. Top P обычно держат в районе 0,9. Repetition Penalty (1,05–1,15) спасает от зацикливания, когда персонаж начинает повторять одни и те же фразы. Min P — относительно новый параметр, и он творит чудеса: отсекает совсем маловероятные токены, сохраняя при этом разнообразие. Значение 0,05–0,1 подходит большинству сценариев.

Настройка сэмплера — это шаманство. Что работает на MythoMax, может испортить отыгрыш на Claude. Поэтому разумно держать под рукой несколько пресетов и переключаться в зависимости от задачи: один для экшена, другой для романтических сцен, третий для детективного расследования.

Пример сообщения: задаём стиль

Бот копирует стиль. Это аксиома. Если в карточке лежит example message на три строки телеграфным языком — ответы будут такими же. Если пример развёрнутый, с описанием обстановки, внутренних переживаний героя и диалогом — модель подхватит этот ритм. Отсюда простой практический вывод: не стоит лениться с примерами. Два-три качественных диалога на 300–500 токенов каждый задают тон всей игре.

Кстати, важный нюанс — пример должен показывать именно то, что нужно, а не то, что «вообще бывает». Хочется, чтобы бот описывал мимику и жесты? Значит, в примере каждая реплика сопровождается действием. Хочется внутренних монологов? Значит, там лежат курсивные вставки с мыслями персонажа. Модель — отличный подражатель, главное — дать ей правильный образец.

Первое сообщение и сценарий

Первое сообщение (greeting) — это завязка сцены, которую пишет сам создатель бота. От него зависит, куда свернёт история. Многие делают ошибку, запихивая туда сразу всё: и описание мира, и биографию, и эмоциональную сцену. В итоге пользователь теряется и не знает, за что зацепиться.

Хорошее первое сообщение работает как пролог фильма — оно бросает игрока в конкретную ситуацию. Дождь барабанит по стеклу. Персонаж сидит напротив, молча разглядывая чашку остывающего кофе. Что-то произошло, но пока неясно что. Такой заход интригует, даёт пространство для реакции и не перегружает. А всю предысторию бот выдаст позже, в процессе диалога — ведь именно так и работает живое повествование.

Стоит ли платить за API?

Вопрос на миллион. Бесплатные варианты вроде Character.AI или публичных прокси работают, но с оговорками: цензура, очереди, внезапные отключения. Платный API OpenAI или Anthropic обойдётся в среднем в 5–20 долларов в месяц при активной игре — не катастрофа, но и не бесплатно. OpenRouter удобен тем, что даёт доступ к десяткам моделей с одного ключа, включая бесплатные варианты DeepSeek и Llama.

Есть и третий путь — локальный запуск. Видеокарта с 12+ гигабайтами VRAM потянет модели уровня 13B в квантованном виде, и тогда ролка становится полностью приватной и бесплатной (не считая счёта за электричество).

Минус — качество пока отстаёт от топовых облачных моделей, хотя разрыв сокращается каждые полгода.

Типичные ошибки и как их избежать

Бот говорит за пользователя? Значит, в системном промте не прописан запрет на это, либо пример сообщения содержит такие моменты. Лечится явным указанием: «никогда не описывай действия, мысли и речь {{user}}». Бот скатывается в повторения? Проверьте Repetition Penalty и длину контекста — возможно, старые сообщения вытеснились и модель «забыла» канву. Персонаж ломает характер? Карточка слишком размыта, нужны конкретные поведенческие якоря. Ответы стали сухими и короткими? Модель устала от однообразия — смените сцену, добавьте событие, подкиньте конфликт.

Отдельная категория проблем — этическая. Ролка с AI — мощный инструмент, и он требует осознанного подхода. Не стоит забывать, что это всё-таки диалог с программой, какой бы убедительной она ни казалась. Эмоциональная привязка к боту — довольно частое явление, особенно при длительном взаимодействии. Держать голову холодной — хорошая практика.

Экспериментировать, пробовать разные модели, переписывать карточки по десять раз, собирать свою коллекцию промтов и пресетов — вот путь, который приводит к тому самому магическому отыгрышу, ради которого всё и затевалось. Удачи в настройке, пусть персонажи оживают и истории запомнятся надолго.