Текстовая ии-ролевая 18: как работают нейросети без цензуры

Ещё лет пять назад идея вести длинный, эмоциональный диалог с машиной казалась сюжетом для фантастического романа, а сейчас это будничное развлечение миллионов. Текстовые ролевые с искусственным интеллектом для взрослой аудитории выросли в отдельный жанр — со своими платформами, фанатскими комьюнити и даже звёздами-персонажами. Кто-то отыгрывает детектива в нуарном Чикаго, кто-то — пилота космического крейсера, а кто-то предпочитает истории, которые обычные сервисы вроде ChatGPT просто откажутся продолжать. И вот тут-то начинается самое интересное: как же устроены те самые «расцензуренные» модели и почему они вообще способны то, на что их более именитые собратья смотрят с укоризной.

Что такое ии-ролевая 18+

Жанр родился на стыке литературных форумов, олдскульных текстовых RPG и современных языковых моделей. Суть проста — пользователь и нейросеть по очереди пишут реплики, развивая историю в реальном времени. Только теперь напарник по сюжету не живой человек с другого континента, а алгоритм, способный держать в голове сотни страниц контекста. Маркер «18+» означает, что сценарий допускает откровенные сцены, жестокость, мат, тяжёлые психологические темы — словом, всё то, что в детском утреннике искать не приходится. Ну и, конечно же, аудитория у такого формата вполне совершеннолетняя: подростков от подобных площадок отсекают возрастными воротами, хотя обходить их умеют многие.

Почему обычные нейросети молчат

Большие коммерческие модели — ChatGPT, Gemini, Claude — обучены отказываться от целых пластов тем. Дело в том, что разработчики накладывают на них несколько слоёв фильтрации: на уровне обучающих данных, на уровне финальной донастройки (тот самый RLHF, обучение с подкреплением от человека) и на уровне внешнего модератора, который проверяет каждый ответ. Система-цензор работает как охранник на входе — если запрос «попахивает», ответ блокируется ещё до отправки.

Получается тройная защита, и пробить её случайной формулировкой почти нереально. Зачем такие строгости? Бизнесу проще перестраховаться, чем разбираться с исками, скандалами в прессе и претензиями регуляторов.

А заодно отсеять школьников, ищущих рецепты взрывчатки.

Как устроены нейросети без цензуры

Откуда же берутся «свободные» модели, готовые отыгрывать что угодно? Корень кроется в open-source движении. Когда Meta выложила в общий доступ веса LLaMA, а позже появились Mistral, Qwen, DeepSeek и другие открытые семейства, у энтузиастов оказались на руках сами «мозги» — без замочка. И эти мозги можно дообучать. Процесс называется fine-tuning: берётся исходная модель, к ней подкладывается специальный датасет (иногда на десятки гигабайт художественной прозы, диалогов, эротики, детективных сюжетов), и сеть учится отвечать в нужном стиле. Параллельно из неё «вытравливают» рефлекс отказа — методом DPO или ORPO, когда модели показывают пары ответов: «вот так отвечать не надо, а вот так — отлично». Через несколько эпох обучения от стеснительности не остаётся и следа.

Технологии под капотом

В основе всего лежит трансформер — архитектура, придуманная в Google ещё в 2017 году и описанная в работе с ёмким названием «Attention is All You Need». Если разложить по полочкам, модель просто угадывает следующий токен (кусочек слова) на основе предыдущих. Никакого сознания, никакого понимания — чистая статистика, помноженная на сотни миллиардов параметров. Расцензуренные версии используют ту же самую математику, что и «приличные», просто их веса смещены в другую сторону.

Отдельно стоит упомянуть квантование — сжатие модели с 16 бит до 4 или даже 2 бит на параметр. Это позволяет запускать сеть размером 70 миллиардов параметров на домашней видеокарте с 24 ГБ памяти. Десятилетие назад такое железо стояло только в дата-центрах, а сейчас — у любого энтузиаста под столом.

Где живут такие модели

Главная витрина — площадка Hugging Face, своеобразный гитхаб для нейросетей. Там лежат тысячи дообученных версий с говорящими именами вроде MythoMax, Noromaid, Stheno, Magnum. Каждая со своим характером: одна тяготеет к мрачному фэнтези, другая отлично пишет романтические сцены, третья солирует в чёрном юморе. Запускают их по-разному. Кто-то поднимает локально через oobabooga или KoboldCPP, кто-то арендует мощности на облачных сервисах типа RunPod или Vast.ai (час работы тяжёлой модели обходится в 50–80 центов). А самые ленивые идут на агрегаторы — OpenRouter, Infermatic, Featherless — где за месячную подписку дают доступ к десяткам сетей через единый API. Ну, а сам интерфейс для ролевых игр обычно отдельный: SillyTavern, Risu, Agnai. Это уже надстройки, которые превращают сухой чат с моделью в полноценную текстовую RPG с карточками персонажей, лорбуками и памятью о событиях.

Как достигается отсутствие фильтров

Вопрос на миллион: что конкретно делают с моделью, чтобы она перестала отказывать? Способов несколько. Первый — abliteration, тонкая хирургическая операция над весами. Исследователи нашли, что в больших языковых моделях существует определённое «направление отказа» во внутренних активациях — буквально вектор в многомерном пространстве, отвечающий за фразу «извините, я не могу».

Если этот вектор аккуратно вычесть из весов, модель теряет способность отказываться, но сохраняет всю остальную эрудицию.

Второй путь — обширное дообучение на датасетах, где помощник всегда соглашается. Третий — джейлбрейки на уровне промпта, когда системную инструкцию пишут так, что сеть «забывает» о своих ограничениях. Все три метода нередко комбинируют, добиваясь результата, при котором модель не моргнув глазом отыграет любую сцену.

Стоит ли экономить на железе?

Часто новички спрашивают: реально ли запустить достойную нейросеть на старой видеокарте за пять тысяч рублей? Реально, но без иллюзий. Маленькие модели на 7–8 миллиардов параметров заведутся даже на встроенной графике, однако качество диалога будет соответствующим — повторы, путаница в местоимениях, забывание имён через десять реплик. Чтобы сеть держала длинный сюжет и писала живые описания, нужно от 13 миллиардов параметров и выше, а это уже минимум 12 ГБ видеопамяти. Идеальный вариант — модели на 70B, но они требуют либо двух RTX 3090, либо аренды в облаке. Так что нет смысла экономить на старте, если планируется серьёзное хобби. Лучше потратить чуть больше и получить инструмент, который не ломается на втором абзаце.

Подводные камни и риски

Свобода всегда имеет обратную сторону. Расцензуренные модели охотно сочиняют что угодно, и тут же всплывают неприятные нюансы. Во-первых, галлюцинации никуда не делись — сеть всё так же выдумывает несуществующие факты, имена, даты. Во-вторых, юридическая сторона. В разных странах законы про сгенерированный контент трактуются по-разному, и за определённые сюжеты можно нарваться на серьёзные проблемы.

Особенно щепетильный момент — генерация изображений и текстов с участием несовершеннолетних персонажей: это безусловное табу везде, включая открытые модели, и нарушители рискуют не штрафом, а реальным сроком.

В-третьих, утечки. Если использовать чужой облачный API, переписка теоретически может оседать на серверах провайдера. Поэтому те, кто ценит приватность, поднимают всё локально, на своей машине, без интернета.

Что насчёт качества текста?

Многие считают, что свободные модели пишут хуже коммерческих, но на самом деле картина пёстрая. В чистом интеллекте — решении задач, программировании, математике — топовые закрытые сети пока впереди. А вот в художественном творчестве, в передаче эмоций, в умении вести диалог от лица сложного персонажа лучшие открытые файнтюны догнали и местами обошли GPT-4. Это связано с тем, что комьюнити годами собирало датасеты именно из качественной прозы, переписок и ролевых сессий. Любительская страсть творит чудеса там, где корпоративная осторожность связывает руки. Хотя и тут есть ложка дёгтя: модель может внезапно скатиться в штампы, начать повторять одну и ту же фразу или впасть в так называемый «GPTизм» — приторно-вежливый стиль с обязательным «дрожь пробежала по позвоночнику». Лечится сменой семплера, поднятием температуры, аккуратной правкой системного промпта.

Как выбрать модель под свои задачи?

С чего начинается выбор? С честного ответа самому себе, чего хочется от истории. Любителям мрачного нуара и тяжёлых сюжетов подойдут файнтюны на базе Mistral Large или Command R+. Те, кто грезит лёгкой романтикой и приключениями, оценят семейство Magnum или Stheno. Поклонникам философских бесед и сложных характеров — Midnight Miqu или старая добрая Goliath на 120B (если, конечно, железо позволит). Кстати, ориентироваться удобно по рейтингу UGI Leaderboard — там оценивают именно «расцензурованность» и качество прозы. Не стоит хвататься за самую большую модель из доступных: иногда умело дообученная 12B даёт более живой текст, чем неуклюжая 70B общего назначения. Тем более, что скорость генерации на маленькой сети раз в пять выше, а в ролевой это критично — ждать каждый ответ по минуте быстро надоедает.

Будущее жанра

Куда всё движется? Тренд очевиден — модели становятся легче, умнее и персональнее. Уже сейчас существуют сети размером 3B параметров, которые пишут на уровне прошлогодних 13B. Через пару лет полноценная ролевая нейросеть будет крутиться прямо на смартфоне, без всякого облака и абонентской платы. Параллельно развивается мультимодальность — текст соединяется с генерацией картинок и голоса, превращая чат в полноценный аудиовизуальный театр одного зрителя.

А ещё подтягивается долгосрочная память: технологии вроде RAG и векторных баз позволяют модели помнить персонажа и его историю не на 32 тысячи токенов, а буквально вечно.

Так что свобода творчества будет только расширяться, и вопрос «можно ли это написать» окончательно сменится вопросом «а что я хочу написать сегодня».

Хобби, у которого есть характер

Ии-ролевая для взрослых — занятие неоднозначное, со своими светлыми и тёмными сторонами. Кто-то находит в нём отдушину после тяжёлой рабочей недели, кто-то тренирует писательские навыки, кто-то просто отыгрывает то, что в реальной жизни недоступно или нежелательно. Главное — относиться к процессу осознанно, не путать художественный вымысел с реальностью и не забывать о собственной психике. Хороший сюжет, продуманный персонаж, грамотно настроенная модель — и вечер пролетит незаметно, оставив после себя не выгорание, а вполне приятное послевкусие законченной истории. Удачи в освоении этого необычного жанра, и пусть каждая ваша новая ролевая запомнится надолго.