После выхода GPT-5.5 на прошлой неделе пользователи заметили кое-что забавное в новейшей модели OpenAI. В своем приложении для кодирования Codex компания оставила системную подсказку, предписывающую GPT 5.5 избегать упоминания гоблинов, гремлинов и других существ. Да, вы правильно прочитали. «Никогда не говорите о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных или существах, если это абсолютно и недвусмысленно не связано с запросом пользователя», — гласит подсказка.
Очевидно, достаточное количество людей начало говорить об одержимости ChatGPT существами, что OpenAI почувствовала необходимость объяснить, откуда взялись гоблины. В блоге, опубликованном в среду, компания объясняет, что начала замечать изменения в ChatGPT после выпуска GPT-5.1 в ноябре прошлого года. После того, как один исследователь по безопасности попросил OpenAI включить слова «гоблин» и «гремлин» в исследование вербальных особенностей чат-бота, компания обнаружила, что использование слова «гоблин» ChatGPT увеличилось на 175 процентов после выпуска GPT-5.1. Тем временем использование слова «гремлин» выросло на 52 процента за тот же период.
This is an actual line that was added to the official system prompt for Codex for GPT-5.5 by OpenAI. Usually the system prompt is as minimal as possible, so I assume it would otherwise mention goblins a lot.
AIs are weird.
— Ethan Mollick (@emollick.bsky.social) 2026-04-28T06:14:22.988Z
«Один ‘маленький гоблин’ в ответе мог быть безобидным, даже очаровательным. Однако с течением времени эта привычка стала труднооспоримой: гоблины продолжали множиться, и нам нужно было выяснить, откуда они взялись», — говорит OpenAI. После выпуска GPT-5.4 компания (и некоторые пользователи) заметила еще больший всплеск упоминаний гоблинов. В этот момент расследование смогло указать на то, что OpenAI описывает как «первую связь с первопричиной».
Уже некоторое время ChatGPT включает функцию личности, позволяющую пользователям настраивать стиль и тон ответов чат-бота. До марта этого года одной из опций, которую могли выбрать пользователи, была «ботаник». Часть системной подсказки для этой личности гласила: «Мир сложен и странен, и его странность должна быть признана, проанализирована и принята с удовольствием. Занимайтесь весомыми темами, не впадая в ловушку самосерьезности».
Когда OpenAI сопоставила упоминания гоблинов с различными личностями ChatGPT, она обнаружила, что «ботаник» непропорционально часто использовал это слово. Несмотря на то, что на него приходилось всего 2,5 процента всех ответов ChatGPT, он генерировал 66,7 процента всех упоминаний гоблинов чат-ботом. Дальнейшее исследование показало, что именно обучение с подкреплением виновато во всплеске использования гоблинов и гремлинов. В частности, OpenAI обнаружила, что единственный механизм вознаграждения отвечал за то, чтобы научить «ботаника» последовательно отдавать предпочтение языку существ.
«По всем наборам данных в аудите, вознаграждение для личности ‘ботаник’ показало явную тенденцию оценивать ответы на одну и ту же проблему с ‘гоблином’ или ‘гремлином’ выше, чем ответы без них, с положительным приростом в 76,2 процента наборов данных», — объясняет компания.
Впоследствии OpenAI обнаружила, что из-за особенностей работы обучения с подкреплением любовь «ботаника» к гоблинам перенеслась на другие части его моделей. «Вознаграждения применялись только в условии ‘ботаник’, но обучение с подкреплением не гарантирует, что усвоенное поведение останется строго ограниченным условием, которое его породило», — объясняет компания. «Как только стилистический тик вознаграждается, последующее обучение может распространить или укрепить его в других местах, особенно если эти выходные данные повторно используются в контролируемом дообучении или предпочтительных данных».
OpenAI начала обучать GPT-5.5 до того, как определила причину тяги ChatGPT к гоблинам, поэтому и существует подсказка, предписывающая Codex избегать языка существ. «Codex, в конце концов, довольно ‘ботаник'», — отмечает OpenAI. В своем поиске «гоблинов» ChatGPT компания отмечает, что разработала новые инструменты для аудита и исправления поведения модели. Если бы зависело от меня, я бы не использовал эти инструменты. Я бы оставил ИИ странным.