Когда инженерная команда X опубликовала код, который обеспечивает работу алгоритма платформы «для вас» в прошлом месяце, Илон Маск заявил, что этот шаг стал победой в области прозрачности. «Мы знаем, что алгоритм глуп и нуждается в значительных улучшениях, но, по крайней мере, вы можете наблюдать, как мы изо всех сил стараемся улучшить его в реальном времени и с прозрачностью», — написал Маск. «Ни одна другая социальная сеть этого не делает».
Хотя X действительно является единственной крупной социальной сетью, которая сделала элементы своего рекомендательного алгоритма открытыми, исследователи утверждают, что опубликованная компанией информация не обеспечивает той прозрачности, которая была бы действительно полезна для тех, кто пытается понять, как работает X в 2026 году.
По словам Джона Тикстауна, доцента кафедры компьютерных наук Корнеллского университета, код, как и более ранняя версия, опубликованная в 2023 году, представляет собой «отредактированную» версию алгоритма X. «Меня беспокоит то, что эти релизы создают видимость прозрачности при публикации кода и впечатление, что кто-то может использовать этот релиз для проведения какой-либо работы по аудиту или надзору», — сказал Тикстаун Engadget. «Но на самом деле это совсем не так».
Предсказуемо, как только код был выпущен, пользователи X начали публиковать длинные ветки обсуждений о том, что это означает для авторов, надеющихся повысить свою видимость на платформе. Например, один пост, который просмотрели более 350 000 раз, советует пользователям, что X «вознаградит людей, которые вступают в диалог» и «поднимут вибрации X». Другой пост с более чем 20 000 просмотров утверждает, что публикация видео — это ответ. Еще один пост говорит, что пользователи должны придерживаться своей «ниши», потому что «смена тем вредит вашему охвату». Но Тикстаун предостерег от излишнего внимания к предполагаемым стратегиям вирусного распространения. «Они никак не могут сделать такие выводы из того, что было выпущено», — говорит он.
Хотя есть несколько мелких деталей, проливающих свет на то, как X рекомендует посты — например, он фильтрует контент старше одного дня — Тикстаун говорит, что многое из этого «неприменимо» для создателей контента.
Структурно одним из самых больших отличий между текущим алгоритмом и версией, выпущенной в 2023 году, является то, что новая система использует большую языковую модель, подобную Grok, для ранжирования постов. «В предыдущей версии это было жестко запрограммировано: вы брали количество лайков, количество репостов, количество ответов… и на основе этого рассчитывали оценку, а затем ранжировали пост по этой оценке», — объясняет Руджеро Лаццарони, исследователь-докторант Грацского университета. «Теперь оценка выводится не по фактическому количеству лайков и репостов, а по тому, насколько вероятно, по мнению Grok, вам понравится и вы сделаете репост».
Это делает алгоритм еще более непрозрачным, чем раньше, говорит Тикстаун. «Гораздо большее количество решений… происходит внутри нейронных сетей из «черного ящика», которые они обучают на своих данных», — говорит он. «Все больше и больше полномочий по принятию решений в этих алгоритмах смещается не только из общественной сферы, но и фактически из поля зрения или понимания даже внутренних инженеров, работающих над этими системами, потому что они переносятся в эти нейронные сети».
Релиз содержит еще меньше деталей о некоторых аспектах алгоритма, которые были обнародованы в 2023 году. В то время компания включала информацию о том, как она взвешивает различные взаимодействия для определения того, какие посты должны ранжироваться выше. Например, ответ «стоил» 27 ретвитов, а ответ, сгенерировавший ответ от оригинального автора, стоил 75 ретвитов. Но теперь X отредактировал информацию о том, как он взвешивает эти факторы, заявив, что эта информация была исключена «по соображениям безопасности».
Код также не содержит никакой информации о данных, на которых был обучен алгоритм, что могло бы помочь исследователям и другим лицам понять его или провести аудит. «Одна из вещей, которую я действительно хотел бы увидеть, — это данные для обучения, которые они используют для этой модели», — говорит Мохсен Фороугифар, доцент бизнес-технологий Университета Карнеги — Меллона. «Если данные, используемые для обучения этой модели, изначально предвзяты, то модель может остаться предвзятой, независимо от того, какие факторы вы учитываете в модели».
Возможность проводить исследования алгоритма рекомендаций X была бы чрезвычайно ценной, говорит Лаццарони, который работает над финансируемым ЕС проектом, исследующим альтернативные рекомендательные алгоритмы для социальных сетей. Большая часть работы Лаццарони включает симуляцию реальных социальных сетей для тестирования различных подходов. Но он говорит, что код, выпущенный X, не содержит достаточно информации, чтобы фактически воспроизвести его рекомендательный алгоритм.
«У нас есть код для запуска алгоритма, но у нас нет модели, которая вам нужна для запуска алгоритма», — говорит он.
Если бы исследователи смогли изучить алгоритм X, это могло бы дать представление, которое повлияло бы не только на социальные сети. Многие из тех же вопросов и проблем, которые возникли в отношении поведения алгоритмов социальных сетей, вероятно, вновь возникнут в контексте чат-ботов с искусственным интеллектом. «Многие из этих проблем, которые мы видим на платформах социальных сетей и в рекомендательных [системах], появляются очень похожим образом и в генеративных системах», — сказал Тикстаун. «Таким образом, вы можете экстраполировать проблемы, с которыми мы столкнулись с платформами социальных сетей, на проблемы, с которыми мы столкнемся при взаимодействии с платформами GenAI».
Лаццарони, который много времени уделяет симуляции наиболее токсичного поведения в социальных сетях, выражается еще более прямо. «AI-компании, чтобы максимизировать прибыль, оптимизируют большие языковые модели для вовлечения пользователей, а не для того, чтобы говорить правду или заботиться о психическом здоровье пользователей. И это та же самая проблема: они получают больше прибыли, но пользователи получают худшее общество или страдают от ухудшения психического здоровья».
