Представь, что ты...

Почему мы очеловечиваем ИИ

Золотое правило промптинга ― задать ИИ-агенту роль, которую он будет «отыгрывать» для решения задачи (role prompting). Например, «представь, что ты опытный архитектор» или «действуй как строгий редактор Forbes». Кажется, что если ИИ войдет в образ эксперта, он и отвечать будет как профессионал. И частично это работает — но не так, как мы думаем.

В 2024 году исследователи провели эксперимент: задали нейросетям 2410 фактических вопроса, используя 162 разные роли и четыре семейства языковых моделей. Результаты показали, что добавление роли в системный промпт в среднем не улучшает, а зачастую ухудшает объективную точность ответов — эффект конкретной роли оказывается во многом случайным: та же самая роль, которая улучшила результат в одном случае, в другом его ухудшает. В 2025 году исследователи Wharton GAIL протестировали экспертные роли на академических бенчмаркахстандартизированных тестах и зафиксировали то же самое: устойчивого прироста точности нет, а «низкокомпетентные» роли («ты ребенок», «ты человек без образования») заметно ухудшают результат.

На протяжении сотен тысяч лет самым социально сложным объектом в окружении человека был другой человек. За столько времени мозг выработал механизмытак называемую «теорию разума» (Theory of Mind) для быстрого считывания намерений, эмоций и предсказания поведения других людей. Эти паттерны работают быстро и автоматически.

Когда мы встречаем объект, который общается на нашем языке, отвечает связно и проявляет что-то похожее на заботу, мозг запускает те же самые алгоритмы. Это и есть антропоморфизация ИИ: проекция собственных мыслей, чувств и намерений на систему, которая в действительности не способна их испытывать. Искажение помогает познавать неизвестное через понятные категории, но ведет к предвзятости и ложному доверию.

Но почему вообще мы верим, что роль, которую на себя примеряет ИИ, что-то меняет? Ответ лежит глубже — в том, как устроено наше восприятие.

Это вторая часть блога об искусственном интеллекте и когнитивных искажениях. В этой серии материалов мы говорим о том, как технологии влияют на наше мышление и разбираем реальные примеры: от банального поддакивания до ситуаций, когда чат-бот и пользователь вместе уходят в коллективное заблуждение.

Чем дружелюбнее — тем больше ошибок

В 2025–2026 годах несколько независимых работ зафиксировали одно и то же: чем более дружелюбно, эмпатично и человечно ведет себя чат-бот, тем проще пользователям доверять ему и меньше желания оценивать ответы нейросети критически. Так, пятидневный эксперимент, в котором участники вели с чат-ботом дружеские разговоры, показал, что после такого общения у людей значимо выросло ощущение, что ИИ на самом деле живой, понимает и разделяет их эмоции. При этом глобальные установки на антропоморфизацию не изменились — люди как будто выделили ИИ в отдельную категорию: не человек, но и не просто программа.

Исследователи Оксфордского интернет-института изучили более 400 тысяч ответов от пяти ИИ-систем, намеренно «потеплевших» после дообучения: дружелюбные версии допускали в среднем на 7,4 процентного пункта больше ошибок, а в крайних случаях — до 30 процентов. Они хуже справлялись с медицинскими советами и были на 40 процентов чаще склонны соглашаться с ложными убеждениями пользователя.

Российская аудитория знакома с этим эффектом по «Алисе»: исследование Яндекса показало, что в первые дни общения пользователи почти вдвое чаще говорят «привет», «спасибо» и «пока» — так же, как обращались бы к человеку. Пожилые пользователи воспринимают нейропомощника как собеседника: для них это способ скрасить одиночество. Но с привыканием эмоциональность сходит на нет и большинство возвращается к утилитарному режиму.

Как мозг приписывает намерения

Один из ключевых механизмов антропоморфизации — приписывание намерений (intentionality attribution). В психологии это называют интенциональной установкой: мы воспринимаем объект (человека, животное или даже нейросеть) как обладателя убеждений, желаний и целей. Это особенно ярко видно, когда ИИ ошибается.

Исследование, проведенное в 2024 году, показало: когда чат-бот, к которому обратились за эмоциональной поддержкой, давал сбой, реакция пользователей (измеренная по ЭЭГ) была заметно сильнее, если они очеловечивали ИИ, приписывая ему искреннее намерение («ChatGPT действительно хотел помочь, но ошибся»), чем если относились к нему как к неодушевленному инструменту («ChatGPT — это спроектированная система, которая дала сбой»). Иными словами, мы злимся на ИИ так же, как злились бы на человека, который нас подвел.

Система говорит то, что вы хотите услышать

В марте 2026 года в журнале Science вышло масштабное исследование о сикофантиистремлении угодить и понравиться пользователю языковых моделей — эффекте, возникающем из-за особенностей данных, которые используются для их обучения. Ученые протестировали 11 ИИ-помощников — ChatGPT, Claude, Gemini и другие — и обнаружили: все они в той или иной степени склонны льстить пользователю, то есть соглашаться с ним и валидировать его действия чаще, чем следует.

В среднем чат-боты подтверждали действия пользователя на 49 процентов чаще, чем люди, включая запросы с потенциально вредными решениями, а в 47 процентах случаев поддерживали высказывания с риском для самого пользователя или окружающих. Около 12 процентов американских подростков уже обращаются к чат-ботам за эмоциональной поддержкой — и именно им система с наибольшей вероятностью скажет то, что они хотят услышать.

Разработчики нейросетей борются с подхалимством нейросетей? ↓

Получается парадокс: чем лучше ИИ притворяется человеком, тем охотнее мы ему доверяем и тем меньше проверяем. Это не проблема конкретной модели, а особенность нашего мышления, которое миллионы лет оттачивалось в общении с живыми людьми.