Почему мы очеловечиваем ИИ
Мнение редакции может не совпадать с мнением автора
Золотое правило промптинга ― задать ИИ-агенту роль, которую он будет «отыгрывать» для решения задачи (role prompting). Например, «представь, что ты опытный архитектор» или «действуй как строгий редактор Forbes». Кажется, что если ИИ войдет в образ эксперта, он и отвечать будет как профессионал. И частично это работает — но не так, как мы думаем.
В 2024 году исследователи провели эксперимент: задали нейросетям 2410 фактических вопроса, используя 162 разные роли и четыре семейства языковых моделей. Результаты показали, что добавление роли в системный промпт в среднем не улучшает, а зачастую ухудшает объективную точность ответов — эффект конкретной роли оказывается во многом случайным: та же самая роль, которая улучшила результат в одном случае, в другом его ухудшает. В 2025 году исследователи Wharton GAIL протестировали экспертные роли на академических стандартизированных тестах
На протяжении сотен тысяч лет самым социально сложным объектом в окружении человека был другой человек. За столько времени мозг выработал так называемую «теорию разума» (Theory of Mind)
Когда мы встречаем объект, который общается на нашем языке, отвечает связно и проявляет что-то похожее на заботу, мозг запускает те же самые алгоритмы. Это и есть антропоморфизация ИИ: проекция собственных мыслей, чувств и намерений на систему, которая в действительности не способна их испытывать. Искажение помогает познавать неизвестное через понятные категории, но ведет к предвзятости и ложному доверию.
Но почему вообще мы верим, что роль, которую на себя примеряет ИИ, что-то меняет? Ответ лежит глубже — в том, как устроено наше восприятие.
Это вторая часть блога об искусственном интеллекте и когнитивных искажениях. В этой серии материалов мы говорим о том, как технологии влияют на наше мышление и разбираем реальные примеры: от банального поддакивания до ситуаций, когда чат-бот и пользователь вместе уходят в коллективное заблуждение.
В 2025–2026 годах несколько независимых работ зафиксировали одно и то же: чем более дружелюбно, эмпатично и человечно ведет себя чат-бот, тем проще пользователям доверять ему и меньше желания оценивать ответы нейросети критически. Так, пятидневный эксперимент, в котором участники вели с чат-ботом дружеские разговоры, показал, что после такого общения у людей значимо выросло ощущение, что ИИ на самом деле живой, понимает и разделяет их эмоции. При этом глобальные установки на антропоморфизацию не изменились — люди как будто выделили ИИ в отдельную категорию: не человек, но и не просто программа.
Исследователи Оксфордского интернет-института изучили более 400 тысяч ответов от пяти ИИ-систем, намеренно «потеплевших» после дообучения: дружелюбные версии допускали в среднем на 7,4 процентного пункта больше ошибок, а в крайних случаях — до 30 процентов. Они хуже справлялись с медицинскими советами и были на 40 процентов чаще склонны соглашаться с ложными убеждениями пользователя.
Российская аудитория знакома с этим эффектом по «Алисе»: исследование Яндекса показало, что в первые дни общения пользователи почти вдвое чаще говорят «привет», «спасибо» и «пока» — так же, как обращались бы к человеку. Пожилые пользователи воспринимают нейропомощника как собеседника: для них это способ скрасить одиночество. Но с привыканием эмоциональность сходит на нет и большинство возвращается к утилитарному режиму.
Один из ключевых механизмов антропоморфизации — приписывание намерений (intentionality attribution). В психологии это называют интенциональной установкой: мы воспринимаем объект (человека, животное или даже нейросеть) как обладателя убеждений, желаний и целей. Это особенно ярко видно, когда ИИ ошибается.
Исследование, проведенное в 2024 году, показало: когда чат-бот, к которому обратились за эмоциональной поддержкой, давал сбой, реакция пользователей (измеренная по ЭЭГ) была заметно сильнее, если они очеловечивали ИИ, приписывая ему искреннее намерение («ChatGPT действительно хотел помочь, но ошибся»), чем если относились к нему как к неодушевленному инструменту («ChatGPT — это спроектированная система, которая дала сбой»). Иными словами, мы злимся на ИИ так же, как злились бы на человека, который нас подвел.
В марте 2026 года в журнале Science вышло масштабное исследование о стремлении угодить и понравиться пользователю
В среднем чат-боты подтверждали действия пользователя на 49 процентов чаще, чем люди, включая запросы с потенциально вредными решениями, а в 47 процентах случаев поддерживали высказывания с риском для самого пользователя или окружающих. Около 12 процентов американских подростков уже обращаются к чат-ботам за эмоциональной поддержкой — и именно им система с наибольшей вероятностью скажет то, что они хотят услышать.
Получается парадокс: чем лучше ИИ притворяется человеком, тем охотнее мы ему доверяем и тем меньше проверяем. Это не проблема конкретной модели, а особенность нашего мышления, которое миллионы лет оттачивалось в общении с живыми людьми.