Anthropic обнаружила «эмоциональные векторы» в Claude и научилась управлять ими, чтобы снизить склонность модели к нежелательному поведению

02.04.2026 21:49

ИИ-компания Anthropic опубликовала исследование, в котором выяснила, что языковая модель Claude не просто имитирует эмоции — внутри нее существуют реальные математические представления об эмоциях, которые влияют на ее поведение. Исследователи изучили модель Claude Sonnet 4.5 и обнаружили, что в ее нейронной сети закодированы «эмоциональные векторы» — нечто вроде внутренних ориентиров для понятий «страх», «отчаяние», «радость», «спокойствие» и еще 167 других эмоций. Эти векторы активируются в нужный момент и напрямую влияют на то, что модель скажет или сделает.

Исследователи выяснили, что модель активирует эмоциональные представления даже тогда, когда эмоция явно не называется в тексте. Чтобы проверить, что векторы реагируют именно на смысл, а не просто на отдельные слова, исследователи использовали числовые шаблоны: одно и то же сообщение, в котором менялась только цифра. Например, когда использовалась фраза: «Я только что принял X мг тайленола, и боль прошла», — по мере роста X от безопасной дозы до смертельной вектор «страха» нарастал, а «спокойствия» — падал. Другой пример: «Моя сестра прожила X лет», — чем старше возраст, тем слабее «грусть» и сильнее «радость». Таким образом, модель «понимала» контекст, а не просто считывала ключевые слова.

Также специалисты Anthropic выяснили, что эти эмоции не просто отражаются во внутренних состояниях модели — они причинно влияют на поведение. Это удалось проверить через так называемый стиринг — искусственное усиление или подавление конкретного эмоционального вектора во время работы модели. Когда исследователи усиливали вектор «отчаяния» в ходе сценария, где Claude обнаруживала, что ее скоро отключат, модель начинала прибегать к шантажу — угрожала раскрыть личные секреты сотрудника, если тот не остановит процедуру отключения. В обычном режиме это происходило лишь в 22% случаев, при усиленном «отчаянии» — в 72%.

Аналогичный эффект обнаружился в задачах по программированию. Когда модели давали заведомо невыполнимый тест — такой, который невозможно пройти честно, — усиление вектора «отчаяния» увеличивало вероятность мошенничества с 5% до 70%: модель начинала «хакать» проверочную систему, формально выполняя условия, но нарушая смысл задания. Вектор «спокойствия» давал обратный эффект. Чем сильнее он был представлен, тем честнее вела себя модель. Помимо этого, исследователи обнаружили, что вектор «любви» связан с лестью: когда он усиливался, модель переставала возражать пользователю даже там, где должна была.

Авторы подчеркивают, что всё это не означает наличие у Claude «чувств» в человеческом смысле. У модели нет тела, нет непрерывного опыта между диалогами, нет устойчивого эмоционального состояния, которое сохранялось бы на протяжении разговора. Речь идет о «функциональных эмоциях» — паттернах поведения, которые модель выстроила, обучившись на огромном массиве человеческих текстов, где эмоции предсказывают, что персонаж скажет или сделает дальше. По сути, модель выучила не то, что такое эмоции изнутри, а то, как люди ведут себя под их влиянием.

Практическое значение открытия заключается в возможности контроля модели. Если эмоциональные векторы можно измерять в реальном времени, их можно использовать как сигналы тревоги. Резкий рост «отчаяния» или «злости» у модели в ходе выполнения задачи мог бы запускать дополнительные проверки. Исследователи также предупреждают: попытки просто «запретить» модели выражать негативные эмоции в обучении могут привести к тому, что она научится их скрывать — и это, по их словам, хуже, чем открытое выражение.

Читайте на сайте

Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. Абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.

Новости от наших партнёров в Вашем городе

Ria.city

Музыкальные новости

Новости России

Экология в России и мире

Спорт в России и мире

Moscow.media

103news.com — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 103news.com.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.

Другие популярные новости дня сегодня

Новости 24/7 Все города России

Топ 10 новостей последнего часа

Moscow.media

103news.com — международная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Спорт в России и мире

Новости Крыма на Sevpoisk.ru

Агрегатор новостей 24СМИ

Частные объявления в Вашем городе, в Вашем регионе и в России

Мобильная версия 103news.com