Поддержать команду Зеркала
Беларусы на войне
  1. На крупных заводах тысячи вакансий. Какие зарплаты предлагают
  2. Преуменьшил угрозу, преувеличил успехи, косвенно угрожал: эксперты проанализировали выступление Путина на заседании клуба «Валдай»
  3. Стало известно, почему бизнесмен Александр Мошенский, попавший под санкции Польши, покинул свою «почетную» должность
  4. Если власти освободят Марию Колесникову, не поступит ли она так же, как Николай Статкевич? Спросили об этом ее сестру
  5. Внезапно умер один из начальников брестской милиции, который снимался в пропагандистском фильме о протестах 2010 года
  6. «Перестало хватать ресурса». Беларусы заметили резкое ухудшение мобильной связи — им ответили в министерстве
  7. История, подобная случившемуся с матерью Екатерины Водоносовой, может коснуться многих. Как действовать в такой ситуации — советует юрист
  8. Экс-звезда хоккейного минского «Динамо» арестован в Финляндии по подозрению в тяжком наркопреступлении
  9. «Дело лифтера». В Могилеве задержан серийный убийца девочек и женщин, который скрывался больше 20 лет
  10. «Серый кардинал» демсил из, пожалуй, самой известной политической династии Беларуси. Вспоминаем историю Франака Вячорки
  11. Чиновники придумали, как бороться с «тунеядцами» — наказывают их рублем (и это не коммуналка по повышенным тарифам)
  12. Чиновники продолжают «отжимать» недвижимость у уехавших за границу — очередной пример


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.