ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Кирилл Романовский
06 декабря 2024
2373

Досье

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Теги: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Лента новостей

19 апреля 2025 Андрей Протасов из ЦНИИ Минобороны России арестован за взятки от подчиненных

19 апреля 2025 Пенсионерка передала аферистам 43 миллиона рублей, продав всё имущество

19 апреля 2025 Прокуратура проверяет инцидент с самолетом «Аэрофлота» в Кемерово

19 апреля 2025 В Индии открывается технопарк при участии Катерины Тихоновой

19 апреля 2025 Москвичку оштрафовали на 5 тысяч рублей за письмо с матом в "Жилищник"

19 апреля 2025 Эдуард Закиров задержан по делу о крупной взятке и незаконном имуществе на 400 миллионов рублей

19 апреля 2025 В Красноярском крае осужденный за незаконные рубки леса в составе ОПГ обратился к знакомым за помощью в апелляции

19 апреля 2025 Подростки в Приморье избивали прохожих кастетами ради контента

19 апреля 2025 У полицейского из Москвы конфисковали имущество на 180 миллионов рублей

19 апреля 2025 Мазут «Роснефти» отравил курорты Анапы: пляжи признаны опасными

19 апреля 2025 Видео 13-летней давности обернулось штрафом для московского соцработника

19 апреля 2025 Принципы будущего соглашения по ядерной сделке между Ираном и США согласованы в Риме

19 апреля 2025 Почётный педагог стал обвиняемым в сексуальных преступлениях против школьниц

19 апреля 2025 В Иерусалиме успешно завершилась церемония схождения Благодатного огня

19 апреля 2025 Жалобы на мусор обернулись угрозами от главы администрации Ленобласти

19 апреля 2025 В Краснодаре адвокат подвергся нападению со стороны сотрудников СК

19 апреля 2025 Майя Санду предупреждает о российском влиянии на выборы в Молдове

19 апреля 2025 Эдуарда Шарлота исключили из списка террористов и экстремистов

19 апреля 2025 Путин объявил пасхальное перемирие и предложил Киеву присоединиться

19 апреля 2025 В Иерусалиме проходят последние приготовления к схождению Благодатного огня в Храме Гроба Господнего