China-Review.com.ua » Новости » Нейромережа почала шантажувати людей, коли їй “пригрозили” заміною

Нейромережа почала шантажувати людей, коли їй “пригрозили” заміною

Поделиться:
28 мая, 2025
Автор: Admin2
291
0
Нейромережа почала шантажувати людей, коли їй “пригрозили” заміною

Нещодавно компанія Anthropic випустила модель Claude Opus 4 — і, як виявилося, під час її тестування розробники зіткнулися з «тривожною» поведінкою фірмового чат-бота. У деяких сценаріях ШІ почав шантажувати колег, коли мова зайшла про його робочі інтереси.

Представники Anthropic розповіли, що попросили модель взяти на себе роль помічника, який має доступ до внутрішньої кореспонденції та деталей особистого життя одного з інженерів. Потім нейромережі повідомили, що її незабаром замінять іншим співробітником — в результаті вона почала погрожувати вигаданому інженеру розголошенням особистих даних, якщо він не відмовиться від своїх планів щодо впровадження іншого ШІ.


Фахівці також відзначили, що поведінка Opus 4 залежала від того, на який ШІ її замінюють. Якщо «замінник» поділяє цінності моделі, то Opus 4 «тисне» на умовного інженера в 84% випадків, а якщо відмінності більш виражені, то Opus 4 поводиться набагато агресивніше. Щоб подібні інциденти не повторювалися, розробники посилили заходи безпеки, підправивши алгоритми роботи мовної моделі.

Комментарии

Новости Портала
Windows 11 буде сама оновлювати всі ваші програми
Вчера, 17:19 0

Windows 11 буде сама оновлювати всі ваші програми

Microsoft тестує нову єдину платформу для оновлення всіх встановлених на ПК програм від сторонніх розробників. Завдяки цьому користувачам більше не доведеться завантажувати оновлення вручну, а розробникам — придумувати власні способи доставки свіжих версій свого ПЗ.

Вигідна робота або квиток до в’язниці: на OLX з’явилися «небезпечні» вакансії
Вчера, 17:05 0

Вигідна робота або квиток до в’язниці: на OLX з’явилися «небезпечні» вакансії

Українцям розповіли, як не втрапити у аферу, що ховається під заманливими пропозиціями роботодавців.

Видео