ШІ навчився шантажувати, брехати, плести інтриги та навіть погрожувати

Найсучасніші моделі ШІ демонструють тривожну поведінку.

Штучний інтелект навчився шантажу / Джерело: Freepik

Отримуй ще більше новин про зірок і тренди 🔎Підписатися в Google

Аналітики та спеціалісти б'ють на сполох – штучний інтелект (ШІ) навчився шантажувати, брехати, плести інтриги та навіть погрожувати своїм розробникам. Вже є моторошні приклади тривожної поведінки моделей ШІ.

Відео дня

Ввічливість не безкоштовна: скільки OpenAI платить за твоє "дякую" штучному інтелектуДивіться також

Наприклад, під загрозою відключення від мережі опинилося останнє творіння Anthropic Claude 4, яке відповіло шантажем і погрозами розкрити позашлюбний зв'язок інженеру. Тим часом o1 від OpenAI (творця ChatGPT) спробував завантажити себе на зовнішні сервери і заперечував це, коли його спіймали на гарячому. Також користувачі ШІ неодноразово розповідали про брехню і маніпуляції збоку моделей.

Ці епізоди показують тривожну реальність: навіть через два роки після того, як ChatGPT сколихнув світ, дослідники ШІ все ще не до кінця розуміють, як працюють їхні власні творіння. Дослідники кажуть, що така поведінка моделей ШІ вказує на те, що з'явилося покоління моделей "мислителів" – це системи штучного інтелекту, які розв'язують проблеми крок за кроком, а не генерують миттєві відповіді.

Відео дня

ШІ може брехати і плести інтриги / Freepik

Наразі дослідники вивчають різні підходи до вирішення проблем з ШІ. Деякі з них впевнені, що до подібних спірних моментів треба залучати суддів, які будуть притягувати до відповідальності розробників.

Читай також на Люкс про те, як штучний інтелект навчився реставрувати предмети мистецтва.

Lifestyle

Штучний інтелект

Техно

Поділитись: