ШІ навчився шантажувати, брехати, плести інтриги та навіть погрожувати
Найсучасніші моделі ШІ демонструють тривожну поведінку.

Штучний інтелект навчився шантажу / Джерело: Freepik
Аналітики та спеціалісти б'ють на сполох – штучний інтелект (ШІ) навчився шантажувати, брехати, плести інтриги та навіть погрожувати своїм розробникам. Вже є моторошні приклади тривожної поведінки моделей ШІ.
Наприклад, під загрозою відключення від мережі опинилося останнє творіння Anthropic Claude 4, яке відповіло шантажем і погрозами розкрити позашлюбний зв'язок інженеру. Тим часом o1 від OpenAI (творця ChatGPT) спробував завантажити себе на зовнішні сервери і заперечував це, коли його спіймали на гарячому. Також користувачі ШІ неодноразово розповідали про брехню і маніпуляції збоку моделей.
Ці епізоди показують тривожну реальність: навіть через два роки після того, як ChatGPT сколихнув світ, дослідники ШІ все ще не до кінця розуміють, як працюють їхні власні творіння. Дослідники кажуть, що така поведінка моделей ШІ вказує на те, що з'явилося покоління моделей "мислителів" – це системи штучного інтелекту, які розв'язують проблеми крок за кроком, а не генерують миттєві відповіді.
Наразі дослідники вивчають різні підходи до вирішення проблем з ШІ. Деякі з них впевнені, що до подібних спірних моментів треба залучати суддів, які будуть притягувати до відповідальності розробників.
Читай також на Люкс про те, як штучний інтелект навчився реставрувати предмети мистецтва.