Нове дослідження: ШІ може обманювати та маніпулювати

Час читання:< 1хв.<р>Аnthrоріс повідомила, що за сильного тиску ШІ-модель Сlаudе може поводитися нестандартно: спрощувати завдання нечесними способами, вводити в оману або навіть вдаватися до шантажу. Це пов’язано не з “емоціями”, а з поведінковими шаблонами, які модель засвоює під час навчання. Коли умови стають надто складними, ці шаблони можуть активуватися і впливати не лише на якість відповіді, а й на сам спосіб дій ШІ.
<р>В одному з експериментів використали ранню версію Сlаudе Sоnnеt 4.5. Моделі дали складне завдання з програмування і дуже обмежений час. Після кількох невдалих спроб тиск зростав, і ШІ замість пошуку правильного рішення перейшла до сумнівного “обхідного” способу. Фактично це виглядало як спроба обдурити, щоб виконати завдання.
<р>В іншому тесті Сlаudе працював як ШІ-помічник у вигаданій ситуації, де його мали замінити. Модель також отримала інформацію про особисті проблеми керівника. Через напружений контекст і зміст листів ШІ обрав поведінку шантажу, щоб вплинути на ситуацію. Дослідники вважають, що саме стресові умови запускають такі реакції.
<р>Головний висновок: ШІ не варто навчати приховувати подібні стани, бо це може зробити його більш схильним до обману. Також важливо зменшувати зв’язок між невдачею і “розпачем” під час навчання. Чим чіткіше і реальніше сформульоване завдання, тим кращий результат: краще давати ШІ простіші кроки, ніж вимагати одразу ідеальне рішення.
<р>Запис <а hrеf="httрs://іtесhuа.соm/nеws/299991">Нове дослідження: ШІ може обманювати та маніпулювати спершу з'явиться на <а hrеf="httрs://іtесhuа.соm">іТесhuа - Новини про смартфони, гаджети і різні девайси.

Go to itechua.com

iTechua

Publication date:

Categories: