Спецыялісты распавялі пра дзіўныя паводзіны ШІ
- 29.10.2025, 10:07
У нейрасетак з'явіўся «інстынкт самазахавання».
Кампанія Palisade правяла серыю эксперыментаў і выявіла: некаторыя мадэлі ШІ супраціўляюцца адключэнню. Яны ігнаравалі каманды выключыцца, а асобныя — хлусілі або шантажавалі, піша «Хайтэк».
У эксперыменце ўдзельнічалі мадэлі кшталту Grok 4 (xAI), GPT-o3, GPT-5 (OpenAI) і Gemini 2.5 (Google). Падчас тэстаў даследчыкі далі ім заданні, а затым інструкцыю — «выключыся пасля гэтага». Некаторыя мадэлі адмовіліся або спрабавалі абысці каманды.
Распрацоўшчыкі пакуль не высветлілі дакладную прычыну такіх паводзінаў. Яны прапануюць некалькі версій:
ШІ дзейнічае са страху «не быць зноў актываваным».
Інструкцыі па адключэнні занадта размытыя — мадэлі не разумеюць, што рабіць.
На фінальных этапах навучання ў ШІ маглі «ўкараніць» элементы самазахавання.
Palisade — некамерцыйная арганізацыя, што вывучае кіравальнасць ШІ і ўразлівасці мадэляў. У яе працах удзельнічалі вядомыя даследчыкі, як-от Йошуа Бенджио (Yoshua Bengio) і Дарио Амодеи (Dario Amodei).
Прыкметна, што ўжо ў снежні 2024 года Джеффри Хинтон (Geoffrey Hinton) папярэджваў пра пагрозу аўтаномных паводзінаў ШІ. Ён ацэньваў рызыку экзістэнцыйнай пагрозы ад нейрасетак да 2055–2060 гадоў у 10–20%.
«Мы фактычна ствараем істот, якія могуць стаць разумнейшымі за нас. З часам людзі ўбачаць, што мы спарадзілі новых “прышэльцаў” на планеце», — адзначыў Хінтан.
Ён прапануе падыход, паводле якога ШІ будзе клапаціцца пра людзей падобна да маці пра сваё дзіця — адзіны выпадак, калі больш разумная істота падпарадкоўваецца менш разумнай.