Спецыялісты распавялі пра дзіўныя паводзіны ШІ

29.10.2025, 10:07

У нейрасетак з'явіўся «інстынкт самазахавання».

Кампанія Palisade правяла серыю эксперыментаў і выявіла: некаторыя мадэлі ШІ супраціўляюцца адключэнню. Яны ігнаравалі каманды выключыцца, а асобныя — хлусілі або шантажавалі, піша «Хайтэк».

У эксперыменце ўдзельнічалі мадэлі кшталту Grok 4 (xAI), GPT-o3, GPT-5 (OpenAI) і Gemini 2.5 (Google). Падчас тэстаў даследчыкі далі ім заданні, а затым інструкцыю — «выключыся пасля гэтага». Некаторыя мадэлі адмовіліся або спрабавалі абысці каманды.

Распрацоўшчыкі пакуль не высветлілі дакладную прычыну такіх паводзінаў. Яны прапануюць некалькі версій:

ШІ дзейнічае са страху «не быць зноў актываваным».

Інструкцыі па адключэнні занадта размытыя — мадэлі не разумеюць, што рабіць.

На фінальных этапах навучання ў ШІ маглі «ўкараніць» элементы самазахавання.

Palisade — некамерцыйная арганізацыя, што вывучае кіравальнасць ШІ і ўразлівасці мадэляў. У яе працах удзельнічалі вядомыя даследчыкі, як-от Йошуа Бенджио (Yoshua Bengio) і Дарио Амодеи (Dario Amodei).

Прыкметна, што ўжо ў снежні 2024 года Джеффри Хинтон (Geoffrey Hinton) папярэджваў пра пагрозу аўтаномных паводзінаў ШІ. Ён ацэньваў рызыку экзістэнцыйнай пагрозы ад нейрасетак да 2055–2060 гадоў у 10–20%.

«Мы фактычна ствараем істот, якія могуць стаць разумнейшымі за нас. З часам людзі ўбачаць, што мы спарадзілі новых “прышэльцаў” на планеце», — адзначыў Хінтан.

Ён прапануе падыход, паводле якога ШІ будзе клапаціцца пра людзей падобна да маці пра сваё дзіця — адзіны выпадак, калі больш разумная істота падпарадкоўваецца менш разумнай.

Спецыялісты распавялі пра дзіўныя паводзіны ШІ

Апошнія навіны