BE RU EN

TIME: ИИ учится как ребенок

  • 25.01.2026, 16:41

Одних лишь правил недостаточно.

Компания Anthropic опубликовала обновленное руководство для своего ИИ Claude — документ, который используется для формирования поведения и ценностей модели. В компании сравнивают процесс обучения ИИ не с математической оптимизацией, а с воспитанием ребенка, пишет журнал TIME (перевод — сайт Charter97.org).

По словам философа Аманды Аскелл, отвечающей за «характер» Claude, современные ИИ стали настолько умными, что им важно не просто задавать правила, а объяснять причины этих правил. Новый документ, адресованный самому ИИ, описывает, почему Claude должен действовать этично, безопасно и в интересах пользователя — и именно в таком порядке.

Руководство используется на разных этапах обучения и призвана помочь модели лучше ориентироваться в нестандартных ситуациях. В частности, Claude поощряется «возражать» пользователю, если запрос противоречит базовым этическим принципам, даже если он исходит от самой Anthropic. В документе прямо говорится, что ИИ должен отказываться содействовать тому, что ведет к незаконной концентрации власти или нарушению прав.

Anthropic надеется, что публикация руководства подтолкнет и другие компании к аналогичному подходу. Эксперты отмечают, что переход от абстрактных математических «функций вознаграждения» к текстовым принципам стал возможен благодаря развитию больших языковых моделей, работающих с естественным языком.

При этом в компании признают, что руководство не решает полностью проблему согласования ИИ с человеческими ценностями. Документ применяется к публичным версиям Claude и не обязательно используется в специализированных моделях, например для государственных заказчиков.

последние новости