Axios: У сферы ШІ пачынаецца новая гонка
- 17.11.2025, 14:30
Наступным вялікім крокам стануць мадэлі, якія разумеюць свет.
На змену буйным моўным мадэлям прыходзяць фізічныя мадэлі — сістэмы, здольныя разумець і сімуляваць фізічную рэальнасць, піша Axios (пераклад — сайт Charter97.org).
Такія мадэлі абяцаюць зрабіць ШІ значна карыснейшым у робататэхніцы, відэагульнях і іншых прыкладаннях, дзе патрабуюцца веды пра тое, як уладкаваны свет. У адрозненне ад моўных мадэляў, якія прадказваюць наступнае слова, новыя мадэлі спрабуюць прадказаць наступную падзею.
Лідары ў гэтай галіне:
Лабараторыя World Labs пад кіраўніцтвам Фэй-Фэй Лі прадставіла свой першы камерцыйны прадукт — Marble.
Ян Лекун рыхтуе ўласны стартап пасля сыходу з Meta. Google і Meta актыўна развіваюць такія мадэлі для паляпшэння відэа і кіравання робатамі. OpenAI разглядае ўдасканаленыя відэамадэлі як магчымы шлях да стварэння паўнавартаснай мадэлі, якая разумее свет. Кітайскія кампаніі, уключаючы Tencent, ствараюць сістэмы з разуменнем фізікі і трохмерных даных. Універсітэт штучнага інтэлекту імя Мохамеда бін Зайеда (ААЭ) на мінулым тыдні прадставіў сваю першую мадэль PAN.
Як гэта працуе?
Фізічныя мадэлі навучаюцца на відэа, сімуляцыях і прасторавых даных, фармуючы ўяўленні пра аб’екты, асяроддзі і дынаміку свету. Яны вучацца разумець гравітацыю, схаванне аб’ектаў, прычынна-выніковыя сувязі — без непасрэднага праграмавання.
Ключавы выклік — даныя. У адрозненне ад моўных мадэляў, якія можна навучаць на тэкстах з інтэрнэту, мадэлям свету патрэбныя велізарныя аб’ёмы якасных мультымадальных даных. Нават найбуйнейшыя адкрытыя наборы, такія як датасэт Encord (1 млрд пар даных), з’яўляюцца толькі адпраўной кропкай.