От слов к телу: роль физического опыта в развитии ИИ

Вы сидите на холодном складе в грязном квартале Мишен в Сан-Франциско, управляя роборуками через перчатки с трекингом движений. Ваша задача: научить нейросеть действовать в реальном мире, складывая одежду и собирая коробки.

Это — штаб-квартира Physical Intelligence, стартапа, основанного выходцами из DeepMind. Их цель — не очередной чат-бот, а универсальный робот, способный взаимодействовать с физическим миром, как человек.

В отличие от разработчиков ChatGPT, они не могут использовать готовые данные из интернета. Посты с Reddit и статьи из Википедии не научат машину держать чашку или гладить рубашку. Все данные приходится собирать вручную: сенсорику, телеметрию и управляющие сигналы. Человек, как кукловод, ведет робота, формируя эталонные движения и реакции. Это медленно, дорого и сложно масштабируется: один оператор может наработать не более 24 часов данных в сутки.

На конференции AI Ascent 2025 Джим Фан из NVIDIA показал, как в симуляции за два часа можно пройти путь, на который в реальном мире ушли бы десять лет: гуманоидные роботы учатся двигаться в виртуальной реальности.

Фан говорит о физическом Тесте Тьюринга:

Попросите убраться и приготовить обед. Если вы не сможете отличить, кто это сделал — человек или робот — тест пройден.

Пока этот тест не прошел никто, потому что нейросети не имеют телесного опыта. Это ключевая мысль, особенно от директора по ИИ в NVIDIA.

Языковые модели вроде GPT, Claude или Gemini живут в пещере Платона. Они изучают мир по теням — по текстам, изображениям и аудио. Они видят описания, но не проживают реальность.

Настоящий интеллект не просто вычисляет, он чувствует и действует. Он обретает тело, через которое познает: ошибки, сопротивление, вес, равновесие, трение и успех. Философы называют это qualia — субъективные, необъяснимые переживания, формирующие "я". Поэтому важно дать роботам осязание.

Чтобы пройти физический Тест Тьюринга, машине нужно не больше слоев и токенов, а тело и среда, в которой она учится. Как у детей: игрушки, касания, падения и неожиданности. Ведь и наш мозг формируется не текстами, а опытом.

Но и мы сами смотрим на тени на стене пещеры. Они фактурные, цветные и пахнущие, но физики напоминают: вселенная гораздо сложнее, чем подсказывают чувства.

Каким будет разум, способный чувствовать тоньше и острее? Через десятки сенсоров, которых у нас нет, через сигналы, которые мы не в состоянии воспринять? Возможно, путь к сверхразуму — не в вычислительной мощности, а в сенсорной плотности, в телесности, в новых каналах восприятия и способах взаимодействия с миром, которые для нас недоступны.

Путь — в выходе из пещеры.

От слов к телу: роль физического опыта в развитии ИИ

AI саммари

От слов к телу: роль физического опыта в развитии ИИ