Оригинальный заголовок: Системы Frontier для физического мираАвтор оригинала: Оливер ХсуИсточник оригинала:Перепечатка: Mars FinanceГлубокий обзор: Эта статья от исследователя a16z Оливера Хсу — самая систематическая с 2026 года «физическая»

MarsBitNews

2026-04-18 07:06:47

Заголовок оригинала: Передовые системы для физического мира

Автор оригинала: Оливер Хсу

Источник оригинала:

Репост: Mars Finance

Глубокий обзор: Эта статья от исследователя a16z Оливера Хсу — самая системная карта инвестиций в «физический ИИ» с 2026 года. Его мнение: основная линия развития — язык и код — всё ещё масштабируется, но по-настоящему прорывные способности следующего поколения появятся в трёх смежных областях — универсальные роботы, автономная наука (ИИ-учёные), интерфейсы мозг-компьютер и другие новые виды человеко-машинных интерфейсов. Автор разбирает пять базовых способностей, поддерживающих их, и показывает, как эти три направления формируют взаимно питающийся структурный «фигурный» цикл. Для тех, кто хочет понять инвестиционную логику физического ИИ — это сейчас самый полный каркас.

Сегодня доминирующая парадигма ИИ — вокруг языка и кода. Закон масштабирования больших языковых моделей уже хорошо описан, коммерческий цикл данных, вычислительных ресурсов и алгоритмов движется, и каждый новый уровень возможностей приносит значительную отдачу, большинство из которых очевидны. Эта парадигма оправдывает привлечение капитала и внимания.

Но рядом есть смежные области, уже находящиеся в стадии зарождения и показывающие реальные успехи. В их числе — модели визуально-языковых действий (VLA), модели мира и действий (WAM), а также физические и научные рассуждения, основанные на прогрессе ИИ, и новые интерфейсы человеко-машинного взаимодействия (включая мозг-компьютер, беззвучную речь, нейроносители и новые сенсорные каналы, такие как цифровой обоняние).

Помимо технологий, эти направления начинают привлекать таланты, капитал и основателей. Технологические основы для расширения передовых ИИ в физический мир одновременно созревают, и последние 18 месяцев показывают, что эти области скоро перейдут в стадии масштабирования.

В любой парадигме, там, где разрыв между текущими возможностями и среднесрочным потенциалом наиболее велик, обычно есть два признака: во-первых, они используют те же преимущества масштабирования, что и передний край, во-вторых, находятся чуть ближе к мейнстриму — достаточно близко, чтобы наследовать инфраструктуру и исследовательский импульс, и достаточно далеко, чтобы требовать реальных дополнительных усилий.

Этот разрыв выполняет двойную функцию: он создаёт естественную защиту для быстрых последователей и одновременно определяет более редкое, менее насыщенное информацией пространство, где могут возникнуть новые способности — именно потому, что путь ещё не пройден полностью.

На сегодняшний день к этим характеристикам соответствуют три области: обучение робототехники, автономная наука (особенно в материалах и биологических науках), а также новые человеко-машинные интерфейсы (включая мозг-компьютер, беззвучную речь, нейроносители и новые сенсорные каналы).

Они не полностью независимы, объединены общей темой — «передовые системы физического мира». Они делят базовые компоненты: изучение физических динамик, архитектуры для телесных действий, инфраструктура для симуляции и синтеза данных, расширяющиеся сенсорные каналы и замкнутые системы управления агентами. Взаимодействие между ними усиливает друг друга. Это также те области, где наиболее вероятно возникновение качественных прорывов — результат взаимодействия масштабирования моделей, физической реализации и новых данных.

В этой статье будет рассмотрено, какие технологические компоненты лежат в основе этих систем, почему эти три области представляют передовые возможности, и как их взаимное усиление формирует структурный цикл, продвигающий ИИ в физический мир.

Пять базовых компонентов

Перед тем, как перейти к конкретным приложениям, важно понять, какие технологические основы объединяют эти передовые системы. Расширение ИИ в физический мир опирается на пять ключевых компонентов. Эти технологии не принадлежат к одному конкретному направлению — они являются строительными блоками, позволяющими создавать системы, расширяющие возможности ИИ в физике. Их синхронное развитие — причина особого момента сейчас.

Компонент один: изучение физических динамик и представлений

Самый фундаментальный компонент — это способность обучить компактное, универсальное представление поведения в физическом мире: как движутся объекты, как деформируются, сталкиваются, как реагируют на силы. Без этого слоя каждая система физического ИИ должна начинать с нуля — изучать свои физические законы, что очень дорого.

Несколько архитектурных подходов приближаются к этой цели с разных сторон. Модель VLA работает сверху: берёт предварительно обученную визуально-языковую модель — такую, которая уже понимает семантику объектов, пространственных отношений и языка — и добавляет декодер действий, выдающий команды для управления движением.

Ключ в том, что затраты на обучение «видеть» и «понимать» мир можно снизить за счёт масштабного интернет-просмотра изображений и текста. Проекты Physical Intelligence π₀, Gemini Robotics от Google DeepMind, NVIDIA GR00T N1 — все проверяют эти идеи на всё больших масштабах.

Модель WAM подходит снизу: использует видео, предварительно обученное на огромных данных, основанное на диффузионных трансформерах, сохраняет богатые физические приёмы — как объекты падают, скрываются, взаимодействуют — и связывает их с генерацией движений.

NVIDIA DreamZero демонстрирует нулевое обучение для новых задач и сред, используя небольшое количество адаптационных данных, полученных из видео демонстраций человека, и показывает хорошие результаты в реальных условиях.

Третий путь — самый перспективный для будущего: он пропускает предварительное обучение VLM и видео-диффузионные модели. Модель GEN-1 — это полностью обученная с нуля базовая модель для физического взаимодействия, обученная на более чем 500 тысяч часах реальных физических взаимодействий, собираемых с помощью недорогих носимых устройств.

Она не является классической VLA (без дообучения на визуально-языковых данных) и не WAM. Это базовая модель, специально созданная для физического взаимодействия, которая учится не на статистике изображений или текста из интернета, а на статистике контактов человека с объектами.

Такие компании, как World Labs, создают пространственный интеллект, который дополняет эти компоненты, потому что он решает проблему отсутствия явного моделирования трёхмерной структуры сцен — это важный пробел у VLA, WAM и базовых моделей взаимодействия.

VLA использует 2D визуальные признаки, полученные из предобучения на изображениях и текстах; WAM учится динамике на видео, которое — по сути — 3D сцена, проецированная в 2D; модели, основанные на данных с носимых датчиков, улавливают силы и кинематику, но не сценическую геометрию. Пространственный интеллект помогает восполнить этот пробел — учится восстанавливать, генерировать полную 3D-структуру физической среды и делать выводы о геометрии, освещении, скрытых объектах, отношениях и пространственной организации.

Объединение этих подходов — важнейшая задача. Независимо от того, наследуют ли представления из VLM, учатся из видео или создаются с нуля — базовый компонент один: сжатая, переносимая модель поведения в физическом мире.

Эти представления требуют огромных данных для обучения — большинство ещё не задействовано: помимо интернет-видео и траекторий роботов, начинается масштабное сбор данных о человеческом теле с помощью носимых устройств. Одна и та же модель может обслуживать робота, учащегося складывать полотенца, автономную лабораторию, предсказывающую реакции, или нейронный декодер, интерпретирующий активность коры головного мозга.

Компонент два: архитектура для телесных действий

Обнаружение физических представлений недостаточно. Чтобы «понимать» и переводить их в надёжные физические действия, нужна архитектура, решающая связанные задачи: отображение высокоуровневых намерений в последовательности команд, поддержание согласованности в длинных цепочках движений, работу в условиях задержек и постоянное обучение на опыте.

Двухуровневая архитектура уже стала стандартом для сложных телесных задач: медленная, мощная модель визуально-языкового понимания отвечает за сцену и планирование (System 2), а быстрая, лёгкая модель для управления движениями — за реальное управление (System 1). Модели вроде GR00T N1, Gemini Robotics, Helix от Figure используют вариации этого подхода, решая противоречие между богатым рассуждением и требованиями мгновенного контроля.

Механизмы генерации движений тоже быстро развиваются. π₀, основанный на потоковом совпадении и диффузионных моделях, стал стандартом для плавных, высокочастотных движений, заменяя дискретные токены, заимствованные из языкового моделирования. Эти методы моделируют движения как процесс «очистки шума», похожий на синтез изображений, что даёт более гладкие траектории и устойчивость к ошибкам.

Самое важное — расширение обучения с подкреплением (RL) на предварительно обученные модели VLA. Такой базовый модель, обученная на демонстрационных данных, может продолжать совершенствоваться через самостоятельные практики — как человек, оттачивающий навык путём повторных упражнений и самокоррекции. Работа π*₀.₆ от Physical Intelligence — яркий пример масштабируемого применения этого принципа. Они используют RECAP — алгоритм, сочетающий преимущества демонстраций и самостоятельного обучения, — чтобы решить проблему долгосрочного кредитного распределения в длинных последовательностях.

Если робот чуть наклонил ручку кофемашины, неудача может проявиться только через несколько шагов. Модели имитирования не умеют связывать неудачу с ранним действием, а RL — умеет. RECAP обучает ценностную функцию, оценивающую вероятность успеха из любой промежуточной точки, и позволяет модели выбирать действия с высоким преимуществом. Важное достоинство — объединение разнородных данных: демонстраций, опыта стратегии и исправлений, полученных от экспертов дистанционно, — в единую тренировочную цепочку.

Результаты этой методики — хорошие новости для перспектив RL в управлении движениями: π*₀.₆ успешно складывает 50 видов одежды, которых раньше не видел, надёжно собирает коробки, готовит кофе в профессиональных машинах — и делает это часами без вмешательства человека. На самых сложных задачах RECAP вдвое увеличивает пропускную способность и сокращает число ошибок по сравнению с чистым имитированием. Также система показывает, что после обучения с подкреплением возможны качественные изменения поведения: более плавные движения, более эффективные стратегии захвата, исправление ошибок, которых не было в демонстрациях.

Эти достижения подтверждают: рост вычислительных мощностей для масштабирования больших моделей — от GPT-2 до GPT-4 — уже работает в области телесных систем. Пока что на ранних этапах, с непрерывным пространством действий и физическими ограничениями.

Компонент три: симуляция и синтез данных как инфраструктура масштабирования

В языковой сфере проблему данных решили — миллиарды текстовых токенов, генерируемых естественным образом и бесплатно. В физическом мире ситуация сложнее — это признано всеми, и очевидный сигнал — быстро растущее число стартапов, поставляющих физические данные.

Сбор реальных данных о траекториях роботов дорог и рискован, а разнообразие ограничено. Языковая модель учится на миллиардах диалогов, а робот — пока что не может иметь миллиарды физических взаимодействий.

Создание симуляций и синтез данных — это инфраструктура, которая решает эту проблему. Современные симуляционные системы объединяют физические движки, фотограмметрию с трассировкой лучей, процедурное создание окружений и генерацию фотореалистичных видео на основе симуляции — всё для преодоления разрыва sim-to-real. Весь цикл начинается с нейронного восстановления реальной среды (даже с одного смартфона), создаёт точные 3D-активы и генерирует большие объёмы синтетических данных с автоматической разметкой.

Улучшение симуляционной инфраструктуры меняет экономические предпосылки для физического ИИ: если узкое место — это сбор реальных данных, то при переходе к проектированию виртуальных сред — стоимость падает. Масштабируемость симуляции растёт с ростом вычислительных ресурсов, без необходимости физического оборудования или человеческих ресурсов. Это подобно тому, как инфраструктура для обучения языковых моделей — инвестиции в симуляцию могут значительно повысить эффективность всей экосистемы.

Но симуляция — не только компонент для роботов. Она служит и для автономной науки (цифровые двойники лабораторного оборудования, симуляции для гипотез), и для новых интерфейсов (симуляции нейронных сред для обучения BCI, синтез сенсорных данных для калибровки новых датчиков), и для других областей взаимодействия ИИ с физикой. Симуляция — универсальный движок данных для физического ИИ.

Компонент четыре: расширение сенсорных каналов

Информационные сигналы физического мира богаче, чем визуальные и языковые. Тактильные ощущения передают свойства материалов, стабильность захвата, контактную геометрию — всё, что камеры не видят. Нейронные сигналы с высокой пропускной способностью кодируют намерения движения, когнитивные состояния, сенсорный опыт. Мышечная активность до появления звука уже закодирована в речь. Четвёртый компонент — быстрое расширение сенсорных каналов ИИ — не только за счёт исследований, но и благодаря развитию потребительских устройств, программного обеспечения и инфраструктуры.

Самый очевидный пример — новые устройства. AR-очки за последние годы значительно улучшили опыт и дизайн (уже есть коммерческие и промышленные приложения). Голосовые носимые позволяют ИИ лучше понимать физическую среду — они действительно идут за пользователем.

В перспективе нейроинтерфейсы откроют более полные режимы взаимодействия. Изменения в вычислительных моделях создают возможности для существенного улучшения человеко-машинного взаимодействия: компании вроде Sesame создают новые модальности и устройства.

Голос — более распространённый канал — также способствует развитию новых способов взаимодействия. Продукты вроде Wispr Flow делают голос основным вводом (благодаря высокой информационной плотности и преимуществам), а беззвучные интерфейсы улучшают рынок. Они используют датчики для захвата движений языка и голосовых связок, распознавая речь без звука — это более ёмкий канал взаимодействия.

Мозг-компьютер (включая инвазивные и неинвазивные системы) — это более глубокий фронт. Технологии развиваются: Neuralink уже имплантировал устройства нескольким пациентам, роботы-хирурги и декодеры совершенствуются. Synchron использует внутовенозные стенты для управления движением у парализованных. Echo Neurotechnologies разрабатывает системы для восстановления речи, основанные на высокоточных декодерах активности коры.

Новые компании собирают талант и капитал для создания новых нейроинтерфейсов и платформ. В технологическом плане важны достижения вроде BISC — чипа с 65 тысячами электродов для беспроводной записи нейронных сигналов, и системы BrainGate, которая декодирует внутренний язык мозга.

Общая нить — это не просто «они все интерфейсы», а спектр, связывающий человеческий опыт и системы ИИ — каждый точечный прогресс расширяет пропускную способность этого спектра, поддерживая развитие трёх ключевых областей.

Обучая робота миллионами высококачественных видео с первого лица, можно получить совершенно разные операционные представления, чем при обучении на отфильтрованных данных дистанционного управления; реагируя на беззвучные команды, лабораторный ИИ отличается по задержкам и плавности; нейро-декодеры, обученные на высокоплотных данных BCI, дают уникальные представления о движениях, недоступные другим каналам.

Распространение этих устройств расширяет пространство данных для обучения физических систем ИИ — и это во многом движется за счёт капиталовложений крупных потребительских компаний, а не только академических лабораторий. Это означает, что цикл данных будет расти вместе с рынком.

Компонент пять: замкнутые системы интеллектуальных агентов

Последний компонент — это архитектурный уровень. Он предполагает создание систем, объединяющих восприятие, рассуждение и действия в непрерывный, автономный, замкнутый цикл, функционирующий без вмешательства человека на длительных временных масштабах.

В языковых моделях это проявляется в появлении интеллектуальных агентов — цепочек многошаговых рассуждений, использования инструментов, самокоррекции, — которые превращают однократные диалоги в самостоятельные решения задач. В физическом мире аналогичные преобразования происходят сложнее: ошибка в ИИ-агенте может привести к необратимым последствиям.

Три ключевых признака физических систем отличают их от цифровых:

Необходимость интеграции с экспериментами и замкнутым циклом: подключение к исходным данным, сенсорам и исполнительным компонентам, чтобы рассуждения основывались на реальности, а не только на текстовых описаниях.
Требование долговременной памяти: хранение истории, прослеживаемости, безопасности и восстановления, чтобы связать множество циклов работы, а не рассматривать каждую задачу отдельно.
Адаптация в замкнутом цикле: корректировка стратегий на основе физических результатов, а не только текстовых отзывов.

Этот компонент объединяет отдельные способности — хорошие модели мира, надёжные архитектуры действий, богатые сенсорные системы — в полноценную систему, способную автономно функционировать в физическом мире. Его развитие — условие для реального внедрения этих технологий, а не только для демонстраций.

Три области

Эти компоненты — универсальные основы, не определяющие, где именно появятся главные приложения. Многие области связаны с физическими действиями, измерениями или восприятиями. Различие между «передовыми системами» и «просто улучшенными существующими» — в степени эффекта сложных взаимодействий и накопления новых возможностей, которые раньше были недоступны.

Робототехника, наука с помощью ИИ, новые человеко-машинные интерфейсы — это три наиболее ярких области такого эффекта. Каждая по-своему собирает компоненты, каждая сталкивается с текущими ограничениями, и каждая в процессе работы порождает структурированные физические данные — эти данные, в свою очередь, улучшают компоненты, создавая обратную связь и ускоряя развитие системы. Они не единственные области физического ИИ, но — самые насыщенные взаимодействием с физической реальностью и передовыми возможностями ИИ, а также — самые удалённые от текущего языка и кода, что создаёт простор для новых прорывов, и при этом — очень хорошо дополняют существующие парадигмы.

Робототехника

Роботы — наиболее буквальный пример физического ИИ: система должна в реальном времени воспринимать, рассуждать и выполнять физические действия в материальном мире. Это также проверка всех компонентов.

Подумайте, сколько нужно сделать, чтобы универсальный робот сложил полотенце. Он должен иметь представление о деформируемых материалах и их поведении — физический приоритет, который не даёт языковое предобучение. Он нуждается в архитектуре, способной переводить высокоуровневые команды в последовательности команд с частотой выше 20 Гц.

Ему нужны симуляции для генерации тренировочных данных — ведь никто не собирал миллионы реальных демонстраций складывания полотенец. Ему нужна тактильная обратная связь для обнаружения скольжения и регулировки захвата — потому что визуально сложно отличить стабильный захват от неудачного. И, наконец, — замкнутый контроллер, который сможет распознать ошибку и восстановить операцию, а не просто следовать запомненной траектории.

Именно поэтому робототехника — это передовая система, а не просто более развитая инженерная дисциплина. Эти компоненты не просто улучшают существующие возможности роботов, они открывают новые классы операций, движений и взаимодействий, недоступных в узкоспециализированных промышленных условиях.

За последние годы прогресс был значительным — мы уже писали об этом. Первое поколение VLA показало, что базовая модель может управлять роботами для выполнения разнообразных задач. Архитектурные улучшения связали уровни рассуждения и управления. Модели с локальным рассуждением стали возможны, перенос на новые платформы — с меньшими данными. Основная проблема — масштабируемая надёжность, которая всё ещё ограничивает внедрение. Каждая попытка с 95% успеха за шаг — недостаточна, в реальных задачах требуется гораздо выше. RL после обучения — большой потенциал для повышения надёжности и масштабируемости.

Эти достижения влияют на структуру рынка. В течение десятилетий ценность робототехники заключалась в механических системах, но по мере стандартизации обучения ценность смещается в модели, инфраструктуру и данные. Роботы также питают эти компоненты: каждая реальная траектория — это данные для улучшения моделей, каждая неудача — сигнал о пробелах симуляции, каждый новый тип робота — расширение физического опыта для предобучения. Роботы — самые требовательные потребители компонентов, и одновременно — важнейшие источники обратной связи для их улучшения.

Автономная наука

Если роботы — тестируют «физические действия», то автономная наука — занимается сложными причинно-следственными системами, требующими многократных шагов, с временными рамками в часы или дни, где результаты нужно интерпретировать, контекстуализировать и использовать для корректировки стратегии.

ИИ в науке — наиболее комплексное применение компонентов. Автоматическая лаборатория (SDL) должна учиться предсказывать результаты химических и физических экспериментов, используя физические и химические модели; управлять перемещением жидкостей, образцами, приборами; моделировать и предселекционировать эксперименты; расширять сенсорные возможности — спектрометры, хроматографы, масс-спектрометры и новые химические и биологические датчики — для характеристики результатов.

Это требует глубокой замкнутой автоматизации: система должна вести многократные циклы «гипотеза-эксперимент-аналитика-обновление», без вмешательства человека, с возможностью прослеживания, контроля безопасности и корректировки стратегии по мере получения новых данных.

Ни одна другая область так не использует эти компоненты. Поэтому автономная наука — это системный подход, а не просто автоматизация лабораторий. Компании вроде Periodic Labs и Medra объединяют научное мышление и физическую проверку, создавая системы для быстрой итерации и производства данных.

Эти системы очевидно ценны: традиционные материалы требуют лет для коммерциализации, а ИИ может ускорить этот процесс. Основные ограничения — в переходе от гипотез к производству и проверке, где нужны физические инструменты, роботы и замкнутый цикл оптимизации. SDL — именно для этого.

Ещё одна важная характеристика — роль системы как движка данных. Каждый эксперимент — не только результат, но и структурированный, эмпирически подтверждённый обучающий сигнал. Например, измерение кристаллизации полимера при определённых условиях — расширяет модель материалов; проверенная синтез-методика — для физического рассуждения; неудача — сигнал о слабых местах модели. Данные, полученные в реальных экспериментах, — структурированные, причинно-следственные, подтверждённые — именно такие нужны для построения физических моделей. Автономная наука — это прямой путь превращения физической реальности в структурированные знания и развитие всей экосистемы физического ИИ.

Новые интерфейсы

Роботы расширяют возможности ИИ для физических действий, автономная наука — для исследований. Новые интерфейсы создают прямую связь между ИИ и человеческим восприятием, сенсорным опытом и телесными сигналами — AR-очки, нейроносители, импланты.

Общий признак — расширение пропускной способности и модальностей каналов связи между человеком и ИИ — и создание данных для физического ИИ.

Разрыв с мейнстримом — вызов и возможность. Модели языка знают эти модальности концептуально, но не умеют распознавать беззвучную речь, геометрию обонятельных рецепторов или временную динамику сигналов.

Декодирование этих сигналов требует обучения на расширяемых сенсорных данных. Многие модальности не имеют миллиарды примеров в интернете, их данные — результат работы интерфейсов, что создаёт совместную эволюцию системы и данных, — в отличие от языковых моделей.

Недавний тренд — быстрое развитие потребительских устройств для расширения ИИ в физический мир. AR-очки — яркий пример, другие носимые устройства тоже появляются.

Эти устройства создают новую платформу для ИИ, расширяющую физический опыт, и становятся инфраструктурой для сбора данных. Человек с носимым ИИ создаёт поток первых лиц — видео, сенсорных данных, биометрии — масштабируемый источник данных о взаимодействии человека с физическим пространством.

Масштаб смартфонов — пример: новые устройства позволяют воспринимать мир в новых модальностях и открывают огромные возможности для взаимодействия ИИ с физикой.

Мозг-компьютер — более глубокий фронт. Neuralink уже имплантировал устройства, роботы-хирурги и декодеры совершенствуются. Synchron использует внутовенозные стенты для управления движением у парализованных. Echo Neurotechnologies разрабатывает системы для восстановления речи на основе высокоточных декодеров активности мозга.

Новые компании собирают талант и капитал для создания новых нейроинтерфейсов и платформ. Важные технологические достижения — чипы с десятками тысяч электродов, декодеры внутренней речи.

Общая нить — это спектр, связывающий человеческий опыт и системы ИИ — каждый прогресс расширяет пропускную способность этого спектра, поддерживая развитие трёх ключевых областей.

Обучая робота миллионами видео с первого лица, можно получить совершенно разные операционные представления, чем при обучении на отфильтрованных данных. Реагируя на беззвучные команды, лабораторные ИИ отличаются по задержкам и плавности. Нейро-декодеры, обученные на высокоплотных данных BCI, дают уникальные представления о движениях, недоступные другим каналам.

Распространение этих устройств расширяет пространство данных для обучения физических систем ИИ — и это во многом движется за счёт инвестиций крупных потребительских компаний, а не только академий. Это создаёт цикл данных, который растёт вместе с рынком.

Компонент шесть: замкнутые системы интеллектуальных агентов

Последний компонент — архитектурный. Он предполагает создание систем, объединяющих восприятие, рассуждение и действия в непрерывный, автономный, замкнутый цикл, функционирующий без вмешательства человека на длительных временных масштабах.

В языковых моделях это — развитие интеллектуальных агентов: цепочки многошаговых рассуждений, использование инструментов, самокоррекция — превращают однократный диалог в самостоятельное решение задач. В физике — аналогичные системы сложнее, потому что ошибка может иметь необратимые последствия.

Три признака отличают физические системы от цифровых:

Необходимость интеграции с экспериментами и замкнутым циклом: подключение к исходным данным, сенсорам и исполнительным компонентам, чтобы рассуждения основывались на реальности, а не только на текстах.
Требование долговременной памяти: хранение истории, прослеживаемости, безопасности и восстановления, чтобы связать множество циклов работы.
Адаптация в замкнутом цикле: корректировка стратегий на основе физических результатов, а не только текстовых отзывов.

Этот компонент объединяет отдельные способности — хорошие модели мира, надёжные архитектуры действий, богатые сенсорные системы — в полноценную автономную систему, способную функционировать в физическом пространстве. Его развитие — условие для реального внедрения этих технологий, а не только демонстраций.

Три области

Эти компоненты — универсальные основы, не определяющие, где появятся главные приложения. Множество сфер связаны с физическими действиями, измерениями или восприятиями. Различие между «передовыми системами» и «просто улучшенными системами» — в степени эффекта накопления новых возможностей, которые раньше были недоступны, и в способности к эффектам, вызываемым сложными взаимодействиями.

Робототехника, наука с помощью ИИ, новые человеко-машинные интерфейсы — это три области с самым сильным эффектом. Каждая по-своему собирает компоненты, каждая сталкивается с текущими ограничениями, и каждая в процессе работы порождает структурированные физические данные — эти данные, в свою очередь, улучшают компоненты, создавая обратную связь и ускоряя развитие системы. Они не единственные, но — самые насыщенные взаимодействием с физической реальностью и передовыми возможностями ИИ, а также — самые удалённые от текущего языка и кода, что создаёт простор для новых прорывов, и при этом — очень хорошо дополняют существующие парадигмы.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
GatePreIPOsLaunchesWithSpaceX
203.79K Популярность
#
Gate13thAnniversaryLive
634.51K Популярность
#
IsraelStrikesIranBTCPlunges
30.11K Популярность
#
AltcoinsRallyStrong
7.33M Популярность
#
AnthropicvsOpenAIHeatsUp
1.07M Популярность

Закрепить

Карта сайта

A16z：Следующий фронтир ИИ — тройной маховик роботов, автономных наук и интерфейсов мозг-компьютер

Популярные темы

GatePreIPOsLaunchesWithSpaceX

Gate13thAnniversaryLive

IsraelStrikesIranBTCPlunges

AltcoinsRallyStrong

AnthropicvsOpenAIHeatsUp

Закрепить