Стартап XDOF привлекает $70 миллионов для решения проблемы нехватки данных для обучения роботов
Стартап XDOF, создающий инфраструктуру сбора и аннотирования данных для обучения роботов, привлек $70 миллионов от ведущих инвесторов, чтобы восполнить критический недостаток данных о физическом взаимодействии.

Через две недели после того, как OpenAI объявила о возобновлении программы робототехники, стартап XDOF выходит из тени, чтобы решить одну из крупнейших проблем развития ИИ: нехватку качественных данных для обучения роботов. В отличие от языковых моделей, которые обучаются на огромных объёмах общедоступных текстов, роботам требуются данные, фиксирующие физическое взаимодействие с миром, а таких данных крайне мало.
XDOF (произносится «экс-доф») предоставляет конвейеры данных, инструменты сбора и системы аннотирования, которые ведущие ИИ-лаборатории и робототехнические компании не могут легко создать самостоятельно. Компания привлекла $70 миллионов от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. Основанный в октябре 2024 года, XDOF уже работает с 20 клиентами, включая несколько ведущих ИИ-лабораторий, названия которых не разглашаются. В компании занято около 60 сотрудников.
Сооснователь и генеральный директор Филипп Ву столкнулся с проблемой данных во время учёбы в докторантуре Калифорнийского университета в Беркли. Он понял, что для обучения фундаментальных моделей робототехники сначала необходимо собрать огромные наборы данных — проблема курицы и яйца. Вместе с сооснователями Фредом Шенту и Немо Джином Ву запустил XDOF для создания экосистемы данных для компаний, занимающихся робототехникой.
Стартап сотрудничает с лабораторией ИИ Беркли для выпуска набора данных ABC, который, по его утверждению, является крупнейшей коллекцией высококачественных данных для обучения роботов из когда-либо созданных. Он включает 130 000 траекторий манипуляций роботов, 300 часов симуляции и 100 часов оценок. Данные уже использовались для обучения роботов таким задачам, как складывание футболок, сплющивание коробок и загрузка AirPods в чехлы.
XDOF планирует работать на трёх уровнях пирамиды данных. Самый ценный уровень — данные телеоперации, собранные на конкретном используемом роботе; следующий уровень — более общие данные телеоперации; и, наконец, «эгоцентрические» данные, собираемые людьми при выполнении повседневных задач, для чего XDOF разработает собственные носимые датчики. Компания намерена нанимать и обучать телеоператоров и сборщиков данных по всему миру, поскольку эта работа требует больших складских помещений, обслуживания роботов и обучения операторов — задачи, которые большинство ИИ-лабораторий предпочитают передавать на аутсорсинг.
Название XDOF отсылает к термину робототехники «степени свободы», который описывает количество независимых движений, которые может выполнять робот. «X» символизирует неограниченные степени свободы — амбицию, отражающую цель компании предоставлять данные для любых типов роботов.


