Probably привлекает $9 млн на создание более надежного ИИ
Стартап Probably получил $9 миллионов начального финансирования от Andreessen Horowitz для разработки системы, предотвращающей галлюцинации LLM с помощью детерминированного валидатора и инженерного подхода, что позволяет использовать меньшие модели.

Стартап Probably, специализирующийся на повышении надежности искусственного интеллекта, объявил о привлечении $9 миллионов начального финансирования от венчурной фирмы Andreessen Horowitz. Компания стремится достичь точности 99,99% – уровня, обычного для детерминированных систем, но сложного для больших языковых моделей (LLM), предотвращая галлюцинации и фактические ошибки до того, как они дойдут до пользователя.
Основатель Питер Элиас объясняет, что ключ к успеху не в самой модели, а в инженерии вокруг нее. Первый продукт Probably – инструмент для науки о данных, который быстро отвечает на сложные запросы. Каждый результат сопровождается цитатами и аудиторским следом.
Система использует сложную обвязку, которую Элиас называет «механическим костюмом для науки о данных». Первоначальные ответы LLM проверяются детерминированным валидатором, который отбрасывает несоответствующие результаты. LLM обучается с учетом этого валидатора, а вся система оптимизирована на скорость и точность. «Что мы узнали, создавая это, – чем лучше ваша инженерия обвязки, тем слабее может быть модель, – говорит Элиас. – Если вы достаточно хорошо проработаете контекст, модели не придется сильно стараться, чтобы сделать правильный вывод. По сути, это упражнение по снижению неоднозначности».
Такой подход позволяет Probably работать на значительно меньших моделях. В настоящее время используется модель «на четыре класса слабее передовых моделей», которую можно запускать на локальном оборудовании, например на настольном компьютере, а не в дата-центре, что резко снижает затраты на токены – растущую проблему по мере расширения использования ИИ.
Элиас видит применение того же движка в других областях, требующих высокой точности, таких как бухгалтерия или медицинские услуги. Он критикует крупные лаборатории ИИ за то, что они не занимаются этой проблемой, предполагая, что они заинтересованы в продаже большего количества токенов по мере исправления пользователями ошибок.


