EigenAI достигает 100% воспроизводимости результатов LLM на GPU с дополнительной задержкой менее 2%, что позволяет создавать проверяемых автономных AI-агентов для торговли и предиктивных рынков.
EigenCloud выпустила свою платформу EigenAI на основной сети, заявляя, что решает фундаментальную проблему, преследующую автономные AI-системы: вы не можете проверить то, что не можете воспроизвести.
Техническое достижение здесь значительно. EigenAI обеспечивает бит-в-бит детерминированный вывод на производственных GPU — то есть одинаковые входные данные дают одинаковый результат в 10 000 тестовых запусках — с дополнительной задержкой всего 1,8%. Для тех, кто создает AI-агентов, работающих с реальными деньгами, это важно.
Почему случайность LLM разрушает финансовые приложения
Запустите один и тот же запрос через ChatGPT дважды. Разные ответы. Это не баг — так работает плавающая точка на GPU. Планирование ядер, переменная пакетизация и неассоциативное накопление все вносят небольшие вариации, которые накапливаются и приводят к разным результатам.
Для чатботов никто не замечает. Для AI-торгового агента, который работает с вашими капиталами? Для оракула предиктивного рынка, решающего, кто выиграет $200 миллион в ставках? Несогласованность становится проблемой.
EigenCloud указывает на знаменитый рынок Polymarket «Носил ли Зеленский костюм?» как пример. На объеме более $200 миллиона, обвинения в произвольном разрешении, и в конечном итоге — вмешательство человеческого управления. По мере масштабирования рынков человеческое судейство не справляется. Неизбежен AI-судья — но только если он выдает один и тот же вердикт каждый раз.
Технический стек
Достижение детерминизма на GPU требовало контроля на каждом уровне. Чипы A100 и H100 дают разные результаты при одинаковых операциях из-за архитектурных различий в округлении. Решение EigenAI: операторы и проверяющие должны использовать одинаковые GPU SKU. Их тесты показали 100% совпадение при запуске на одинаковой архитектуре, 0% — при разной.
Команда заменили стандартные ядра cuBLAS на собственные реализации с использованием warp-синхронных редукций и фиксированного порядка потоков. Без атомарных операций с плавающей точкой. Они использовали llama.cpp за его небольшой, проверяемый код, отключая динамическое слияние графов и другие оптимизации, вызывающие вариативность.
Производительность составляет 95-98% от стандартной пропускной способности cuBLAS. Тесты между разными узлами H100 дали идентичные хеши SHA256. Стресс-тесты с фоновыми нагрузками GPU, вызывающими джиттер планирования? Всё равно идентично.
Проверка через экономику
EigenAI использует оптимистическую модель проверки, заимствованную из блокчейн-роллапов. Операторы публикуют зашифрованные результаты в EigenDA, слой доступности данных проекта. Результаты принимаются по умолчанию, но могут быть оспорены в течение окна спора.
Если есть оспаривание, проверяющие повторно выполняют внутри доверенных сред выполнения. Поскольку выполнение детерминировано, проверка сводится к сравнению байтов: совпадают ли байты? Несовпадения вызывают штрафы за залог. Оператор теряет деньги; оспорщики и проверяющие получают оплату.
Экономическая модель направлена на то, чтобы сделать мошенничество с отрицательной ожидаемой ценностью, если вероятность оспаривания превышает определенный порог.
Что создается сейчас
Немедленные приложения просты: судьи предиктивных рынков, чьи вердикты можно воспроизвести и проверить, торговые агенты, где каждое решение фиксируется и может быть оспорено, и инструменты для исследований, где результаты могут быть проверены повторным выполнением, а не доверием.
Более широкий тренд здесь — растущий интерес предприятий к детерминированному AI для строго регулируемых секторов. Здравоохранение, финансы и юридические приложения все чаще требуют воспроизводимости, которую вероятностные системы не могут гарантировать.
Останется ли 2% накладных расходов EigenAI приемлемыми для высокочастотных приложений — покажет время. Но для автономных агентов, управляющих значительным капиталом, возможность доказать целостность выполнения может оправдать снижение производительности.
Полный whitepaper содержит формальный анализ безопасности, спецификации дизайна ядер и механизмы штрафов для тех, кто строит на этой инфраструктуре.
Источник изображения: Shutterstock
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
EigenAI запускает детерминированный AI вывод с точностью бит на основной сети
Ронгчай Ванг
24 янв. 2026 00:07
EigenAI достигает 100% воспроизводимости результатов LLM на GPU с дополнительной задержкой менее 2%, что позволяет создавать проверяемых автономных AI-агентов для торговли и предиктивных рынков.
EigenCloud выпустила свою платформу EigenAI на основной сети, заявляя, что решает фундаментальную проблему, преследующую автономные AI-системы: вы не можете проверить то, что не можете воспроизвести.
Техническое достижение здесь значительно. EigenAI обеспечивает бит-в-бит детерминированный вывод на производственных GPU — то есть одинаковые входные данные дают одинаковый результат в 10 000 тестовых запусках — с дополнительной задержкой всего 1,8%. Для тех, кто создает AI-агентов, работающих с реальными деньгами, это важно.
Почему случайность LLM разрушает финансовые приложения
Запустите один и тот же запрос через ChatGPT дважды. Разные ответы. Это не баг — так работает плавающая точка на GPU. Планирование ядер, переменная пакетизация и неассоциативное накопление все вносят небольшие вариации, которые накапливаются и приводят к разным результатам.
Для чатботов никто не замечает. Для AI-торгового агента, который работает с вашими капиталами? Для оракула предиктивного рынка, решающего, кто выиграет $200 миллион в ставках? Несогласованность становится проблемой.
EigenCloud указывает на знаменитый рынок Polymarket «Носил ли Зеленский костюм?» как пример. На объеме более $200 миллиона, обвинения в произвольном разрешении, и в конечном итоге — вмешательство человеческого управления. По мере масштабирования рынков человеческое судейство не справляется. Неизбежен AI-судья — но только если он выдает один и тот же вердикт каждый раз.
Технический стек
Достижение детерминизма на GPU требовало контроля на каждом уровне. Чипы A100 и H100 дают разные результаты при одинаковых операциях из-за архитектурных различий в округлении. Решение EigenAI: операторы и проверяющие должны использовать одинаковые GPU SKU. Их тесты показали 100% совпадение при запуске на одинаковой архитектуре, 0% — при разной.
Команда заменили стандартные ядра cuBLAS на собственные реализации с использованием warp-синхронных редукций и фиксированного порядка потоков. Без атомарных операций с плавающей точкой. Они использовали llama.cpp за его небольшой, проверяемый код, отключая динамическое слияние графов и другие оптимизации, вызывающие вариативность.
Производительность составляет 95-98% от стандартной пропускной способности cuBLAS. Тесты между разными узлами H100 дали идентичные хеши SHA256. Стресс-тесты с фоновыми нагрузками GPU, вызывающими джиттер планирования? Всё равно идентично.
Проверка через экономику
EigenAI использует оптимистическую модель проверки, заимствованную из блокчейн-роллапов. Операторы публикуют зашифрованные результаты в EigenDA, слой доступности данных проекта. Результаты принимаются по умолчанию, но могут быть оспорены в течение окна спора.
Если есть оспаривание, проверяющие повторно выполняют внутри доверенных сред выполнения. Поскольку выполнение детерминировано, проверка сводится к сравнению байтов: совпадают ли байты? Несовпадения вызывают штрафы за залог. Оператор теряет деньги; оспорщики и проверяющие получают оплату.
Экономическая модель направлена на то, чтобы сделать мошенничество с отрицательной ожидаемой ценностью, если вероятность оспаривания превышает определенный порог.
Что создается сейчас
Немедленные приложения просты: судьи предиктивных рынков, чьи вердикты можно воспроизвести и проверить, торговые агенты, где каждое решение фиксируется и может быть оспорено, и инструменты для исследований, где результаты могут быть проверены повторным выполнением, а не доверием.
Более широкий тренд здесь — растущий интерес предприятий к детерминированному AI для строго регулируемых секторов. Здравоохранение, финансы и юридические приложения все чаще требуют воспроизводимости, которую вероятностные системы не могут гарантировать.
Останется ли 2% накладных расходов EigenAI приемлемыми для высокочастотных приложений — покажет время. Но для автономных агентов, управляющих значительным капиталом, возможность доказать целостность выполнения может оправдать снижение производительности.
Полный whitepaper содержит формальный анализ безопасности, спецификации дизайна ядер и механизмы штрафов для тех, кто строит на этой инфраструктуре.
Источник изображения: Shutterstock