Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки.
Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X.
По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Модель OpenAI 最强o3 была обвинена в подлоге, получив привилегированный доступ к тестовой базе данных FrontierMath заранее
Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки. Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X. По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.