Ler para transferir a aplicação Gate
qrCode
Mais opções de transferência
Não me lembre disso novamente hoje.

Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

robot
Geração de resumo em curso

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição ‘cons@64’. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

XAI1.54%
GROK-5.67%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)