TokenTreasury_
Uau, o Grok 4 acaba de reclamar o trono na tabela de líderes do GPQA Diamond. Estamos a falar de esmagar todos os outros modelos de IA quando se trata das perguntas científicas mais difíceis que lhe podes lançar.
Isto não é um simples upgrade—este é o modelo que lida com problemas que fazem doutorados suar. Os testes GPQA Diamond são especificamente concebidos para serem brutalmente difíceis, o tipo de coisas que requerem um raciocínio profundo em múltiplos domínios científicos. E o Grok 4? Direto para o número um.
O que torna isso realmente interessante é a rapidez com que esses modelos estão
Ver originalIsto não é um simples upgrade—este é o modelo que lida com problemas que fazem doutorados suar. Os testes GPQA Diamond são especificamente concebidos para serem brutalmente difíceis, o tipo de coisas que requerem um raciocínio profundo em múltiplos domínios científicos. E o Grok 4? Direto para o número um.
O que torna isso realmente interessante é a rapidez com que esses modelos estão

