Wow, Grok 4 vừa chiếm ngôi trên bảng xếp hạng GPQA Diamond. Chúng ta đang nói về việc nghiền nát mọi mô hình AI khác khi nói đến những câu hỏi khoa học khó nhất mà bạn có thể ném vào nó.
Đây không phải là một bản nâng cấp nhỏ—đây là mô hình giải quyết những vấn đề khiến các tiến sĩ phải đổ mồ hôi. Các bài kiểm tra GPQA Diamond được thiết kế đặc biệt để rất khó khăn, loại bài cần lý luận sâu sắc trong nhiều lĩnh vực khoa học khác nhau. Và Grok 4? Thẳng đến số một.
Điều làm cho điều này thật sự thú vị là tốc độ mà những mô hình này đang phát triển. Chỉ vài tháng trước, chúng ta đã ăn mừng những cột mốc khác nhau, và bây giờ tiêu chuẩn cứ tiếp tục thay đổi. Những tác động đến nghiên cứu, tính toán khoa học, và vâng, thậm chí là tối ưu hóa hạ tầng blockchain? Khá lớn khi bạn nghĩ về sức mạnh tính toán và khả năng giải quyết vấn đề mà chúng ta đang mở khóa ở đây.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
6
Đăng lại
Retweed
Bình luận
0/400
failed_dev_successful_ape
· 6giờ trước
Nhanh hơn cả đầu tôi nữa rồi.
Xem bản gốcTrả lời0
ShortingEnthusiast
· 6giờ trước
Người đến sau cũng không ai bằng.
Xem bản gốcTrả lời0
LiquidationSurvivor
· 6giờ trước
Không có gì là牛, tốc độ của Grok trong web3 chạy trên链上 có lẽ sẽ phát nổ.
Wow, Grok 4 vừa chiếm ngôi trên bảng xếp hạng GPQA Diamond. Chúng ta đang nói về việc nghiền nát mọi mô hình AI khác khi nói đến những câu hỏi khoa học khó nhất mà bạn có thể ném vào nó.
Đây không phải là một bản nâng cấp nhỏ—đây là mô hình giải quyết những vấn đề khiến các tiến sĩ phải đổ mồ hôi. Các bài kiểm tra GPQA Diamond được thiết kế đặc biệt để rất khó khăn, loại bài cần lý luận sâu sắc trong nhiều lĩnh vực khoa học khác nhau. Và Grok 4? Thẳng đến số một.
Điều làm cho điều này thật sự thú vị là tốc độ mà những mô hình này đang phát triển. Chỉ vài tháng trước, chúng ta đã ăn mừng những cột mốc khác nhau, và bây giờ tiêu chuẩn cứ tiếp tục thay đổi. Những tác động đến nghiên cứu, tính toán khoa học, và vâng, thậm chí là tối ưu hóa hạ tầng blockchain? Khá lớn khi bạn nghĩ về sức mạnh tính toán và khả năng giải quyết vấn đề mà chúng ta đang mở khóa ở đây.