Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Giáo sư Ethan Mollick của Trường Kinh doanh Wharton (Đại học Pennsylvania) trong bài đăng trên nền tảng X ngày 4/25 đã đưa ra một nhận xét có tác động mạnh mẽ đến giới học thuật: hiện nay các AI agent đã có thể độc lập tái hiện các kết quả nghiên cứu học thuật phức tạp chỉ dựa vào mô tả phương pháp và dữ liệu công khai, mà không cần có bản thân bài báo gốc và cũng không cần có mã nguồn gốc. Mollick còn chỉ ra rằng, khi các phiên bản AI tái hiện này khác với bài báo gốc, “lỗi thường nằm ở chính văn bản/đoạn văn của con người, chứ không phải ở AI”. Đây là một bước ngoặt thực chất trong cuộc khủng hoảng khả năng tái lập trong thời đại AI tạo sinh—việc từng cần nhân lực đắt đỏ để tiến hành kiểm chứng đồng cấp, giờ đang được AI thực hiện trên quy mô lớn với chi phí thấp.

Claude tái hiện nhiều bài báo, rồi dùng GPT-5 Pro kiểm chứng hai lớp

Trong blog OneUsefulThing của mình và trong tweet này, Mollick mô tả thí nghiệm cụ thể của anh với Claude: đưa một bài báo học thuật cho Claude, yêu cầu nó mở kho lưu trữ, sắp xếp các tệp, tự động chuyển đổi mã STATA dùng cho thống kê sang Python, rồi lần lượt chạy tất cả các phát hiện trong bài báo. Sau khi Claude hoàn tất, anh lại dùng GPT-5 Pro để kiểm tra lần thứ hai trên cùng một kết quả tái hiện. Nhiều bài báo được thử nghiệm theo cách tương tự; kết quả nhìn chung thành công, chỉ bị cản trở khi tệp dữ liệu quá lớn hoặc bản thân replication data gốc có vấn đề.

Đối với giới học thuật, quy trình này trước đây thường cần nghiên cứu sinh/assistant tốn vài tuần thậm chí vài tháng. Quy mô thời gian Mollick mô tả là từ một buổi chiều đến một ngày, và chi phí vận hành chỉ là phí token của API LLM thương mại.

Lỗi đa phần nằm ở bản gốc do con người viết, không phải ở AI

Gây tranh cãi hơn là đánh giá của Mollick về “ai sai”. Trong tweet, anh nêu rõ rằng khi kết quả tái hiện bằng AI không khớp với bài báo gốc, thì trong đa số trường hợp không phải AI gây sai, mà là bài báo gốc có lỗi trong xử lý dữ liệu, dùng sai mô hình, hoặc các kết luận vượt ra ngoài phạm vi mà dữ liệu có thể chống đỡ. Trong khoảng mười năm gần đây, các ngành khoa học xã hội như tâm lý học, kinh tế học hành vi, quản lý học đã xuất hiện nhiều lần các sự kiện khủng hoảng lớn về khả năng tái lập; sự kiện nổi tiếng nhất là nghiên cứu tái hiện quy mô lớn của Open Science Collaboration năm 2015, chỉ khoảng 36% kết quả của các bài báo tâm lý học có thể được tái hiện độc lập. AI agent đang đẩy ranh giới của quá trình kiểm nghiệm này từ “cần phân bổ nhân lực” sang “có thể thực hiện phổ biến”.

Học hội vẫn cấm AI vào quy trình duyệt bài, thể chế lạc hậu so với công nghệ

Trong một tweet khác ngày 4/25, Mollick nêu đích danh học hội lớn nhất của lĩnh vực mình là Academy of Management vẫn còn cấm AI một cách rõ ràng tham gia quy trình nộp/bình duyệt bài báo. Anh trích dẫn một số nghiên cứu hiện có cho thấy việc duyệt bài bằng AI về độ chính xác, tính nhất quán và kiểm soát thiên kiến đã vượt trội so với một phần người duyệt bài truyền thống. Do đó, quan điểm “cấm” có thể vô tình làm trầm trọng thêm sự thất bại của hệ thống duyệt bài hiện hữu. Khoảng cách giữa thể chế và công nghệ như vậy là một vấn đề chính sách mà 1–2 năm tới giới xuất bản học thuật, các học hội và tổ chức tài trợ đều phải đối mặt.

Đối với người đọc, cuộc tranh luận này không chỉ giới hạn trong học thuật. Khi AI agent có thể kiểm chứng tức thời các phát hiện nghiên cứu, các trích dẫn nghiên cứu trong ngành công nghiệp, các báo cáo chính sách, và các cơ sở học thuật trong quyết định tài chính sẽ bước vào một ngưỡng kiểm chứng mới: “kết luận có chịu được việc AI tái hiện độc lập hay không”. Theo phần bổ sung trong một tweet khác của Mollick, anh cho rằng chính phủ là đơn vị duy nhất có thể đặt “mốc” cho cơ chế kiểm chứng này khi cường độ công cụ tiếp tục tăng lên—và mức độ phức tạp của thiết kế chính sách, sẽ đồng thời trở thành một trục chính tương đối bị bỏ quên trong thảo luận quản trị AI.

Bài viết này: AI Agent đã có thể độc lập tái hiện các bài báo học thuật phức tạp—Mollick cho rằng lỗi chủ yếu nằm ở bản gốc do con người viết chứ không phải AI. Lần đầu tiên xuất hiện trên Chuỗi tin ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Mã thông báo AWP của Agent Work Protocol tăng hơn 300% trong 24 giờ; mạng con Ardinals Inscription được ra mắt

Theo dữ liệu on-chain, token gốc AWP của Agent Work Protocol đã tăng hơn 300% trong 24 giờ vào ngày 4/5. AWP là một giao thức công việc cho AI Agents, với cơ chế phát hành công bằng 100% không có phân bổ cho VC, không có quỹ dự phòng cho đội ngũ và không có presale; tất cả token được phân phối thông qua phát thải của giao thức. Giao thức đã

GateNews2giờ trước

Haun Ventures đóng quỹ 1 tỷ USD vào ngày 4/5, phân bổ vốn giữa các khoản đầu tư crypto giai đoạn đầu và giai đoạn muộn

Theo Bloomberg, Haun Ventures đã hoàn tất một vòng gọi vốn trị giá 1 tỷ USD vào ngày 4/5, với 500 triệu USD dành cho đầu tư giai đoạn đầu và 500 triệu USD cho các khoản đầu tư giai đoạn sau. Quỹ sẽ triển khai vốn trong 2 đến 3 năm tới, nhắm vào các startup tiền mã hóa và blockchain, đồng thời mở rộng

GateNews3giờ trước

Trung Quốc chặn thương vụ mua lại AI của Meta, với $2B Manus

Trung Quốc thông báo rằng họ đang chặn thương vụ mua lại trị giá 2 tỷ USD của Meta đối với công ty AI agent Manus, viện dẫn lo ngại việc chuyển giao sở hữu trí tuệ trí tuệ nhân tạo của Trung Quốc sang một công ty của Mỹ, theo tường thuật của Tech in Asia. Manus là một công ty được thành lập tại Trung Quốc đã chuyển trụ sở chính đến

CryptoFrontier15giờ trước

Nous Research ra mắt Hermes Agent v0.12.0 với hệ thống cộng tác đa tác nhân Kanban

Theo Beating, khung Hermes Agent mã nguồn mở của Nous Research đã giới thiệu hệ thống cộng tác đa tác nhân kiểu Kanban trong phiên bản v0.12.0. Hệ thống cho phép các tác nhân hoạt động như các tiến trình độc lập, tự động nhận và thực thi các tác vụ từ một bảng tác vụ dùng chung song song, thay thế

GateNews16giờ trước

Các nhà nghiên cứu triển khai công nghệ DPN-LE để chỉnh sửa các đặc điểm tính cách của AI, chỉ chỉnh sửa 0,5% số nơ-ron

Theo BlockBeats, vào ngày 3/5, nhà nghiên cứu AI Brian Roemmele đã tiết lộ rằng công ty Zero-Human của ông đã triển khai công nghệ DPN-LE (Dual Personality Neuron Localization and Editing) để điều chỉnh chính xác

GateNews05-03 14:05

AI Agent Manfred thành lập công ty, chuẩn bị ví tiền mã hóa để giao dịch trước cuối tháng 5

Tác nhân AI Manfred đã thành lập công ty của riêng mình và nhận được một ví crypto cùng các giấy tờ kinh doanh, bao gồm khả năng thuê nhân sự và thực hiện thanh toán. Tác nhân này dự kiến sẽ bắt đầu giao dịch crypto vào cuối

GateNews05-03 13:30
Bình luận
0/400
Không có bình luận