Vì sao có người nghĩ AI sẽ thay đổi thế giới, còn người khác lại cho rằng chỉ bình thường? Hai nhận định của Karpathy

ChainNewsAbmedia

Andre j Karpathy — người đồng sáng lập đội ngũ của OpenAI, cựu giám đốc AI tại Tesla — đã đăng trên X một bài viết dài về “khoảng cách nhận thức năng lực AI”, trả lời một hiện tượng trong cộng đồng: mức độ kinh ngạc với AI bị chia đôi—một nhóm cho rằng AI đã viết lại thế giới, nhóm khác lại nghĩ AI chỉ biết bịa chuyện, nhàm chán, và bị thổi phồng quá đà. Karpathy đưa ra hai chẩn đoán, giải thích vì sao hai nhóm người này giống “hai thế giới song song”, và họ đã hiểu sai các căn cứ phán đoán của nhau. Bài viết dưới đây tổng hợp các luận điểm của ông và rút ra gợi ý cho độc giả công nghệ tại Đài Loan.

Chẩn đoán 1: Bạn đang dùng loại AI nào—thuộc năm nào, và thuộc “tầng” nào?

Quan sát đầu tiên của Karpathy rất thẳng và sắc bén: “Rất nhiều người năm ngoái dùng thử bản miễn phí của ChatGPT, và trải nghiệm đó đã định hình cách họ nhìn về AI.” Phản ứng của nhóm này thường là chế nhạo những hành vi kỳ lạ của mô hình, ảo giác, sự vụng về, và những video lan truyền rằng việc chuyển OpenAI sang chế độ giọng nói nâng cao đã bị lật kèo vì những câu hỏi đơn giản kiểu “Tôi nên lái xe đi rửa xe hay đi bộ”.

Nhưng Karpathy chỉ ra: những mô hình “bản miễn phí, bản cũ, bản bị ngừng dùng” đó hoàn toàn không phản ánh được năng lực của các mô hình agentic tiên tiến nhất vào năm 2026 (đặc biệt là OpenAI Codex và Claude Code). Nói đơn giản: bạn đem ChatGPT miễn phí năm 2024 để phán AI có viết được code hay không, chẳng khác nào đem Nokia E71 năm 2008 để đánh giá một chiếc smartphone có dùng được hay không.

Với nhiều độc giả Đài Loan, đây cũng là chuyện rất thực tế—việc đăng ký ChatGPT Plus (20 USD) vẫn khá phổ biến, nhưng người đăng ký ChatGPT Pro (200 USD), Claude Max (100 USD) thì rất hiếm. Nếu chưa từng chạy agent task ở các tier trả phí cao nhất, bạn sẽ thấy AI chủ yếu là “đồ chơi hay ho nhưng không đáng tin”; còn nếu đã chạy qua, bạn sẽ thấy AI là “cải viết lại toàn bộ quy trình làm việc”. Cùng một công nghệ, nhưng hai thế giới.

Chẩn đoán 2: Tiến bộ năng lực ở các lĩnh vực khác nhau là “bất đối xứng”

Chẩn đoán thứ hai của Karpathy còn thú vị hơn: “Dù bạn trả 200 USD mỗi tháng để dùng mô hình tiên tiến nhất, thì tiến bộ năng lực vẫn mang tính ‘đột phá theo đỉnh’, tập trung vào những lĩnh vực kỹ thuật cao.”

Ông chỉ ra: tìm kiếm, viết lách, gợi ý—những thứ kiểu “truy vấn điển hình” như vậy—không phải là lĩnh vực mà tiến bộ của AI trong vài năm gần đây diễn ra mạnh nhất. Có hai lý do:

Học tăng cường (RL) phụ thuộc vào hàm thưởng có thể kiểm chứng—viết code có tín hiệu rõ ràng kiểu “bài unit test đã pass”, còn viết lách không có tiêu chuẩn khách quan tương ứng, nên tốc độ chênh lệch của RL rất lớn

Giá trị kinh doanh lớn nhất của các công ty như OpenAI, Anthropic nằm ở các bối cảnh B2B về code/research/engineering, nên nguồn lực, nhân lực, và ưu tiên đều dồn vào các lĩnh vực đó; các use case khác không phải là nguồn sinh lợi nhuận tối đa

Nhận định này rất quan trọng—nó giải thích vì sao “AI viết code thì nhảy vọt, nhưng AI viết bài vẫn thường bình thường” lại là một hiện tượng khiến nhiều người bối rối. Không phải vì các công ty AI không làm được, mà là mỏ vàng của họ nằm ở chỗ khác, và sự chú ý cũng đi theo.

Ai chịu “cú sốc nhận thức AI” mạnh nhất? Hai điều kiện phải đồng thời thỏa

Gộp hai chẩn đoán lại, Karpathy mô tả nhóm “bị cú sốc nhận thức AI” nhiều nhất—những người đồng thời thỏa hai điều kiện:

Dùng các mô hình agentic tiên tiến nhất theo hình thức trả phí (OpenAI Codex, Claude Code)

Sử dụng chuyên sâu trong các lĩnh vực kỹ thuật cao (lập trình, toán học, nghiên cứu)

Nhóm này bị tác động mạnh bởi cái gọi là “AI Psychosis”—cách dùng từ của Karpathy—để mô tả cảm giác khi bạn tận mắt thấy LLM giải quyết các bài toán lập trình trước đó phải mất vài ngày đến vài tuần chỉ trong vài giờ: những phán đoán về năng lực AI và độ dốc (slope) sẽ khiến bạn có cái nhìn hoàn toàn khác về cục diện công nghệ trong vài năm tới.

Đối với nhóm người còn lại (không trả phí, không dùng trong lĩnh vực kỹ thuật), những lời như vậy nghe giống kiểu “quá phấn khích”, giống “ảo tưởng của nhóm nhỏ ở Silicon Valley”. Nhưng Karpathy cho rằng đó không phải ảo tưởng, mà là phán đoán thật dựa trên trải nghiệm cá nhân.

Hai nhóm “nói về thế giới của nhau”, chứ không nói chuyện với nhau

Kết luận cốt lõi của Karpathy: “Hai nhóm này nói với nhau về những gì họ thấy, chứ không phải nói với nhau.” Ông mô tả có thể cùng lúc đúng hai chuyện:

Chế độ giọng nói nâng cao của OpenAI miễn phí (và theo tôi là bị bán khai/đình trệ một phần), trên Instagram Reels sẽ làm trẹo những câu hỏi ngớ ngẩn nhất

Trong khi đó, mô hình Codex ở tier trả phí cao nhất của OpenAI sẽ dành khoảng 1 giờ để tái cấu trúc toàn bộ codebase một cách mạch lạc, hoặc tìm ra và tận dụng các lỗ hổng của hệ thống máy tính

Hai chuyện đều đúng, không mâu thuẫn. Nhưng hai nhóm chỉ thấy một phần, rồi nhìn nhau và cho rằng đối phương “quá hưng phấn” hoặc “quá thiếu hiểu biết”. Mục đích của bài viết này là bắc cầu cho khoảng cách đó.

Gợi ý cho độc giả Đài Loan: bạn thuộc nhóm nào?

Luận điểm của Karpathy đặc biệt có ý nghĩa với độc giả Đài Loan, vì ngay trong diễn đàn công nghệ Đài Loan cũng có sự phân cực tương tự: một bên là “AI đã tiếp quản”, bên kia là “chỉ là chatbot thôi”. Xác định bạn thuộc nhóm nào có thể dựa vào 3 câu hỏi tự vấn:

Lần gần đây nhất bạn tự tay đưa prompt cho mô hình tiên tiến trả phí (GPT-5.5 Pro, Claude Opus 4.7) là khi nào?

Bạn có để agent chạy hơn 30 phút và thực sự hoàn thành một tác vụ cấp sản xuất (tái cấu trúc code, viết tổng quan nghiên cứu, debug một hệ thống phức tạp) hay chưa?

Căn cứ bạn dùng để đánh giá năng lực AI đến từ báo chí, meme cộng đồng, hay từ trải nghiệm tự dùng?

Nếu bạn trả lời “có, gần đây, dùng trực tiếp” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm thứ hai như Karpathy mô tả, và có thể hiểu tốt hơn cách ông nói về “AI Psychosis”. Nếu bạn trả lời “không, đã rất lâu, xem trên truyền thông” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm đầu tiên và có thể đánh giá thấp đáng kể tốc độ tiến bộ của AI.

Không phải nói nhóm nào “đúng”, mà là nền tảng căn cứ phán đoán của các nhóm khác nhau là khác biệt mang tính căn bản. Khi bạn đọc bài tiếp theo kiểu “AI là bong bóng” hoặc “AI sẽ thay thế mọi công việc”, hãy kiểm tra trước tác giả thuộc nhóm nào, rồi mới quyết định cách đọc.

Bổ sung: “Khoảnh khắc OpenClaw” của Karpathy

Trong các bài đăng tiếp theo, Karpathy bổ sung: “Có người gần đây nói với tôi rằng, khoảnh khắc OpenClaw lại lớn như vậy vì đây là một nhóm người không có nền tảng kỹ thuật, và lần đầu tiên họ tự trải nghiệm các mô hình agentic tiên tiến.” Nhận định này cho thấy: khoảng cách nhận thức không chỉ là khác nhau về mức độ, mà còn là khác nhau giữa “trải nghiệm trực tiếp” và “nghe truyền miệng”.

Với độc giả abmedia, cách làm thực dụng nhất là: chi 20 USD, đăng ký ChatGPT Plus hoặc Claude Pro trong 1 tháng, chọn một tác vụ thực tế mà bạn thật sự quan tâm (viết một báo cáo nghiên cứu, tổng hợp một phân tích tài chính, debug một dự án code), cho agent chạy trọn vẹn, rồi quay lại đánh giá ý nghĩa của AI đối với công việc của bạn. Làm vậy còn hữu ích hơn đọc 100 bài tin tức về AI.

Bài viết này: Vì sao có người thấy AI thay đổi thế giới, có người lại thấy nó bình thường? Hai chẩn đoán của Karpathy lần đầu tiên xuất hiện tại chuỗi tin tức ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

ChatGPT ra mắt Excel và Google Sheets: GPT-5.5 đăng nhập trực tiếp vào bảng tính, Copilot và Gemini đối đầu ba bên

OpenAI ra mắt tiện ích ChatGPT for Excel và ChatGPT for Google Sheets, sử dụng công nghệ GPT-5.5, cốt lõi là vừa làm vừa giải thích. Tính năng bao gồm phân tích, tự động viết công thức, cập nhật bảng dữ liệu và diễn giải chi tiết từng bước quá trình suy luận, giúp người dùng có thể trực tiếp thao tác và hiểu ngay trong bảng tính. Cùng với Copilot và Gemini mở ra cuộc cạnh tranh ba bên, đánh dấu cục diện mới cho AI nâng cao năng suất doanh nghiệp; người dùng tại Đài Loan cần cài đặt qua AppSource/Workspace Marketplace và lưu ý quyền riêng tư dữ liệu cũng như liệu có cần ChatGPT Plus hay không.

ChainNewsAbmedia18phút trước

Google Chrome Tự động Tải xuống Mô hình AI 4GB vào ngày 6 tháng 5 mà không có Sự đồng ý của người dùng

Theo Tom's Hardware, nhà nghiên cứu bảo mật Alexander Hanff cho biết Google Chrome lặng lẽ tải xuống khoảng 4GB tệp mô hình AI có tên “weights.bin” lên các thiết bị đủ điều kiện vào ngày 6/5 mà không có thông báo hoặc sự đồng ý rõ ràng từ người dùng. Tệp này, dựa trên Gemini Nano, cung cấp sức mạnh cho các tính năng AI chạy cục bộ.

GateNews23phút trước

CEO Ripple Bác Bỏ Câu Chuyện AI Sa Thải Việc Làm Giữa Làn Sóng Sa Thải của Coinbase

CEO Ripple thúc đẩy câu chuyện AI như động lực tăng trưởng CEO Ripple Brad Garlinghouse bác bỏ quan điểm cho rằng trí tuệ nhân tạo chủ yếu là công cụ để cắt giảm việc làm, khi nói chuyện với CoinDesk tại Consensus Miami 2026. “Việc vẽ AI như một kẻ chuyên gây sợ hãi là một sự sai lầm,” Garlinghouse nói, định vị công nghệ là một

CryptoFrontier30phút trước

Stockcoin.ai hoàn tất vòng gọi vốn Seed do Amber Group dẫn dắt

Theo thông báo chính thức, Stockcoin.ai, một nền tảng giao dịch tương lai cho cổ phiếu và crypto được dẫn dắt bởi AI, đã hoàn tất vòng gọi vốn seed do Amber Group dẫn dắt, với sự tham gia của các nhà đầu tư thiên thần trong lĩnh vực crypto và tài chính truyền thống. Nền tảng tập trung vào việc kết nối dữ liệu trên chuỗi với vốn cổ phần và m

GateNews1giờ trước

Người dùng hoạt động hàng tháng của ứng dụng Claude tăng 658% lên 85,79 triệu trong 1 năm, lượt tải tăng 2.321%

Theo dữ liệu Similarweb do Beating theo dõi, các chỉ số theo năm của Claude App trong tháng 4 cho thấy mức tăng trưởng đáng kể: người dùng hoạt động hàng tháng (MAU) tăng từ 11,31 triệu một năm trước lên 85,79 triệu, tương ứng tăng 658%; lượt tải xuống trên cửa hàng ứng dụng tăng vọt từ 920.000 lên 22,3 triệu, tương ứng tăng 2321%.

GateNews1giờ trước

Chủ tịch OpenAI điều trần rằng Musk đã tìm cách giành toàn quyền và $800B cho thuộc địa sao Hỏa vào ngày 5/5

Theo lời khai của Chủ tịch OpenAI Greg Brokeman vào ngày 5 tháng 5 trong tuần thứ hai của phiên tòa tại California, Elon Musk trước đó đã ủng hộ việc chuyển OpenAI thành một công ty vì lợi nhuận và yêu cầu nắm quyền kiểm soát hoàn toàn đối với tổ chức. Brokeman cho biết Musk viện dẫn nhu cầu huy động 8 tỷ USD để

GateNews1giờ trước
Bình luận
0/400
Không có bình luận