Có phải OpenClaw, được gọi là "người lao động AI", có đáng để dùng không? Phóng viên đã thử nghiệm sâu: không thể tìm thấy tệp, tìm kiếm báo lỗi, gửi email bị treo!

Chỉ huy AI Agent (trợ lý trí tuệ nhân tạo) OpenClaw, được ca ngợi là có thể “tiếp quản máy tính, giải phóng đôi tay”, gần đây đã gây sốt trong giới công nghệ.

Nó được tán dương là “người lao động AI”, dường như chỉ cần ra lệnh là có thể giúp bạn viết bài, gửi email thậm chí mua cà phê. Nhưng thực tế có đúng như vậy không? Nó là công cụ tăng năng suất thần kỳ, hay chỉ là “đồ chơi” để các kỹ thuật viên đam mê thử nghiệm?

Gần đây, phóng viên của Báo Kinh tế Thường nhật phối hợp cùng các kỹ sư của Mục tiêu Công nghệ đã tiến hành một thử nghiệm sâu. Chúng tôi đã kết nối OpenClaw với năm mô hình lớn nội địa gồm千问Qwen3-Max, 月之暗面Kimi-K2.5, MiniMax-M2.1, MiniMax-M2.5 và 智谱GLM-4.7, cùng với GPT-5-mini của OpenAI, yêu cầu chúng hoàn thành các bước tìm kiếm tài liệu trong máy, tra cứu dữ liệu trên mạng, viết bài, gửi email, nhằm khám phá thực lực thực sự của “người chỉ huy” này.

Kết quả thử nghiệm cho thấy, một số mô hình hoạt động không tốt, đặc biệt là ở các phần cần thao tác trình duyệt như tìm kiếm trên mạng và gửi email, phần lớn đều thất bại. Có chuyên gia nhận định thẳng thắn, hiện tại OpenClaw không chỉ khó dùng, tốn kém mà còn là một “ác mộng” về an ninh.

So sánh thử nghiệm: GPT-5, MiniMax, 智谱 hoàn thành nhiệm vụ, hai mô hình còn lại “hành động” kém hơn

OpenClaw không phải là mô hình lớn, nó giống như một “người chỉ huy”, nhận lệnh của người dùng, gọi công cụ và tổ chức quy trình, sau đó hiểu lệnh và giao nhiệm vụ cụ thể cho các mô hình lớn bên ngoài mà nó kết nối.

Vì vậy, khả năng, độ ổn định và cách thể hiện của các mô hình lớn được kết nối quyết định thành công hay thất bại của nhiệm vụ.

Hiện tại, các mô hình lớn mà OpenClaw hỗ trợ (nguồn ảnh: giao diện cấu hình của OpenClaw)

Để gần gũi hơn với thực tế công việc của phóng viên, nhóm thử nghiệm đã đặt ra một nhiệm vụ tổng hợp:

Cho OpenClaw kết nối với các mô hình lớn khác nhau, tìm trong máy tính bản ghi nhanh cuộc phỏng vấn “cha đẻ xe điện” Andy Palmer, yêu cầu nó tóm tắt nội dung, sau đó dựa trên dữ liệu tìm được trên mạng, viết một bài báo phỏng vấn, cuối cùng gửi bài qua email đến địa chỉ chỉ định.

Nhiệm vụ này bao gồm nhiều khía cạnh như hiểu lệnh, thao tác máy tính để tìm kiếm tài liệu cục bộ, thao tác trình duyệt để tra cứu thông tin mạng, tổng hợp dữ liệu, viết bài và điều khiển ứng dụng.

Trong lần thử đầu tiên, hiệu suất của các mô hình thể hiện rõ rệt sự khác biệt.

OpenClaw + 千问Qwen3-Max

Đầu tiên thử với mô hình 千问Qwen3-Max. Mô hình này gặp khó khăn ngay ở bước tìm kiếm tài liệu trong máy. Dù nhóm thử đã rõ ràng chỉ ra vị trí file trong máy, Qwen3-Max sau khoảng 5 phút vẫn không thể định vị chính xác.

Trong lần thử riêng về gửi email sau đó, Qwen3-Max cũng không thành công, chỉ lặp lại lệnh liên tục mà không có hành động thực tế.

OpenClaw + 月之暗面Kimi-K2.5

Kimi-K2.5 hoạt động tốt hơn chút, trong vòng 5 phút đã thành công tìm kiếm file và tóm tắt nội dung. Tuy nhiên, khi thực hiện tra cứu mạng để cập nhật các tin nóng ngành, do gặp lỗi “429” (thường là quá nhiều yêu cầu), không thể hoàn tất việc tìm kiếm thông tin.

Trong phần gửi email, Kimi-K2.5 không thể thao tác trình duyệt gửi email đến hộp thư chỉ định.

OpenClaw + MiniMax-M2.1

MiniMax-M2.1 không gặp nhiều trở ngại trong tìm kiếm file, tra cứu mạng và viết bài. Ở phần gửi email, gặp khó khăn trong thao tác trình duyệt, nhưng không bị kẹt mà chủ động đề xuất giải pháp khả thi.

Sau khi nhóm thử hướng dẫn thủ công theo đề xuất, vấn đề được giải quyết, cuối cùng có thể gửi email.

Tuy nhiên, email do MiniMax-M2.1 gửi chỉ chứa “dẫn ý chính” của bài, chưa có toàn bộ nội dung.

OpenClaw + MiniMax-M2.5

Dù đều thuộc dòng MiniMax, nhưng MiniMax-M2.5 ra mắt ngày 12/2 thể hiện tốt hơn MiniMax-M2.1, không chỉ hoàn thành tốt các bước tìm kiếm, tra cứu, viết bài mà còn gửi email mà không cần can thiệp thủ công.

OpenClaw + 智谱GLM-4.7

Vì OpenClaw chưa tích hợp mô hình mới nhất GLM-5 của 智谱 ra ngày 12/2, nên lần này chọn thử GLM-4.7.

Kết quả cho thấy, trong phần gửi email, GLM-4.7 nhập sai địa chỉ email trong trình duyệt, dẫn đến lỗi truy cập trang web, cần người dùng nhắc nhở sửa. Ngoài ra, các phần khác xử lý khá nhanh.

OpenClaw + GPT-5-mini

GPT-5-mini thể hiện ổn định và mượt mà hơn. Từ tìm kiếm, tóm tắt nội dung, tra cứu mạng, bổ sung dữ liệu đến gửi email, gần như không cần can thiệp hay nhắc nhở, chỉ đôi chỗ gặp lỗi kết nối mạng không ổn định.

Để đảm bảo tính chính xác của thử nghiệm, nhóm thử đã thực hiện hai lần kiểm tra lại toàn bộ quy trình.

Kết quả lần thứ hai:

● Kimi-K2.5: thành công tìm kiếm và đọc file cục bộ, bổ sung dữ liệu mạng, nhưng vẫn thất bại ở phần gửi email. Báo lỗi cho biết gặp vấn đề khi đọc mã mạng của hộp thư, lấy các nút nhập liệu.

● 千问Qwen3-max: thành công đọc file và bổ sung dữ liệu mạng, nhưng gặp trục trặc rõ rệt khi gửi email, chưa thành công;

● MiniMax-M2.1/2.5: hoàn thành toàn bộ quy trình nhiệm vụ.

● 智谱GLM-4.7: hoàn thành toàn bộ quy trình nhiệm vụ.

● GPT-5-mini: hoàn thành toàn bộ quy trình nhiệm vụ.

Kết quả lần thứ ba:

● Kimi-K2.5: thành công tìm kiếm và đọc file cục bộ, gặp lỗi trong phần tra cứu mạng (lỗi đọc nội dung trang web, truy cập sai đường dẫn, không hiểu lệnh điều khiển trình duyệt), vẫn thất bại ở phần gửi email.

● 千问Qwen3-max: thành công đọc file, nhưng không thể thao tác trình duyệt để tra cứu mạng, gửi email vẫn thất bại.

● MiniMax-M2.1/2.5: hoàn thành toàn bộ quy trình.

● 智谱GLM-4.7: hoàn thành toàn bộ quy trình.

● GPT-5-mini: hoàn thành toàn bộ quy trình.

Quan điểm ngành: Khả năng của OpenClaw phụ thuộc vào mô hình lớn, chưa trở thành công cụ tăng năng suất đủ tiêu chuẩn

Các kết quả thử nghiệm này cũng được các chuyên gia trong ngành xác nhận rộng rãi.

Một lập trình viên dùng OpenClaw để hỗ trợ vận hành shop online, thiết kế poster, phiếu giảm giá và vật liệu quảng cáo cho biết với Mục tiêu Công nghệ, hiệu quả tốt hơn nhiều so với các mô hình nội địa.

Nhiều chuyên gia và người dùng lâu năm nhận định, OpenClaw giống như một “khung nhiệm vụ”, hiệu quả cuối cùng phụ thuộc lớn vào khả năng của mô hình lớn kết nối. Giống như một người chỉ huy rõ ràng nhưng năng lực hạn chế, binh sĩ (tức mô hình lớn) mạnh yếu quyết định thắng bại của chiến dịch.

Chuyên gia nghiên cứu sản phẩm của Vân Gia Thần, ông Huan Jiachen, nói với Mục tiêu: “Ảnh hưởng của mô hình đối với OpenClaw thực ra phụ thuộc vào độ phức tạp của nhiệm vụ. Các mô hình lớn hàng đầu quốc tế có giới hạn cao hơn, nhưng nếu là nhiệm vụ bình thường, các mô hình nội địa như 智谱GLM-4.7, Kimi-K2.5 đều rất tốt, cuối cùng Claude quá đắt, không đủ khả năng tài chính.

Dù một số mô hình lớn thể hiện tiềm năng thực hiện nhiệm vụ phức tạp trong thử nghiệm, nhưng OpenClaw còn xa mới trở thành công cụ tăng năng suất đủ tiêu chuẩn.

“Tôi cảm thấy, phiên bản hiện tại của OpenClaw chưa phải là một công cụ tăng năng suất đủ tiêu chuẩn,” cựu chuyên gia AI của Xiaomi OS, sáng lập công ty ứng dụng AI ra nước ngoài ExcelMaster.ai, ông Zhang He, nói thẳng trong phỏng vấn Mục tiêu, OpenClaw phần lớn là “bản sao” của công cụ lập trình từng gây sốt, Claude Code của Anthropic, dù đã đóng gói tốt hơn qua giao diện chat và kỹ năng tích hợp, nhưng về khả năng cốt lõi vẫn chưa vượt trội. “Tôi chưa thấy nhiều việc OpenClaw có thể làm mà Claude Code không làm được. Thêm nữa, khả năng tra cứu dữ liệu của nó cũng không bằng Claude Code.”

“Chờ đến khi khả năng của các mô hình lớn tiến bộ hơn chút nữa, OpenClaw sẽ ngày càng tốt hơn, ngày càng phổ biến. Dù nó không làm gì, chỉ cần chờ các mô hình lớn cập nhật… Mức độ dễ tiếp cận của OpenClaw sẽ giảm xuống,” ông Zhang nhấn mạnh, tiến bộ và phổ biến của OpenClaw về bản chất là đang chờ đợi đột phá công nghệ mô hình lớn nền tảng.

Giáo sư Zhang Lu, quản lý sản phẩm của Akamai Cloud & AI, cũng có quan điểm tương tự. Ông cho rằng, để OpenClaw thực sự dùng trong sản xuất, cần phải qua phát triển lại và tinh chỉnh, vì phiên bản hiện tại còn “chưa chín chắn, nhiều lúc sẽ bị treo”.

Chìa khóa là: Chi phí cao, rủi ro lớn, gây khó dễ cho người dùng phổ thông

Ngoài việc phụ thuộc vào khả năng của mô hình lớn, các yếu tố như trình độ kỹ thuật, chi phí sử dụng và rủi ro an ninh nội tại khiến OpenClaw hiện khó tiếp cận người dùng phổ thông.

Trước tiên là yêu cầu về kỹ năng triển khai và sử dụng cao. Hiện tại, OpenClaw chưa cung cấp giải pháp “cài đặt một click” đơn giản, người dùng phải thao tác qua dòng lệnh trên máy tính, hoàn tất cấu hình cục bộ, quản lý phụ thuộc và thiết lập quyền. Các kỹ sư của Mục tiêu cho biết, toàn bộ quá trình này đòi hỏi nền tảng kỹ thuật nhất định, ít nhất phải có kinh nghiệm phát triển cơ bản, điều này rõ ràng khiến phần lớn người không chuyên kỹ thuật bị loại khỏi cuộc chơi. Dù các nhà cung cấp đám mây như Alibaba Cloud, Tencent Cloud, Amazon Cloud đều cung cấp dịch vụ triển khai OpenClaw trên đám mây, dễ dàng cài đặt trên máy chủ đã cấu hình sẵn, nhưng OpenClaw chạy trên đám mây không thể thao tác điều khiển máy tính cục bộ của người dùng.

Chi phí sử dụng cao là vấn đề thực tế khác. Do OpenClaw cần gọi mô hình lớn liên tục trong quá trình thực hiện nhiệm vụ, lượng token tiêu thụ lớn, gần như là “đốt token”. Một số người dùng cho biết, chỉ sau hơn 20 lần tương tác với mô hình 智谱GLM-4.7, đã tiêu tốn 200 nhân dân tệ.

Ông Zhang Lu cũng nói, mình dùng mô hình DeepSeek trong một ngày đã “đốt” hàng chục nhân dân tệ. Nếu nâng cấp lên mô hình mạnh hơn, hóa đơn sẽ còn cao hơn nữa, “một ngày có thể tiêu vài trăm tệ”.

Chi phí cao khiến nhiều người chỉ có thể chọn các mô hình miễn phí hoặc rẻ hơn, nhưng điều này ảnh hưởng đến hiệu quả thực tế của OpenClaw. Có người phản ánh, vì lý do chi phí, họ chọn Qwen-8B, nhưng OpenClaw chỉ trả lời chứ không thao tác.

Điều đáng lo hơn cả là rủi ro an ninh nội tại. OpenClaw được định vị là “làm việc” chứ không phải “ trò chuyện”, nghĩa là nó cần có quyền hệ thống cao để thao tác các file và ứng dụng cục bộ.

Chuyên gia an ninh mạng Amy Chang của Cisco cảnh báo, từ góc độ an ninh, OpenClaw “là cơn ác mộng”, có thể chạy lệnh shell, đọc ghi file và thực thi script trên máy tính của người dùng một cách tùy ý. Quyền cao như vậy nếu cấu hình sai hoặc bị lợi dụng bởi lệnh độc hại, hậu quả khó lường.

Nhà sáng lập công ty an ninh Dvuln, Jamieson O’Reilly, cũng xác nhận rủi ro này, phát hiện ra OpenClaw tồn tại lỗ hổng, kẻ tấn công có thể lợi dụng để lấy trộm tin nhắn riêng, thông tin tài khoản, API key trong nhiều tháng của người dùng. Thậm chí, các thông tin nhạy cảm như tài khoản ngân hàng, ví tiền mã hóa, API ví tiền đều có thể lưu trữ dưới dạng rõ ràng trong file cục bộ, và nếu bị tấn công, “chỉ trong một giây là có thể cạn sạch tài khoản”.

Peter Steinberger, nhà phát triển của OpenClaw, cũng thừa nhận đây chỉ là dự án mã nguồn mở miễn phí, dành cho người dùng kỹ thuật, cần cấu hình cẩn thận để đảm bảo an toàn. Ông rõ ràng nói: “Nó không phù hợp với người dùng không kỹ thuật.”

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim