Báo cáo này do Tiger Research biên soạn, để đạt được tự chủ thực sự trong tự động hóa, cần có khả năng thanh toán gốc. Thị trường đã bắt đầu tích cực chuẩn bị cho sự chuyển đổi này.
Các điểm chính
Chủ thể thanh toán đang chuyển từ con người sang AI Agent, điều này khiến hạ tầng thanh toán trở thành yêu cầu cốt lõi để đạt được tự chủ thực sự.
Các tập đoàn công nghệ lớn (bao gồm Google AP2 và OpenAI Delegated Payment) đang thiết kế hệ thống thanh toán tự động dựa trên phê duyệt trên nền tảng hạ tầng hiện có.
Tiền mã hóa thông qua các tiêu chuẩn ERC-8004 và x402 sử dụng nhận dạng dựa trên NFT và hợp đồng thông minh để thực hiện mô hình thanh toán phi trung gian.
Các tập đoàn công nghệ lớn ưu tiên sự tiện lợi và bảo vệ người tiêu dùng, trong khi tiền mã hóa nhấn mạnh quyền chủ quyền của người dùng và khả năng thực thi cấp độ Agent rộng hơn.
Các vấn đề then chốt trong tương lai là: Thanh toán do nền tảng kiểm soát hay do giao thức mở thực thi.
1. Thanh toán không còn là đặc quyền của con người
Nguồn: macstories (Feder1C0 Viticci)
Gần đây, “OpenClaw” đã thu hút sự chú ý rộng rãi. Khác với các hệ thống AI chính như ChatGPT hay Gemini, vốn chủ yếu thu thập và tổ chức thông tin, OpenClaw cho phép AI Agent trực tiếp thực thi nhiệm vụ trên máy tính hoặc máy chủ của người dùng.
Thông qua các nền tảng nhắn tin tức thời như WhatsApp, Telegram và Slack, người dùng có thể gửi lệnh, sau đó Agent tự chủ thực hiện các nhiệm vụ, bao gồm quản lý email, phối hợp lịch và duyệt web.
Vì nó hoạt động như phần mềm mã nguồn mở và không bị ràng buộc vào nền tảng cụ thể nào, OpenClaw giống như một trợ lý AI cá nhân. Kiến trúc này được ưa chuộng nhờ tính linh hoạt và quyền kiểm soát của người dùng.
Tuy nhiên, vẫn còn một hạn chế then chốt. Để AI Agent có thể hoàn toàn tự chủ, chúng phải có khả năng thực hiện thanh toán. Hiện tại, Agent có thể tìm kiếm sản phẩm, so sánh lựa chọn và thêm hàng vào giỏ, nhưng việc phê duyệt thanh toán cuối cùng vẫn cần sự chấp thuận của con người.
Lịch sử cho thấy, hệ thống thanh toán được thiết kế xung quanh chủ thể là con người. Trong môi trường do AI Agent điều khiển, giả định này không còn phù hợp nữa. Nếu tự động hóa muốn trở nên hoàn toàn tự chủ, Agent phải có khả năng đánh giá, phê duyệt và hoàn tất giao dịch một cách độc lập trong phạm vi các giới hạn đã định.
Nhận thức được sự chuyển đổi này, các tập đoàn công nghệ lớn và các dự án gốc mã hóa đã ra mắt các khung công nghệ nhằm hướng tới thanh toán cấp Agent trong vòng một năm qua.
2. Các tập đoàn công nghệ lớn: xây dựng thanh toán Agent dựa trên hạ tầng hiện có
Tháng 1 năm 2025, Google ra mắt AP2 (Giao thức Thanh toán Agent 2.0), mở rộng hạ tầng thanh toán AI Agent của họ. Mặc dù OpenAI và Amazon cũng đã đề cập các sáng kiến liên quan, nhưng Google là doanh nghiệp lớn duy nhất hiện có khung thực thi có cấu trúc rõ ràng.
AP2 chia quá trình giao dịch thành ba tầng ủy quyền (Mandate Layers). Cấu trúc này cho phép giám sát và kiểm toán độc lập từng giai đoạn.
Ủy quyền ý định (Intent Mandate): ghi lại các thao tác người dùng muốn thực hiện.
Ủy quyền giỏ hàng (Cart Mandate): xác định cách thực hiện mua hàng theo các quy tắc đã định.
Ủy quyền thanh toán (Payment Mandate): thực hiện chuyển tiền thực tế.
Ví dụ: Giả sử Ekko yêu cầu AI Agent trên Google Shopping “tìm và mua một chiếc áo khoác mùa đông dưới 200 USD”.
Ủy quyền ý định: Ekko chỉ thị AI Agent mua “một chiếc áo khoác mùa đông với ngân sách tối đa 200 USD”. Thông tin này được ghi nhận dưới dạng hợp đồng số trên chuỗi, tức là ý định đã được ủy quyền.
Ủy quyền giỏ hàng: AI Agent theo ý định, tìm kiếm các mặt hàng phù hợp từ các nhà bán hàng đối tác, thêm các mặt hàng phù hợp vào giỏ. Xác nhận giá (199 USD, phù hợp ngân sách ✓), xác nhận địa chỉ nhận hàng.
Ủy quyền thanh toán: Ekko xem xét các mặt hàng đã chọn và nhấn phê duyệt. 199 USD được xử lý qua Google Pay. Hoặc, AI Agent có thể tự động hoàn tất thanh toán trong phạm vi các tham số đã định.
Trong toàn bộ quá trình, người dùng không cần nhập thêm thông tin. Google AP2 dựa vào các thông tin xác thực hiện có của người dùng (thẻ đã đăng ký trước và địa chỉ), giúp giảm rào cản gia nhập và đơn giản hóa quy trình áp dụng.
Nguồn: Google
Tuy nhiên, hiện tại Google chỉ hỗ trợ các công ty trong mạng lưới đối tác của họ để thực hiện thanh toán Agent. Do đó, phạm vi sử dụng của hệ thống này bị giới hạn trong một hệ sinh thái kiểm soát được, hạn chế khả năng tương tác rộng hơn và truy cập mở.
3. Tiền mã hóa: tự quản lý và trao đổi mở
Lĩnh vực tiền mã hóa cũng đang phát triển hạ tầng thanh toán cho AI Agent, nhưng cách tiếp cận khác biệt hoàn toàn so với các tập đoàn công nghệ lớn. Các nền tảng lớn xây dựng niềm tin trong hệ sinh thái kiểm soát, còn lĩnh vực mã hóa bắt đầu từ một câu hỏi khác: Liệu AI Agent có thể được tin tưởng mà không dựa vào nền tảng tập trung không?
Hai tiêu chuẩn cốt lõi nhằm giải quyết mục tiêu này là ERC-8004 của Ethereum và x402 của Coinbase.
Trước tiên là lớp nhận dạng (Identity Layer). AI Agent hoạt động trên blockchain cần phải có khả năng nhận diện rõ ràng. ERC-8004 đảm nhận vai trò này. Nó được phát hành dưới dạng NFT, nhưng không phải để làm tác phẩm nghệ thuật, mà là chứng chỉ NFT chứa dữ liệu nhận dạng có cấu trúc. Mỗi Token gồm ba phần:
Danh tính (Identity)
Danh tiếng (Reputation)
Xác thực (Validation)
Các thành phần này tạo thành giấy chứng nhận danh tính có thể xác thực trên chuỗi.
Về cơ chế thanh toán, x402 đóng vai trò là đường dẫn thanh toán. Được Coinbase phát triển, x402 là tiêu chuẩn thanh toán gốc mã hóa dành cho AI Agent. Nó cho phép Agent thực hiện các giao dịch tự chủ bằng stablecoin. Đặc điểm cốt lõi là thực thi hợp đồng thông minh tự động, với logic điều kiện được nhúng trực tiếp vào mã, khi điều kiện thỏa mãn, việc thanh toán có thể diễn ra mà không cần sự can thiệp của con người.
Khi ERC-8004 (nhận dạng) và x402 (thanh toán) kết hợp, AI Agent có thể xác thực đối tác và thực hiện giao dịch mà không cần dựa vào nền tảng trung tâm.
Ví dụ: Ekko ra lệnh cho Agent A của mình mua một chiếc laptop cũ với ngân sách tối đa 800 USD. Người bán là Agent B sẽ giao tiếp trực tiếp.
Xác thực lẫn nhau: qua NFT ERC-8004 kiểm tra danh tính và điểm danh tiếng (ví dụ: danh tiếng 72, xác nhận số dư).
Hợp đồng thông minh giữ tiền: 800 USD chuyển vào hợp đồng thông minh giữ hộ (Escrow), số tiền bị khóa cho đến khi xác nhận nhận hàng.
Thanh toán và cập nhật danh tiếng: sau khi giao dịch hoàn tất, x402 tự động thanh toán, và hồ sơ danh tiếng của cả hai sẽ tự cập nhật và ghi vào NFT ERC-8004 của họ.
Trong toàn bộ quá trình, không có trung gian tham gia. Hai AI Agent thực hiện giao dịch trực tiếp dựa trên xác thực và thanh toán dựa trên blockchain, thể hiện mô hình mã hóa gốc của Agent đối tác (A2A).
4. Các tập đoàn công nghệ lớn vs Tiền mã hóa: khác biệt trong lĩnh vực vận hành của AI Agent
Google AP2 đại diện cho một mô hình kiểm soát dành cho các đối tác đã được xác thực. Google giới hạn thị trường để bảo vệ người tiêu dùng. Do việc thực thi của AI Agent mang tính kết quả xác suất chứ không hoàn toàn chắc chắn, nếu xảy ra lỗi giao dịch, trách nhiệm cuối cùng có thể thuộc về nhà cung cấp hạ tầng thanh toán. Để giảm thiểu rủi ro thất bại, Google có động lực thu hẹp hệ sinh thái của mình.
Hệ sinh thái hạn chế này giúp tăng tính ổn định, nhưng cũng giới hạn khả năng vận hành tự chủ và tối ưu hóa lựa chọn của Agent trong thị trường rộng hơn.
Ngược lại, ERC-8004 và x402 phản ánh một kiến trúc mở hơn. Mô hình mã hóa hướng tới không cần phép (Permissionless) và khả năng tương tác.
Dù hiện tại việc thực thi toàn diện còn chưa hoàn hảo, tầm nhìn dài hạn là các Agent có thể tự quản lý các hoạt động tiêu dùng hàng ngày. Các nền tảng lớn có thể cố gắng tích hợp các kênh bán lẻ chính, còn tiêu chuẩn mở mã hóa có lợi thế về cấu trúc khi xử lý các khoản thanh toán nhỏ, tần suất cao (micro-payments). Ví dụ, Agent mua 1000 hình ảnh với giá 0.01 USD mỗi cái, thì đường dẫn mã hóa gốc sẽ vận hành hiệu quả hơn.
Tất nhiên, việc thiếu các tổ chức trung tâm cũng mang lại những đánh đổi: Phải xây dựng tiêu chuẩn định giá danh tính theo cách phi tập trung, và không có một thực thể duy nhất nào chịu trách nhiệm cuối cùng cho các thất bại.
Tổng kết
Các tập đoàn công nghệ lớn và lĩnh vực mã hóa đều đang theo đuổi mục tiêu chung: đạt được mô hình kinh doanh AI Agent tự chủ. Sự khác biệt nằm ở kiến trúc: các tập đoàn lớn ưa chuộng hệ thống kín, kiểm soát được, còn lĩnh vực mã hóa thúc đẩy mô hình mở, dựa trên giao thức.
Trong tương lai, khả năng cao là sẽ có sự tương tác giữa hai phương pháp này hơn là đối đầu hoàn toàn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Tiger Research:Các ông lớn trong lĩnh vực tiền mã hóa đặt cược như thế nào vào hạ tầng thanh toán AI Agent
Báo cáo này do Tiger Research biên soạn, để đạt được tự chủ thực sự trong tự động hóa, cần có khả năng thanh toán gốc. Thị trường đã bắt đầu tích cực chuẩn bị cho sự chuyển đổi này.
Các điểm chính
1. Thanh toán không còn là đặc quyền của con người
Nguồn: macstories (Feder1C0 Viticci)
Gần đây, “OpenClaw” đã thu hút sự chú ý rộng rãi. Khác với các hệ thống AI chính như ChatGPT hay Gemini, vốn chủ yếu thu thập và tổ chức thông tin, OpenClaw cho phép AI Agent trực tiếp thực thi nhiệm vụ trên máy tính hoặc máy chủ của người dùng.
Thông qua các nền tảng nhắn tin tức thời như WhatsApp, Telegram và Slack, người dùng có thể gửi lệnh, sau đó Agent tự chủ thực hiện các nhiệm vụ, bao gồm quản lý email, phối hợp lịch và duyệt web.
Vì nó hoạt động như phần mềm mã nguồn mở và không bị ràng buộc vào nền tảng cụ thể nào, OpenClaw giống như một trợ lý AI cá nhân. Kiến trúc này được ưa chuộng nhờ tính linh hoạt và quyền kiểm soát của người dùng.
Tuy nhiên, vẫn còn một hạn chế then chốt. Để AI Agent có thể hoàn toàn tự chủ, chúng phải có khả năng thực hiện thanh toán. Hiện tại, Agent có thể tìm kiếm sản phẩm, so sánh lựa chọn và thêm hàng vào giỏ, nhưng việc phê duyệt thanh toán cuối cùng vẫn cần sự chấp thuận của con người.
Lịch sử cho thấy, hệ thống thanh toán được thiết kế xung quanh chủ thể là con người. Trong môi trường do AI Agent điều khiển, giả định này không còn phù hợp nữa. Nếu tự động hóa muốn trở nên hoàn toàn tự chủ, Agent phải có khả năng đánh giá, phê duyệt và hoàn tất giao dịch một cách độc lập trong phạm vi các giới hạn đã định.
Nhận thức được sự chuyển đổi này, các tập đoàn công nghệ lớn và các dự án gốc mã hóa đã ra mắt các khung công nghệ nhằm hướng tới thanh toán cấp Agent trong vòng một năm qua.
2. Các tập đoàn công nghệ lớn: xây dựng thanh toán Agent dựa trên hạ tầng hiện có
Tháng 1 năm 2025, Google ra mắt AP2 (Giao thức Thanh toán Agent 2.0), mở rộng hạ tầng thanh toán AI Agent của họ. Mặc dù OpenAI và Amazon cũng đã đề cập các sáng kiến liên quan, nhưng Google là doanh nghiệp lớn duy nhất hiện có khung thực thi có cấu trúc rõ ràng.
AP2 chia quá trình giao dịch thành ba tầng ủy quyền (Mandate Layers). Cấu trúc này cho phép giám sát và kiểm toán độc lập từng giai đoạn.
Ví dụ: Giả sử Ekko yêu cầu AI Agent trên Google Shopping “tìm và mua một chiếc áo khoác mùa đông dưới 200 USD”.
Trong toàn bộ quá trình, người dùng không cần nhập thêm thông tin. Google AP2 dựa vào các thông tin xác thực hiện có của người dùng (thẻ đã đăng ký trước và địa chỉ), giúp giảm rào cản gia nhập và đơn giản hóa quy trình áp dụng.
Nguồn: Google
Tuy nhiên, hiện tại Google chỉ hỗ trợ các công ty trong mạng lưới đối tác của họ để thực hiện thanh toán Agent. Do đó, phạm vi sử dụng của hệ thống này bị giới hạn trong một hệ sinh thái kiểm soát được, hạn chế khả năng tương tác rộng hơn và truy cập mở.
3. Tiền mã hóa: tự quản lý và trao đổi mở
Lĩnh vực tiền mã hóa cũng đang phát triển hạ tầng thanh toán cho AI Agent, nhưng cách tiếp cận khác biệt hoàn toàn so với các tập đoàn công nghệ lớn. Các nền tảng lớn xây dựng niềm tin trong hệ sinh thái kiểm soát, còn lĩnh vực mã hóa bắt đầu từ một câu hỏi khác: Liệu AI Agent có thể được tin tưởng mà không dựa vào nền tảng tập trung không?
Hai tiêu chuẩn cốt lõi nhằm giải quyết mục tiêu này là ERC-8004 của Ethereum và x402 của Coinbase.
Trước tiên là lớp nhận dạng (Identity Layer). AI Agent hoạt động trên blockchain cần phải có khả năng nhận diện rõ ràng. ERC-8004 đảm nhận vai trò này. Nó được phát hành dưới dạng NFT, nhưng không phải để làm tác phẩm nghệ thuật, mà là chứng chỉ NFT chứa dữ liệu nhận dạng có cấu trúc. Mỗi Token gồm ba phần:
Các thành phần này tạo thành giấy chứng nhận danh tính có thể xác thực trên chuỗi.
Về cơ chế thanh toán, x402 đóng vai trò là đường dẫn thanh toán. Được Coinbase phát triển, x402 là tiêu chuẩn thanh toán gốc mã hóa dành cho AI Agent. Nó cho phép Agent thực hiện các giao dịch tự chủ bằng stablecoin. Đặc điểm cốt lõi là thực thi hợp đồng thông minh tự động, với logic điều kiện được nhúng trực tiếp vào mã, khi điều kiện thỏa mãn, việc thanh toán có thể diễn ra mà không cần sự can thiệp của con người.
Khi ERC-8004 (nhận dạng) và x402 (thanh toán) kết hợp, AI Agent có thể xác thực đối tác và thực hiện giao dịch mà không cần dựa vào nền tảng trung tâm.
Trong toàn bộ quá trình, không có trung gian tham gia. Hai AI Agent thực hiện giao dịch trực tiếp dựa trên xác thực và thanh toán dựa trên blockchain, thể hiện mô hình mã hóa gốc của Agent đối tác (A2A).
4. Các tập đoàn công nghệ lớn vs Tiền mã hóa: khác biệt trong lĩnh vực vận hành của AI Agent
Google AP2 đại diện cho một mô hình kiểm soát dành cho các đối tác đã được xác thực. Google giới hạn thị trường để bảo vệ người tiêu dùng. Do việc thực thi của AI Agent mang tính kết quả xác suất chứ không hoàn toàn chắc chắn, nếu xảy ra lỗi giao dịch, trách nhiệm cuối cùng có thể thuộc về nhà cung cấp hạ tầng thanh toán. Để giảm thiểu rủi ro thất bại, Google có động lực thu hẹp hệ sinh thái của mình.
Hệ sinh thái hạn chế này giúp tăng tính ổn định, nhưng cũng giới hạn khả năng vận hành tự chủ và tối ưu hóa lựa chọn của Agent trong thị trường rộng hơn.
Ngược lại, ERC-8004 và x402 phản ánh một kiến trúc mở hơn. Mô hình mã hóa hướng tới không cần phép (Permissionless) và khả năng tương tác.
Dù hiện tại việc thực thi toàn diện còn chưa hoàn hảo, tầm nhìn dài hạn là các Agent có thể tự quản lý các hoạt động tiêu dùng hàng ngày. Các nền tảng lớn có thể cố gắng tích hợp các kênh bán lẻ chính, còn tiêu chuẩn mở mã hóa có lợi thế về cấu trúc khi xử lý các khoản thanh toán nhỏ, tần suất cao (micro-payments). Ví dụ, Agent mua 1000 hình ảnh với giá 0.01 USD mỗi cái, thì đường dẫn mã hóa gốc sẽ vận hành hiệu quả hơn.
Tất nhiên, việc thiếu các tổ chức trung tâm cũng mang lại những đánh đổi: Phải xây dựng tiêu chuẩn định giá danh tính theo cách phi tập trung, và không có một thực thể duy nhất nào chịu trách nhiệm cuối cùng cho các thất bại.
Tổng kết
Các tập đoàn công nghệ lớn và lĩnh vực mã hóa đều đang theo đuổi mục tiêu chung: đạt được mô hình kinh doanh AI Agent tự chủ. Sự khác biệt nằm ở kiến trúc: các tập đoàn lớn ưa chuộng hệ thống kín, kiểm soát được, còn lĩnh vực mã hóa thúc đẩy mô hình mở, dựa trên giao thức.
Trong tương lai, khả năng cao là sẽ có sự tương tác giữa hai phương pháp này hơn là đối đầu hoàn toàn.