Apakah OpenClaw yang dikenal sebagai "AI pekerja" layak digunakan? Wartawan melakukan pengujian mendalam: tidak dapat menemukan file, pencarian error, mengirim email macet!

Question

Dikatakan mampu “mengambil alih komputer, membebaskan tangan” dengan alat AI Agent (AI cerdas) OpenClaw belakangan ini sangat populer di kalangan teknologi.

Ia dipuji sebagai “pekerja AI”, sepertinya cukup memberi perintah, maka ia bisa menulis artikel, mengirim email, bahkan membeli kopi untukmu. Tapi benarkah begitu? Apakah ini benar-benar alat produktivitas yang hebat, atau sekadar “mainan” bagi para penggemar teknologi yang ingin mencoba?

Baru-baru ini, wartawan Daily Economic News bersama pengembang teknologi Meijing melakukan pengujian mendalam. Kami menghubungkan OpenClaw dengan lima model besar domestik: Qwen3-Max dari Qianwen, Kimi-K2.5 dari Yuezhianan, MiniMax-M2.1, MiniMax-M2.5, dan GLM-4.7 dari Zhipu, serta GPT-5-mini dari OpenAI, dan meminta mereka menyelesaikan pencarian file lokal, pencarian data online, penulisan naskah, pengiriman email, dan lain-lain, untuk mengungkap kemampuan sebenarnya dari “komandan” ini.

Hasil pengujian menunjukkan, beberapa model berkinerja kurang baik, terutama di bagian yang membutuhkan kendali browser, seperti pencarian online dan pengiriman email, yang sebagian besar gagal. Para ahli menyatakan, OpenClaw saat ini tidak hanya sulit digunakan dan mahal, tetapi juga menjadi mimpi buruk dari segi keamanan.

Perbandingan Pengujian: GPT-5, MiniMax, Zhipu menyelesaikan tugas, dua model besar lainnya “kurang aksi”

OpenClaw sendiri bukan model besar, melainkan lebih seperti “komandan” yang bertugas menerima instruksi pengguna, memanggil alat, dan mengatur proses, kemudian menerjemahkan instruksi dan mengerjakan tugas secara eksternal melalui model besar yang terhubung.

Oleh karena itu, kemampuan, stabilitas, dan cara ekspresi model besar yang terhubung menentukan keberhasilan akhir dari tugas tersebut.

Model besar yang didukung OpenClaw saat ini (sumber gambar: antarmuka konfigurasi OpenClaw)

Untuk mendekati kondisi kerja nyata wartawan, penguji menetapkan sebuah tugas komprehensif:

Meminta OpenClaw yang terhubung dengan berbagai model besar untuk menemukan catatan wawancara singkat tentang “Bapak Mobil Listrik” Andy Palmer di komputer, kemudian merangkum isi naskah tersebut, dan menggabungkan data dari pencarian online untuk menulis artikel wawancara, lalu mengirimkan artikel tersebut ke email yang ditentukan.

Tugas ini mencakup pemahaman instruksi, pengoperasian komputer untuk pencarian file lokal, pengendalian browser untuk pencarian data online, pengolahan informasi dan penulisan artikel, serta pengendalian aplikasi.

Pada pengujian pertama, performa setiap model sangat berbeda.

● OpenClaw + Qwen3-Max

Pengujian pertama dilakukan dengan model Qwen3-Max. Model ini mengalami kesulitan saat pencarian file lokal. Meski penguji memberi petunjuk lokasi file di komputer, Qwen3-Max setelah sekitar 5 menit pencarian tetap tidak bisa menemukan secara akurat.

Saat pengujian terpisah untuk pengiriman email, Qwen3-Max juga gagal menjalankan tugas tersebut, hanya mengulang perintah tanpa tindakan nyata.

● OpenClaw + Kimi-K2.5

Kimi-K2.5 sedikit lebih baik, berhasil menemukan file dalam 5 menit dan merangkum isinya. Tapi saat melakukan pencarian data online dan menambah informasi terbaru industri, karena muncul “429 error” (biasanya berarti permintaan terlalu sering), proses pencarian gagal.

Pada bagian pengiriman email, Kimi-K2.5 tidak mampu mengendalikan browser untuk mengirim email ke alamat tertentu.

● OpenClaw + MiniMax-M2.1

MiniMax-M2.1 tidak mengalami hambatan berarti dalam pencarian file, pencarian data online, dan penulisan. Saat pengiriman email, kendala muncul saat mengendalikan browser, tetapi bukan berarti berhenti total, melainkan memberi solusi alternatif.

Penguji mengikuti saran tersebut secara manual, dan berhasil mengatasi masalah, sehingga akhirnya email terkirim.

Namun, email yang dikirim MiniMax-M2.1 hanya berisi “kutipan kunci” dari naskah, tanpa isi lengkap.

● OpenClaw + MiniMax-M2.5

Walaupun sama dari keluarga MiniMax, model MiniMax-M2.5 yang dirilis 12 Februari tampil lebih baik dari M2.1, tidak hanya berhasil melakukan pencarian file, pencarian data online, dan penulisan, tetapi juga mengirim email tanpa intervensi manusia.

● OpenClaw + GLM-4.7 dari Zhipu

Karena OpenClaw belum terhubung dengan model terbaru GLM-5 dari Zhipu yang dirilis 12 Februari, pengujian kali ini memakai GLM-4.7.

Hasilnya, saat pengiriman email, GLM-4.7 kadang memasukkan alamat email yang salah di browser, menyebabkan gagal akses halaman, dan perlu diingatkan secara manual untuk diperbaiki.

Selain itu, GLM-4.7 cukup cepat dalam proses lainnya.

● OpenClaw + GPT-5-mini

GPT-5-mini menunjukkan performa yang cukup stabil dan lancar. Dari pencarian file, merangkum isi, pencarian online, menambah data, hingga pengiriman email, hampir tidak memerlukan intervensi manusia, hanya kadang-kadang mengalami koneksi internet tidak stabil.

Agar pengujian lebih ketat, penguji melakukan pengulangan pengujian dua kali.

Hasil pengujian putaran kedua:

● Kimi-K2.5: berhasil mencari dan membaca file lokal, menambah data dari pencarian online, tetapi masih gagal di bagian pengiriman email. Laporan error menunjukkan masalah saat membaca kode jaringan email dan mendapatkan elemen input.

● Qwen3-Max: berhasil membaca file dan menambah data online, tetapi mengalami lag saat pengiriman email, dan gagal.

● MiniMax-M2.1/2.5: menyelesaikan seluruh proses tugas.

● GLM-4.7: menyelesaikan seluruh proses tugas.

● GPT-5-mini: menyelesaikan seluruh proses tugas.

Putaran ketiga pengujian:

● Kimi-K2.5: berhasil mencari dan membaca file lokal, tapi mengalami masalah saat pencarian data online (kesalahan saat membaca isi web, URL yang salah, tidak memahami perintah di konsol browser), dan masih gagal di pengiriman email.

● Qwen3-Max: berhasil membaca file, tetapi tidak bisa mengendalikan browser untuk pencarian data online, dan gagal di pengiriman email.

● MiniMax-M2.1/2.5: menyelesaikan seluruh proses tugas.

● GLM-4.7: menyelesaikan seluruh proses tugas.

● GPT-5-mini: menyelesaikan seluruh proses tugas.

Pandangan industri: Kapabilitas OpenClaw sangat bergantung pada kemampuan model besar, belum menjadi alat produktivitas yang layak

Kesimpulan pengujian ini juga didukung oleh banyak pihak di industri.

Seorang programmer yang menggunakan OpenClaw untuk membantu mengelola toko online, mendesain poster dan materi promosi lainnya, mengatakan kepada Meijing, dia biasanya menghubungkan OpenAI Codex-5.3 dan Gemini 3 Pro, hasilnya jauh lebih baik daripada model domestik.

Beberapa profesional dan pengguna berpengalaman menyatakan, OpenClaw lebih seperti “kerangka tugas”, performanya sangat tergantung pada kemampuan model besar yang terhubung. Seperti komandan yang instruksinya jelas tapi kemampuan terbatas, kekuatan “pasukan” (model besar) yang dipimpin langsung menentukan kemenangan atau kekalahan misi.

Direktur riset Fanchuang, Huan Jiachen, mengatakan kepada Meijing, “Pengaruh model terhadap OpenClaw sebenarnya tergantung tingkat kompleksitas tugas. Model besar internasional punya batas kemampuan lebih tinggi, tapi untuk tugas biasa, model domestik seperti Zhipu GLM-4.7 dan Kimi-K2.5 sudah cukup bagus, apalagi Claude terlalu mahal dan tidak mampu bayar.”

Meskipun beberapa model besar menunjukkan potensi menjalankan tugas kompleks dalam pengujian, OpenClaw tampaknya masih jauh dari menjadi alat produktivitas yang benar-benar memadai.

“Menurut saya, versi saat ini dari OpenClaw belum layak disebut alat produktivitas,” kata Zhang He, mantan ahli produk AI di Xiaomi OS dan pendiri ExcelMaster.ai yang berfokus pada aplikasi AI luar negeri, dalam wawancara dengan Meijing. OpenClaw sebagian besar adalah “kover” dari alat programmer yang dulu viral, Claude Code dari Anthropic, meski sudah dikemas lebih baik lewat antarmuka chat dan skill bawaan, tapi inti kemampuannya belum melampaui. “Saya tidak menemukan banyak hal yang bisa dilakukan OpenClaw yang tidak bisa dilakukan Claude Code. Selain itu, kemampuan pencarian data-nya juga tidak sebaik Claude Code.”

“Kalau kemampuan model besar meningkat lagi, OpenClaw akan semakin baik dan semakin umum digunakan. Bahkan jika ia tidak melakukan apa-apa, selama model besar yang lebih baik muncul… Tingkat kesulitan penggunaan OpenClaw akan berkurang,” tegas Zhang He. Ia menambahkan, kemajuan dan penyebaran OpenClaw pada dasarnya menunggu terobosan teknologi model besar di bawahnya.

Akamai, manajer produk cloud dan AI, juga menyampaikan pandangan serupa. Menurutnya, agar OpenClaw benar-benar bisa digunakan untuk produksi, perlu pengembangan dan penyesuaian lebih lanjut, karena versi saat ini masih “agak belum matang, sering mengalami lag.”

Tingkat kesulitan tinggi, biaya mahal, dan risiko tinggi membuat pengguna awam enggan mencoba

Selain ketergantungan pada kemampuan model besar, faktor tingkat teknis, biaya penggunaan, dan risiko keamanan membuat OpenClaw saat ini sulit diakses pengguna umum.

Pertama, dari segi instalasi dan penggunaan, OpenClaw belum menyediakan solusi “satu klik” yang sederhana. Pengguna harus melakukan konfigurasi lokal melalui command line, mengelola dependensi, dan mengatur izin. Meijing menyatakan, proses ini membutuhkan latar belakang teknis tertentu, setidaknya pengalaman pengembangan dasar, yang tentu saja menghalangi sebagian besar non-teknisi. Meski vendor cloud seperti Alibaba Cloud, Tencent Cloud, dan Amazon menawarkan layanan deployment cloud OpenClaw yang diklaim mudah di server mereka, OpenClaw yang dijalankan di cloud tidak bisa mengendalikan komputer lokal pengguna.

Biaya tinggi juga menjadi masalah nyata. Karena OpenClaw saat menjalankan tugas harus sering memanggil model besar, konsumsi token sangat besar, seperti “token pembakar”. Seorang pengguna mengatakan, saat berinteraksi dengan Zhipu GLM-4.7 sebanyak lebih dari 20 kali, menghabiskan sekitar 200 yuan.

Zhang Lu juga menyebutkan, menggunakan model DeepSeek satu hari bisa menghabiskan puluhan yuan. Jika beralih ke model yang lebih kuat, tagihannya bisa jauh lebih besar, “hanya dalam satu hari bisa ratusan yuan.”

Biaya tinggi ini memaksa banyak pengguna memilih model gratis atau lebih murah, tetapi ini mempengaruhi performa nyata OpenClaw. Ada pengguna yang mengeluh, karena biaya, mereka memilih Qwen-8B, tetapi OpenClaw hanya bisa menjawab tanpa bisa melakukan aksi.

Lebih mengkhawatirkan lagi adalah risiko keamanan internal. OpenClaw dirancang untuk “melakukan tugas” bukan sekadar “ngobrol”, yang berarti harus mendapatkan izin sistem tinggi agar bisa mengendalikan file dan aplikasi lokal.

Amy Chang, kepala tim riset ancaman dan keamanan AI Cisco, menyatakan, “Dari sudut pandang keamanan, OpenClaw ‘mimpi buruk’, karena bisa menjalankan perintah shell, membaca dan menulis file, serta menjalankan skrip di komputer pengguna secara sembarangan. Hak akses tinggi ini, jika salah dikonfigurasi atau disalahgunakan, konsekuensinya bisa sangat buruk.”

Pendiri Dvuln, Jamieson O’Reilly, juga mengungkapkan risiko ini. Ia menemukan celah di OpenClaw, yang memungkinkan penyerang mengakses pesan pribadi, kredensial akun, API key, dan data sensitif lainnya selama berbulan-bulan. Lebih menakutkan lagi, data rekening bank, dompet cryptocurrency, API, dan informasi sensitif lain yang disimpan pengguna untuk memudahkan AI menjalankan tugas, bisa disimpan dalam file plaintext, dan jika diretas, “mereka bisa langsung menguras saldo dalam sekejap.”

Pengembang OpenClaw, Peter Steinberger, juga mengakui bahwa ini hanyalah proyek open-source amatir gratis, dan pengguna harus melakukan konfigurasi cermat agar aman. Ia menegaskan, “Ini tidak cocok untuk pengguna non-teknis.”

Lihat Asli

Apakah OpenClaw yang dikenal sebagai "AI pekerja" layak digunakan? Wartawan melakukan pengujian mendalam: tidak dapat menemukan file, pencarian error, mengirim email macet!

Topik Trending

GateSquare$50KRedPacketGiveaway

TrumpAnnouncesNewTariffs

WhenisBestTimetoEntertheMarket

CLARITYActAdvances

GateSpringFestivalHorseRacingEvent

Hot Gate Fun

复工牛马

假期结束复工

CNM

纯牛马初八要上班

$USDPEPE

$USDPEPE

通通

通通AI社交

ZZX

猪猪侠

Sematkan