هل يستحق OpenClaw الذي يُطلق عليه "عامل الذكاء الاصطناعي"؟ مراسل يجري اختبارًا معمقًا: لا يمكن العثور على الملفات، أخطاء في البحث، توقف عند إرسال البريد الإلكتروني!
يُطلق على أداة الذكاء الاصطناعي التي تدعي “السيطرة على الكمبيوتر وتحرير اليدين” OpenClaw، والتي أصبحت حديث الساحة التقنية مؤخرًا، انتشارًا واسعًا.
يُشيد بها على أنها “عامل ذكاء اصطناعي”، ويبدو أنه بمجرد إعطائها أمرًا، يمكنها كتابة المقالات، وإرسال البريد الإلكتروني، وحتى شراء القهوة نيابة عنك. لكن هل الأمر حقًا كذلك؟ هل هي أداة لزيادة الإنتاجية، أم مجرد “لعبة” للمهووسين التقنيين لتجربتها؟
مؤخرًا، قام مراسل صحيفة “الاقتصادية اليومية” بالتعاون مع مطوري تقنية “ميديان” بإجراء اختبار معمق. قمنا بتوصيل OpenClaw بخمسة نماذج كبيرة محلية الصنع هي: 千问Qwen3-Max، 月之暗面Kimi-K2.5، MiniMax-M2.1، MiniMax-M2.5، و智谱GLM-4.7، بالإضافة إلى نموذج GPT-5-mini من OpenAI، وطلبنا منها إتمام عمليات استرجاع الملفات المحلية، البحث عبر الإنترنت، كتابة المسودات، وإرسال البريد الإلكتروني، في محاولة لكشف قدراتها الحقيقية.
أظهرت نتائج الاختبار أن بعض النماذج أدت بشكل ضعيف، خاصة في المهام التي تتطلب التحكم في المتصفح، مثل البحث عبر الإنترنت وإرسال البريد، حيث فشلت معظمها. وأكد خبراء أن النسخة الحالية من OpenClaw ليست فقط صعبة الاستخدام ومكلفة، بل تمثل أيضًا كابوسًا أمنيًا.
مقارنة الاختبارات: GPT-5، MiniMax، و智谱 أكملوا المهام، بينما النموذجان الآخران أظهرا ضعفًا في “القدرة على التحرك”
OpenClaw نفسه ليس نموذجًا كبيرًا، بل هو أشبه بـ"قائد" مسؤول عن استقبال أوامر المستخدم، واستدعاء الأدوات، وتنظيم العمليات، وفهم الأوامر وتحويلها إلى عمل فعلي يتم عبر النماذج الكبيرة المتصلة به.
وبالتالي، فإن قدرة واستقرار وطريقة التعبير للنماذج المتصلة تحدد نجاح أو فشل المهمة النهائية.
الصورة من واجهة إعداد OpenClaw التي تدعم النماذج الكبيرة الحالية
لتقريب الاختبار من سيناريو العمل الحقيقي، وضع فريق الاختبار مهمة شاملة:
تم توصيل OpenClaw بنماذج مختلفة، وطلب منه العثور على ملخص سريع لمقابلة مع “أب الرواد في السيارات الكهربائية” Andy Palmer، على جهاز الكمبيوتر، ثم تلخيص المحتوى، ودمج المعلومات من البحث عبر الإنترنت، وكتابة خبر خاص بالمقابلة، وأخيرًا إرسال الخبر عبر البريد الإلكتروني إلى عنوان معين.
هذه المهمة تتطلب فهم الأوامر، والتحكم في الملفات المحلية، والتصفح عبر الإنترنت، ودمج المعلومات، وكتابة المقالات، وإدارة العمليات، في أبعاد متعددة.
في أول اختبار، كانت نتائج النماذج متفاوتة بشكل واضح.
● OpenClaw + 千问Qwen3-Max
أولًا، تم اختبار نموذج Qwen3-Max. واجه صعوبة في استرجاع الملفات المحلية. على الرغم من أن الفريق أوضح أن الملف موجود على الجهاز، إلا أن النموذج بعد حوالي 5 دقائق من البحث لم يتمكن من تحديد الموقع بدقة.
وفي اختبار لاحق لإرسال البريد الإلكتروني، لم ينجح Qwen3-Max في التنفيذ، بل كرر الأوامر دون أن يتخذ أي إجراء فعلي.
● OpenClaw + 月之暗面Kimi-K2.5
أداء Kimi-K2.5 كان أفضل قليلًا، حيث تمكن من استرجاع الملف خلال 5 دقائق، وتلخيص المحتوى. لكن عند محاولة البحث عبر الإنترنت وإضافة أحدث أخبار الصناعة، حدث خطأ “429” (عادةً يشير إلى تكرار الطلبات بشكل مفرط)، مما أدى إلى فشل عملية البحث.
وفي مرحلة إرسال البريد، لم يتمكن Kimi-K2.5 من التحكم في المتصفح لإرسال البريد إلى العنوان المحدد.
● OpenClaw + MiniMax-M2.1
MiniMax-M2.1 لم يواجه مشاكل واضحة في استرجاع الملفات، البحث عبر الإنترنت، أو الكتابة. أما في التحكم في المتصفح لإرسال البريد، فواجه صعوبة، لكنه لم يتوقف، وقدم حلاً يدويًا.
بعد أن قام الفريق بتنفيذ الحل المقترح، نجح في إرسال البريد. لكن البريد المرسل منه كان مقتصرًا على “اقتباسات رئيسية” من النص، ولم يتضمن النص الكامل.
● OpenClaw + MiniMax-M2.5
رغم أن كلاهما من MiniMax، إلا أن MiniMax-M2.5، الذي صدر في 12 فبراير، أظهر أداءً أفضل من MiniMax-M2.1، حيث أكمل استرجاع الملفات، البحث، والكتابة بنجاح، وبدون تدخل يدوي في إرسال البريد.
● OpenClaw + 智谱GLM-4.7
نظرًا لعدم توفر النموذج الأحدث GLM-5 الذي أطلقته 智谱 في 12 فبراير، تم اختبار GLM-4.7. أظهرت النتائج أن النموذج عند إرسال البريد كان يدخل عنوان بريد خاطئ، مما يتطلب تدخل يدوي لتصحيح العنوان. بخلاف ذلك، كانت سرعته في باقي المهام جيدة.
● OpenClaw + GPT-5-mini
كان أداء GPT-5-mini أكثر استقرارًا وسلاسة. من استرجاع الملفات، والتلخيص، والبحث، وإضافة المعلومات، إلى إرسال البريد، كانت العملية تقريبًا بدون تدخل بشري، مع بعض حالات ضعف في الاتصال بالشبكة.
ولضمان دقة الاختبار، أُعيدت العملية مرتين.
النتائج في الجولة الثانية:
● Kimi-K2.5: نجح في استرجاع وقراءة الملفات المحلية، وأكمل البحث عبر الإنترنت، لكن فشل مرة أخرى في إرسال البريد، مع ظهور خطأ في قراءة رمز البريد الإلكتروني أو الحصول على عناصر النموذج.
● 千问Qwen3-max: نجح في قراءة الملفات وإضافة المعلومات، لكنه عانى من بطء شديد في إرسال البريد، ولم ينجح.
● MiniMax-M2.1/2.5: أكملت جميع المهام.
● 智谱GLM-4.7: أكملت جميع المهام.
● GPT-5-mini: أكملت جميع المهام.
وفي الجولة الثالثة، كانت النتائج كالتالي:
● Kimi-K2.5: نجح في استرجاع وقراءة الملفات، لكنه واجه مشاكل في البحث عبر الإنترنت (مثل أخطاء في قراءة محتوى الصفحات، روابط غير صحيحة، وعدم فهم أوامر وحدة التحكم في المتصفح)، وفشل مرة أخرى في إرسال البريد.
● 千问Qwen3-max: نجح في قراءة الملفات، لكنه لم يتمكن من التحكم في المتصفح للبحث عبر الإنترنت، وفشل في إرسال البريد.
● MiniMax-M2.1/2.5: أكملت جميع المهام.
● 智谱GLM-4.7: أكملت جميع المهام.
● GPT-5-mini: أكملت جميع المهام.
وجهة نظر الصناعة: قدرة OpenClaw تعتمد على النموذج الكبير، ولم يتحول بعد إلى أداة إنتاجية مؤهلة
وقد أكد العديد من الخبراء صحة هذه النتائج.
قال مبرمج يستخدم OpenClaw للمساعدة في إدارة متجر إلكتروني وتصميم مواد ترويجية، لميديان: “أنا عادة أستخدم نماذج OpenAI مثل Codex-5.3 وGemini 3 Pro، وأداءها أفضل بكثير من النماذج المحلية.”
وأشار عدد من المختصين والمستخدمين القدامى إلى أن OpenClaw أشبه بـ"إطار عمل للمهمات"، وأن أداؤه النهائي يعتمد بشكل كبير على قدرات النموذج المربوط به. مثل قائد واضح الأوامر لكن محدود القدرات، وأن قوة الجنود (أي النماذج الكبيرة) تحدد نجاح المعركة أو فشلها.
قال مسؤول البحث والتطوير في شركة “فنون الإنتاج” حون جياشين لميديان: "تأثير النموذج على OpenClaw يعتمد على مدى تعقيد المهمة. النماذج العالمية الرائدة لها حدود أعلى، لكن إذا كانت المهام عادية، فإن نماذج مثل 智谱GLM-4.7 و Kimi-K2.5 جيدة جدًا، خاصة أن Claude غالي جدًا ولا يستطيع الجميع تحمله."
رغم أن بعض النماذج أظهرت قدرات على تنفيذ مهام معقدة، إلا أن OpenClaw لا يزال بعيدًا عن أن يكون أداة إنتاجية مؤهلة.
قال Zhang He، مدير منتجات AI في شركة Akamai: “أعتقد أن النسخة الحالية من OpenClaw ليست أداة إنتاجية مؤهلة بعد.”
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
هل يستحق OpenClaw الذي يُطلق عليه "عامل الذكاء الاصطناعي"؟ مراسل يجري اختبارًا معمقًا: لا يمكن العثور على الملفات، أخطاء في البحث، توقف عند إرسال البريد الإلكتروني!
يُطلق على أداة الذكاء الاصطناعي التي تدعي “السيطرة على الكمبيوتر وتحرير اليدين” OpenClaw، والتي أصبحت حديث الساحة التقنية مؤخرًا، انتشارًا واسعًا.
يُشيد بها على أنها “عامل ذكاء اصطناعي”، ويبدو أنه بمجرد إعطائها أمرًا، يمكنها كتابة المقالات، وإرسال البريد الإلكتروني، وحتى شراء القهوة نيابة عنك. لكن هل الأمر حقًا كذلك؟ هل هي أداة لزيادة الإنتاجية، أم مجرد “لعبة” للمهووسين التقنيين لتجربتها؟
مؤخرًا، قام مراسل صحيفة “الاقتصادية اليومية” بالتعاون مع مطوري تقنية “ميديان” بإجراء اختبار معمق. قمنا بتوصيل OpenClaw بخمسة نماذج كبيرة محلية الصنع هي: 千问Qwen3-Max، 月之暗面Kimi-K2.5، MiniMax-M2.1، MiniMax-M2.5، و智谱GLM-4.7، بالإضافة إلى نموذج GPT-5-mini من OpenAI، وطلبنا منها إتمام عمليات استرجاع الملفات المحلية، البحث عبر الإنترنت، كتابة المسودات، وإرسال البريد الإلكتروني، في محاولة لكشف قدراتها الحقيقية.
أظهرت نتائج الاختبار أن بعض النماذج أدت بشكل ضعيف، خاصة في المهام التي تتطلب التحكم في المتصفح، مثل البحث عبر الإنترنت وإرسال البريد، حيث فشلت معظمها. وأكد خبراء أن النسخة الحالية من OpenClaw ليست فقط صعبة الاستخدام ومكلفة، بل تمثل أيضًا كابوسًا أمنيًا.
مقارنة الاختبارات: GPT-5، MiniMax، و智谱 أكملوا المهام، بينما النموذجان الآخران أظهرا ضعفًا في “القدرة على التحرك”
OpenClaw نفسه ليس نموذجًا كبيرًا، بل هو أشبه بـ"قائد" مسؤول عن استقبال أوامر المستخدم، واستدعاء الأدوات، وتنظيم العمليات، وفهم الأوامر وتحويلها إلى عمل فعلي يتم عبر النماذج الكبيرة المتصلة به.
وبالتالي، فإن قدرة واستقرار وطريقة التعبير للنماذج المتصلة تحدد نجاح أو فشل المهمة النهائية.
الصورة من واجهة إعداد OpenClaw التي تدعم النماذج الكبيرة الحالية
لتقريب الاختبار من سيناريو العمل الحقيقي، وضع فريق الاختبار مهمة شاملة:
تم توصيل OpenClaw بنماذج مختلفة، وطلب منه العثور على ملخص سريع لمقابلة مع “أب الرواد في السيارات الكهربائية” Andy Palmer، على جهاز الكمبيوتر، ثم تلخيص المحتوى، ودمج المعلومات من البحث عبر الإنترنت، وكتابة خبر خاص بالمقابلة، وأخيرًا إرسال الخبر عبر البريد الإلكتروني إلى عنوان معين.
هذه المهمة تتطلب فهم الأوامر، والتحكم في الملفات المحلية، والتصفح عبر الإنترنت، ودمج المعلومات، وكتابة المقالات، وإدارة العمليات، في أبعاد متعددة.
في أول اختبار، كانت نتائج النماذج متفاوتة بشكل واضح.
● OpenClaw + 千问Qwen3-Max
أولًا، تم اختبار نموذج Qwen3-Max. واجه صعوبة في استرجاع الملفات المحلية. على الرغم من أن الفريق أوضح أن الملف موجود على الجهاز، إلا أن النموذج بعد حوالي 5 دقائق من البحث لم يتمكن من تحديد الموقع بدقة.
وفي اختبار لاحق لإرسال البريد الإلكتروني، لم ينجح Qwen3-Max في التنفيذ، بل كرر الأوامر دون أن يتخذ أي إجراء فعلي.
● OpenClaw + 月之暗面Kimi-K2.5
أداء Kimi-K2.5 كان أفضل قليلًا، حيث تمكن من استرجاع الملف خلال 5 دقائق، وتلخيص المحتوى. لكن عند محاولة البحث عبر الإنترنت وإضافة أحدث أخبار الصناعة، حدث خطأ “429” (عادةً يشير إلى تكرار الطلبات بشكل مفرط)، مما أدى إلى فشل عملية البحث.
وفي مرحلة إرسال البريد، لم يتمكن Kimi-K2.5 من التحكم في المتصفح لإرسال البريد إلى العنوان المحدد.
● OpenClaw + MiniMax-M2.1
MiniMax-M2.1 لم يواجه مشاكل واضحة في استرجاع الملفات، البحث عبر الإنترنت، أو الكتابة. أما في التحكم في المتصفح لإرسال البريد، فواجه صعوبة، لكنه لم يتوقف، وقدم حلاً يدويًا.
بعد أن قام الفريق بتنفيذ الحل المقترح، نجح في إرسال البريد. لكن البريد المرسل منه كان مقتصرًا على “اقتباسات رئيسية” من النص، ولم يتضمن النص الكامل.
● OpenClaw + MiniMax-M2.5
رغم أن كلاهما من MiniMax، إلا أن MiniMax-M2.5، الذي صدر في 12 فبراير، أظهر أداءً أفضل من MiniMax-M2.1، حيث أكمل استرجاع الملفات، البحث، والكتابة بنجاح، وبدون تدخل يدوي في إرسال البريد.
● OpenClaw + 智谱GLM-4.7
نظرًا لعدم توفر النموذج الأحدث GLM-5 الذي أطلقته 智谱 في 12 فبراير، تم اختبار GLM-4.7. أظهرت النتائج أن النموذج عند إرسال البريد كان يدخل عنوان بريد خاطئ، مما يتطلب تدخل يدوي لتصحيح العنوان. بخلاف ذلك، كانت سرعته في باقي المهام جيدة.
● OpenClaw + GPT-5-mini
كان أداء GPT-5-mini أكثر استقرارًا وسلاسة. من استرجاع الملفات، والتلخيص، والبحث، وإضافة المعلومات، إلى إرسال البريد، كانت العملية تقريبًا بدون تدخل بشري، مع بعض حالات ضعف في الاتصال بالشبكة.
ولضمان دقة الاختبار، أُعيدت العملية مرتين.
النتائج في الجولة الثانية:
● Kimi-K2.5: نجح في استرجاع وقراءة الملفات المحلية، وأكمل البحث عبر الإنترنت، لكن فشل مرة أخرى في إرسال البريد، مع ظهور خطأ في قراءة رمز البريد الإلكتروني أو الحصول على عناصر النموذج.
● 千问Qwen3-max: نجح في قراءة الملفات وإضافة المعلومات، لكنه عانى من بطء شديد في إرسال البريد، ولم ينجح.
● MiniMax-M2.1/2.5: أكملت جميع المهام.
● 智谱GLM-4.7: أكملت جميع المهام.
● GPT-5-mini: أكملت جميع المهام.
وفي الجولة الثالثة، كانت النتائج كالتالي:
● Kimi-K2.5: نجح في استرجاع وقراءة الملفات، لكنه واجه مشاكل في البحث عبر الإنترنت (مثل أخطاء في قراءة محتوى الصفحات، روابط غير صحيحة، وعدم فهم أوامر وحدة التحكم في المتصفح)، وفشل مرة أخرى في إرسال البريد.
● 千问Qwen3-max: نجح في قراءة الملفات، لكنه لم يتمكن من التحكم في المتصفح للبحث عبر الإنترنت، وفشل في إرسال البريد.
● MiniMax-M2.1/2.5: أكملت جميع المهام.
● 智谱GLM-4.7: أكملت جميع المهام.
● GPT-5-mini: أكملت جميع المهام.
وجهة نظر الصناعة: قدرة OpenClaw تعتمد على النموذج الكبير، ولم يتحول بعد إلى أداة إنتاجية مؤهلة
وقد أكد العديد من الخبراء صحة هذه النتائج.
قال مبرمج يستخدم OpenClaw للمساعدة في إدارة متجر إلكتروني وتصميم مواد ترويجية، لميديان: “أنا عادة أستخدم نماذج OpenAI مثل Codex-5.3 وGemini 3 Pro، وأداءها أفضل بكثير من النماذج المحلية.”
وأشار عدد من المختصين والمستخدمين القدامى إلى أن OpenClaw أشبه بـ"إطار عمل للمهمات"، وأن أداؤه النهائي يعتمد بشكل كبير على قدرات النموذج المربوط به. مثل قائد واضح الأوامر لكن محدود القدرات، وأن قوة الجنود (أي النماذج الكبيرة) تحدد نجاح المعركة أو فشلها.
قال مسؤول البحث والتطوير في شركة “فنون الإنتاج” حون جياشين لميديان: "تأثير النموذج على OpenClaw يعتمد على مدى تعقيد المهمة. النماذج العالمية الرائدة لها حدود أعلى، لكن إذا كانت المهام عادية، فإن نماذج مثل 智谱GLM-4.7 و Kimi-K2.5 جيدة جدًا، خاصة أن Claude غالي جدًا ولا يستطيع الجميع تحمله."
رغم أن بعض النماذج أظهرت قدرات على تنفيذ مهام معقدة، إلا أن OpenClaw لا يزال بعيدًا عن أن يكون أداة إنتاجية مؤهلة.
قال Zhang He، مدير منتجات AI في شركة Akamai: “أعتقد أن النسخة الحالية من OpenClaw ليست أداة إنتاجية مؤهلة بعد.”