الميدان الحقيقي للمنافسة في الذكاء الاصطناعي الوكيلة: البنية التحتية، وليس تقييمات النماذج

robot
إنشاء الملخص قيد التقدم

المشكلة الحقيقية في تحسين الذات والتنفيذ

أعلنت Together AI في 8 أبريل أن تدريبها بعد التعلم المعزز زاد من قدرة ترميز GLM-5 بنسبة 28%. هذا حول سرد المنافسة من «تكديس المعلمات» إلى «التحسين المستمر»، لكن المشكلة هي: بدون تقييم مستقل، ومتطلبات الحوسبة تتزايد، كم هو هذا الرقم فعلاً موثوق به؟ ربما يمكن لـ AI Native Cloud الخاص بهم أن يميز نفسه في خط أنابيب الوكيل بدون خادم، لكن بصراحة، العقبة الحقيقية الحالية هي استقرار التنفيذ على طول المسار، وليس نسبة قدرات الترميز.

ظهرت خلافات واضحة حول مناقشة GLM-5:

  • المتفائلون يقولون إن «التفكير المتداخل + استدعاء الأدوات» أصبح قادرًا على تشغيل تدفقات عمل معقدة، ويستشهدون بحالة من أكثر من 600 دورة تكرارية على arXiv؛
  • لكن ما يُقلل من شأنه هو معدل التوقف المبكر في الاختبارات المرجعية: أظهر تحليل LongCLI-Bench أن معدل إكمال الوكيل على SWE-Bench أقل من 30%; السبب هو أن التخطيط الأولي هش جدًا، ولا يمكن حلها بعدة أدوات.
  • من ناحية أخرى، وقعت شركة Anthropic عقدًا مع TPU بقدرة جيجاوات (باستهلاك طاقة يعادل تعدين البيتكوين)، مما يدل على أن موارد الحوسبة تتجمع لدى اللاعبين الذين لديهم قدرات تكامل عمودية. لكي تتنافس Together مع تأثير قفل الشركات من AWS و Azure، عليها إثبات أنها تستطيع تحقيق مستوى خدمة 99.9% في التنفيذ الفعلي.

عدم التوافق بين تدفقات الأموال والسرد

  • في الربع الأول من 2026، وصل إجمالي رأس المال الاستثماري إلى 300 مليار دولار، ويمثل الذكاء الاصطناعي حوالي 80% منها، منها شركة OpenAI وحدها حصلت على 122 مليار دولار من التمويل الموسع؛
  • المناقشات على تويتر حول البنية التحتية اللامركزية (مثل DGrid AI) تظهر أن السوق لا يزال بطيئًا في استجابة للسرد «من النموذج إلى البنية التحتية»؛
  • في المهام المعقدة، يمكن أن يؤدي «حقن التخطيط» مع التدخل البشري إلى تحسين استقرار العمليات المختلطة بنسبة حوالي 20% مقارنة بالأتمتة الكاملة، لكن هذا النوع من تدفقات العمل يُقلل من قيمته بشكل كبير، ولم تدرك الشركات قيمة إشراف المطورين.

مشهد المنافسة، التغيرات في العرض، والمبالغة في تقدير الحلول

  • على مستوى المنافسة: استخدم GLM-5 بنية MoE (744 مليار معلمة، حوالي 40 مليار نشطة)، وهو تحدٍ للجانب المغلق المصدر؛ لكن شركة Zhipu لم ترد بشكل مباشر، ويبدو الأمر أكثر كأنه تحديث تدريجي وليس اختراقًا ثوريًا.
  • التغيرات في العرض: تحول شركات التعدين مثل Core Scientific إلى استضافة الذكاء الاصطناعي، مما يشير إلى أن نقص وحدات معالجة الرسومات ربما ليس حادًا كما كان متوقعًا؛ والبنية التحتية القابلة لإعادة الاستخدام قد تؤثر على سوق الخوادم بدون خادم، وتقضي على هامش الربح الإضافي لشركات مثل Together.
  • تعديل السرد: الإفراط في الحماس حول «نمط التفكير» لم يحل المشكلات الأساسية مثل تلوث البيانات المرجعية، وقد أشار نقد LongCLI-Bench إلى ذلك بالفعل.
معسكر السرد الأدلة التأثير الحكم
المتفائلون بـ Agentic وصول GLM-5 إلى 77.8% على SWE-Bench Verified، وأكثر من 600 دورة تكرارية على arXiv تحويل التركيز إلى التحسين المستمر عبر RL، ودفع الشركات للاختبار مبالغ فيه. الميزة الحقيقية تكمن في المزيج بين الإشراف البشري والآلي، وشركات الاستشارات مثل Accenture ستستفيد
المشككون في الحوسبة عقد TPU بقدرة جيجاوات من Anthropic، و300 مليار دولار من تمويل الذكاء الاصطناعي في الربع الأول تحويل الندرة إلى «معركة تخصيص»، وضغط على السحابة المفتوحة المصدر تقدير غير دقيق. التحول في شركات التعدين قد يؤدي إلى طاقة غير مستغلة ويضر بالشركات ذات القيمة العالية مثل Together
مؤيدو اللامركزية مناقشات على تويتر حول DGrid/0G، PermawebDAO وغيرها بناء سرد موثوق لـ Web3 AI، وتخفيف حدة التركيز على السحابة المركزية إشارة مبكرة. رد فعل الجمهور بطيء، والتنظيم يعيق اعتماد الحلول الأصلية المشفرة
الشركات الواقعية معدل التوقف المبكر أقل من 30% على LongCLI-Bench، و28% زيادة بدون تقييم مستقل كشف فجوة التنفيذ، وتخفيف التهويل حول الوكيل هذه الرؤية الأساسية: الفرق التي يمكنها بناء حلقة رد فعل ذاتية ستستفيد، مثل تجربة معاينة OpenAI o3

التطلعات ومنطق التسعير

  • إذا كانت الأرقام التي أعلنت عنها صحيحة (بدون تدقيق، الاحتمال الذاتي حوالي 60%)، فمن المتوقع أن تسيطر Together على 15-20% من عبء العمل الوكيل في خط أنابيب بدون خادم بحلول 2027؛
  • لكن التنظيم يدفع نحو «السحابة الآمنة والمتوافقة»، مما سيرفع معايير الامتثال والموثوقية، وهو أمر يصب في مصلحة الشركات الكبرى الحالية؛
  • بالنسبة لتسعير الأصول والخدمات: ستصبح الموثوقية ومستوى الخدمة (SLA) عوامل رئيسية في تحديد القيمة الإضافية، ويجب تقليل مضاعفات تقييم تحسين النموذج الأحادي.

الاستنتاج: المستثمرون متحمسون جدًا لسرد «الوكيل» حول GLM-5، لكنهم لا يدركون الاعتماد الأساسي على البنية التحتية. في المهام المعقدة، ستكافأ الفرق التي تركز على «المزيج بين الإنسان والآلة + الحلقة الراجعة» بشكل كبير، بينما تتراجع قيمة النماذج الدقيقة البحتة.

الأهمية: عالية
التصنيف: إصدار النماذج، الاتجاهات الصناعية، الرؤى التقنية

الحكم: لا تزال هناك فرصة للتركيز على «البنية التحتية» في هذا السرد. لقد فاتت المتداولين على المدى القصير الذروة العاطفية، والمستفيدون الحقيقيون هم الفرق التي يمكنها تقديم مستوى خدمة عالي وعمليات مزيج بين الإنسان والآلة، بالإضافة إلى الصناديق على المدى المتوسط والطويل. يجب زيادة المراكز المرتبطة بالموثوقية والامتثال.

GLM1.01%
BTC0.72%
0G‎-1.44%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.26Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.19%
  • القيمة السوقية:$2.25Kعدد الحائزين:0
    0.00%
  • تثبيت