OpenLedger تبني نظام بيئي مدفوع بالبيانات وقابل للتجميع من نماذج Web3 AI

2025-07-04 18:46:26

تقرير بحثي عميق عن OpenLedger: بناء اقتصاد وكيل مدفوع بالبيانات وقابل للتجميع باستخدام OP Stack + EigenDA كقاعدة

أ. المقدمة | انتقال طبقة النموذج لـ Crypto AI

تعتبر البيانات والنماذج والقدرة الحاسوبية العناصر الثلاثة الأساسية للبنية التحتية للذكاء الاصطناعي، وتُعتبر بمثابة الوقود (البيانات) والمحرك (النماذج) والطاقة (القدرة الحاسوبية) التي لا يمكن الاستغناء عنها. وعلى غرار مسار تطور البنية التحتية في صناعة الذكاء الاصطناعي التقليدية، شهدت مجال الذكاء الاصطناعي في العملات المشفرة مراحل مشابهة. في بداية عام 2024، هيمن السوق على مشاريع GPU اللامركزية، مع التركيز بشكل عام على منطق النمو الواسع النطاق "في القدرة الحاسوبية". ومع دخول عام 2025، بدأت نقاط التركيز في الصناعة في الانتقال تدريجياً نحو طبقات النماذج والبيانات، مما يشير إلى أن الذكاء الاصطناعي في العملات المشفرة ينتقل من المنافسة على الموارد الأساسية إلى بناء طبقات أكثر استدامة وقيمة تطبيقية.

نموذج عام (LLM) مقابل نموذج متخصص (SLM)

تعتمد نماذج اللغة الكبيرة التقليدية (LLM) بشكل كبير على مجموعات بيانات ضخمة وهياكل موزعة معقدة، حيث يتراوح حجم المعلمات من 70B إلى 500B، وتصل تكلفة التدريب مرة واحدة إلى عدة ملايين من الدولارات. بينما يعتبر SLM (نموذج اللغة المتخصص) نموذجاً خفيف الوزن لتعديل نموذج أساسي قابل لإعادة الاستخدام، وغالباً ما يستند إلى نماذج مفتوحة المصدر، ويجمع بين كمية قليلة من البيانات المتخصصة عالية الجودة وتقنيات مثل LoRA، لبناء نماذج خبراء تمتلك معرفة في مجالات محددة بسرعة، مما يقلل بشكل ملحوظ من تكلفة التدريب والحواجز التقنية.

من الجدير بالذكر أن SLM لن يتم دمجه في أوزان LLM، بل يتم تشغيله بالتعاون مع LLM من خلال استدعاء هيكل الوكيل، ونظام المكونات الإضافية للتوجيه الديناميكي، وLoRA للإدخال الساخن، وRAG (التوليد المعزز بالاسترجاع) وغيرها من الطرق. هذه البنية تحتفظ بقدرة LLM على التغطية الواسعة، وفي نفس الوقت تعزز الأداء المتخصص من خلال وحدات التعديل الدقيق، مما يشكل نظام ذكاء تركيبي عالي المرونة.

قيمة وحدود Crypto AI في طبقة النموذج

مشاريع الذكاء الاصطناعي للعملات المشفرة من الصعب أساسًا أن تعزز بشكل مباشر القدرات الأساسية لنموذج اللغة الكبير (LLM)، والسبب الرئيسي هو

العوائق التقنية مرتفعة للغاية: حجم البيانات والموارد الحاسوبية والقدرات الهندسية المطلوبة لتدريب نموذج الأساس ضخمة للغاية، حاليًا لا تمتلك هذه القدرات سوى عمالقة التكنولوجيا مثل الولايات المتحدة والصين.
قيود النظام البيئي مفتوح المصدر: على الرغم من أن النماذج الأساسية السائدة مفتوحة المصدر، إلا أن المفتاح الحقيقي لدفع النموذج إلى الأمام يظل مركزًا في المؤسسات البحثية ونظم الهندسة المغلقة، ويظل مجال مشاركة المشاريع على السلسلة في مستوى النموذج الأساسي محدودًا.

ومع ذلك، فوق نماذج الأساس مفتوحة المصدر، يمكن لمشاريع Crypto AI أن تحقق تمدد القيمة من خلال ضبط نماذج اللغة المتخصصة (SLM) ودمج القابلية للتحقق وآليات الحوافز الخاصة بـ Web3. ك"طبقة واجهة محيطية" لسلسلة صناعة الذكاء الاصطناعي، تتجلى في اتجاهين رئيسيين:

طبقة التحقق الموثوقة: من خلال تسجيل مسار توليد النموذج، ومساهمات البيانات، واستخدامها على السلسلة، يعزز من إمكانية تتبع مخرجات الذكاء الاصطناعي وقدرته على مقاومة التلاعب.
آلية التحفيز: من خلال رمز توكن الأصلي، تستخدم لتحفيز سلوكيات مثل تحميل البيانات، استدعاء النماذج، تنفيذ الوكلاء (Agent)، وبناء دورة إيجابية لتدريب النماذج وخدماتها.

تحليل ملاءمة أنواع نماذج الذكاء الاصطناعي مع blockchain

من هنا يتضح أن النقاط القابلة للتطبيق لمشاريع Crypto AI من فئة النماذج تتركز بشكل رئيسي على تحسين خفة الوزن للتعديلات الدقيقة على SLM الصغيرة، وإدخال البيانات والتحقق منها على السلسلة باستخدام بنية RAG، وأيضًا النشر المحلي لنماذج Edge وتحفيزها. بالجمع بين القابلية للتحقق من blockchain وآلية الرموز، يمكن أن تقدم Crypto قيمة فريدة لهذه السيناريوهات ذات الموارد المتوسطة والمنخفضة، مما يشكل قيمة مميزة ل"طبقة واجهة" AI.

سلسلة blockchain AI المستندة إلى البيانات والنماذج، يمكنها تسجيل مصدر مساهمة كل بيانات ونموذج بوضوح وبشكل غير قابل للتغيير، مما يعزز بشكل كبير مصداقية البيانات وقابلية تتبع تدريب النموذج. في الوقت نفسه، من خلال آلية العقود الذكية، يتم تفعيل توزيع المكافآت تلقائيًا عند استدعاء البيانات أو النموذج، مما يحول سلوك AI إلى قيمة قابلة للقياس والتداول قابلة للتوكن، ويؤسس نظام تحفيز مستدام. بالإضافة إلى ذلك، يمكن لمستخدمي المجتمع أيضًا تقييم أداء النموذج من خلال تصويت التوكن، والمشاركة في وضع القواعد وتكرارها، وتحسين هيكل الحوكمة اللامركزية.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-62B3FAe810F4772AABA3D91C74C1AA6)

ثانياً، نظرة عامة على المشروع | رؤية OpenLedger للذكاء الاصطناعي في سلسلة الكتل

OpenLedger هو أحد المشاريع القليلة في سوق blockchain AI التي تركز على بيانات ونماذج آليات التحفيز. لقد اقترح مفهوم "Payable AI" لأول مرة، ويهدف إلى بناء بيئة تشغيلية للذكاء الاصطناعي عادلة وشفافة وقابلة للتجميع، لتحفيز المساهمين في البيانات، ومطوري النماذج، وبناة تطبيقات الذكاء الاصطناعي للتعاون على نفس المنصة، والحصول على عائدات على السلسلة بناءً على المساهمات الفعلية.

OpenLedger تقدم حلقة مغلقة كاملة من "توفير البيانات" إلى "نشر النموذج" ثم إلى "استدعاء الأرباح"، وتشمل وحداتها الأساسية:

مصنع النموذج: بدون برمجة، يمكنك استخدام LoRA لضبط وتدريب ونشر نموذج مخصص بناءً على LLM مفتوح المصدر؛
OpenLoRA: يدعم التعايش لآلاف النماذج، التحميل الديناميكي حسب الحاجة، مما يقلل بشكل كبير من تكاليف النشر؛
PoA (إثبات النسبة): تحقيق قياس المساهمة وتوزيع المكافآت من خلال تسجيل استدعاءات سلسلة الكتل.
Datanets：شبكات البيانات الهيكلية الموجهة نحو السيناريوهات العمودية، التي تم بناؤها والتحقق منها من خلال التعاون المجتمعي؛
منصة اقتراح النموذج (Model Proposal Platform): سوق نماذج على السلسلة قابلة للتجميع، قابلة للاستدعاء، وقابلة للدفع.

من خلال الوحدات أعلاه، قامت OpenLedger ببناء "البنية التحتية للاقتصاد الذكي" المدفوعة بالبيانات والقابلة للتجميع، مما يعزز التحويل الرقمي لسلسلة قيمة الذكاء الاصطناعي.

وفي اعتماد تقنية البلوكتشين، توفر OpenLedger قاعدة OP Stack + EigenDA، مما يوفر بيئة تشغيل عالية الأداء ومنخفضة التكلفة وقابلة للتحقق للبيانات والعقود لنماذج الذكاء الاصطناعي.

مبني على OP Stack: يعتمد على تقنية Optimism، يدعم التنفيذ عالي الإنتاجية ومنخفض التكلفة؛
التسوية على الشبكة الرئيسية للإيثيريوم: ضمان أمان المعاملات وسلامة الأصول؛
متوافق مع EVM: يسهل على المطورين نشر وتوسيع بسرعة استنادًا إلى Solidity؛
EigenDA تقدم دعم توافر البيانات: تخفيض كبير في تكاليف التخزين وضمان قابلية التحقق من البيانات.

بالمقارنة مع NEAR التي تركز بشكل أكبر على الطبقة الأساسية وتركز على سيادة البيانات و"وكلاء الذكاء الاصطناعي على BOS"، تركز OpenLedger بشكل أكبر على بناء سلسلة خاصة بالذكاء الاصطناعي موجهة نحو تحفيز البيانات والنماذج، وتهدف إلى جعل تطوير النماذج واستدعائها على السلسلة قابلة للتتبع والتركيب والقيمة المستدامة. إنها البنية التحتية لتحفيز النماذج في عالم Web3، تجمع بين استضافة النماذج وفوترة الاستخدام وواجهة قابلة للتجميع على السلسلة، مما يعزز مسار تحقيق "النموذج كأصل".

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-19C2276FCCC616CCF9260FB7E35C9C24)

ثلاثة، المكونات الأساسية لـ OpenLedger والهيكل التكنولوجي

3.1 نموذج المصنع،无需代码模型工厂

ModelFactory هو منصة لتعديل نموذج اللغة الكبير (LLM) في إطار OpenLedger. على عكس أطر التعديل التقليدية، يوفر ModelFactory واجهة رسومية فقط، دون الحاجة إلى أدوات سطر الأوامر أو تكامل API. يمكن للمستخدمين تعديل النموذج بناءً على مجموعة البيانات التي تم الحصول على تفويضها ومراجعتها على OpenLedger. وقد تم تحقيق سير العمل المتكامل لتفويض البيانات، وتدريب النموذج، ونشره، وتتضمن العمليات الأساسية ما يلي:

التحكم في الوصول إلى البيانات: يقدم المستخدم طلب البيانات، ويقوم المزود بمراجعته والموافقة عليه، ويتم الاتصال بالبيانات تلقائيًا بواجهة تدريب النموذج.
اختيار النموذج وتكوينه: يدعم LLM الرائد (مثل LLaMA و Mistral)، من خلال واجهة المستخدم الرسومية لتكوين المعلمات الفائقة.
تقليل الوزن الدقيق: محرك LoRA / QLoRA المدمج، يعرض تقدم التدريب في الوقت الحقيقي.
تقييم النموذج ونشره: أدوات تقييم مدمجة، تدعم تصدير النشر أو استدعاء المشاركة البيئية.
واجهة التحقق التفاعلي: توفر واجهة محادثة، مما يسهل اختبار قدرة النموذج على الإجابة.
توليد تتبع RAG: إجابات تتضمن مراجع للمصادر، مما يعزز الثقة وقابلية التدقيق.

يتضمن هيكل نظام Model Factory ستة وحدات، تشمل مصادقة الهوية، وصلاحيات البيانات، وضبط النماذج، وتقييم النشر، وRAG التتبع، لإنشاء منصة خدمات نموذج متكاملة آمنة وقابلة للتحكم، وتفاعلية في الوقت الحقيقي، وقابلة للتحقيق المستدام.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-F23F47F09226573B1FCACEBDCFB8c1f3)

جدول ملخص قدرات نماذج اللغة الكبيرة المدعومة حاليًا من ModelFactory هو كما يلي:

سلسلة LLaMA: أوسع بيئة، مجتمع نشط، أداء عام قوي، وهي واحدة من النماذج الأساسية مفتوحة المصدر الأكثر شعبية في الوقت الحالي.
Mistral: هيكلها فعال، وأداء الاستدلال ممتاز، مما يجعلها مناسبة للتطبيقات المرنة والموارد المحدودة.
Qwen: منتج من علي بابا، أداء ممتاز في المهام الصينية، قدرة شاملة قوية، مناسب ليكون الخيار الأول للمطورين المحليين.
ChatGLM: تأثير المحادثة باللغة الصينية بارز، مناسب لخدمة العملاء في المجالات المحددة والمشاهد المحلية.
Deepseek: يتميز بأداء متفوق في توليد الأكواد والاستدلال الرياضي، مناسب لأدوات المساعدة في التطوير الذكي.
Gemma: نموذج خفيف أطلقته Google، ذو هيكل واضح، سهل الاستخدام والتجريب بسرعة.
فالكون: كان معيار الأداء، مناسب للبحث الأساسي أو اختبارات المقارنة، لكن نشاط المجتمع قد انخفض.
BLOOM: دعم متعدد اللغات قوي، لكن أداء الاستدلال ضعيف، مناسب للأبحاث ذات التغطية اللغوية.
GPT-2: نموذج كلاسيكي مبكر، مناسب فقط لأغراض التعليم والتحقق، ولا يُنصح باستخدامه في النشر الفعلي.

على الرغم من أن مجموعة نماذج OpenLedger لا تشمل أحدث نماذج MoE عالية الأداء أو النماذج متعددة الوسائط، إلا أن استراتيجيتها ليست قديمة، بل هي تكوين "الأولوية العملية" الذي تم إجراؤه بناءً على القيود الواقعية المتمثلة في نشر السلسلة (تكلفة الاستدلال، التكيف مع RAG، التوافق مع LoRA، بيئة EVM).

تعتبر Model Factory كأداة سلسلة بدون كود، حيث تحتوي جميع النماذج على آلية إثبات المساهمة المدمجة، مما يضمن حقوق المساهمين في البيانات ومطوري النماذج، وتتميز بمتطلبات منخفضة، وقابلية التسييل، وإمكانية التجميع، مقارنة بأدوات تطوير النماذج التقليدية:

للمطورين: توفير مسار كامل لنموذج الحضانة والتوزيع والدخل؛
بالنسبة للمنصة: تشكيل تدفق أصول النموذج وبيئة التركيب؛
للمستخدمين: يمكن دمج النماذج أو الوكلاء كما هو الحال عند استدعاء API.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ moments-909dc3f796ad6aa44a1c97a51ade4193)

3.2 OpenLoRA ، الأصول على السلسلة لنموذج الضبط

LoRA (تكييف منخفض الرتبة) هي طريقة فعالة لضبط المعلمات، حيث تتعلم المهام الجديدة من خلال إدخال "مصفوفات منخفضة الرتبة" في نموذج كبير مدرب مسبقًا، دون تعديل معلمات النموذج الأصلي، مما يقلل بشكل كبير من تكاليف التدريب ومتطلبات التخزين. عادةً ما تحتوي نماذج اللغة الكبيرة التقليدية (مثل LLaMA و GPT-3) على عدة مليارات أو حتى مئات المليارات من المعلمات. لاستخدامها في مهام محددة (مثل الاستجابة القانونية، أو الاستشارات الطبية)، يجب إجراء تعديلات (ضبط دقيق). الاستراتيجية الأساسية لـ LoRA هي: "تجميد معلمات النموذج الكبير الأصلي، وتدريب فقط مصفوفات المعلمات الجديدة المدخلة."، مع كفاءتها في المعلمات، وسرعة التدريب، ومرونة النشر، تعد الطريقة السائدة الحالية لضبط النماذج في Web3 والنشر في استدعاءات مجمعة.

OpenLoRA هو إطار استدلال خفيف الوزن تم بناؤه بواسطة OpenLedger ومصمم لنشر نماذج متعددة ومشاركة الموارد. الهدف الأساسي هو حل المشكلات الشائعة في نشر نماذج الذكاء الاصطناعي الحالية مثل التكلفة العالية، وقلة إعادة الاستخدام، وإهدار موارد GPU، وتعزيز تنفيذ "الذكاء الاصطناعي القابل للدفع".

OpenLoRA نظام معمارية المكونات الأساسية، مبني على تصميم معياري، يغطي تخزين النماذج، تنفيذ الاستدلال، توجيه الطلبات وغيرها من المراحل الحاسمة، لتحقيق نشر واستدعاء متعدد النماذج بكفاءة وتكلفة منخفضة:

وحدة تخزين محول LoRA (محولات LoRA للتخزين): يتم استضافة محول LoRA المدرب مسبقًا على OpenLedger، مما يتيح التحميل عند الطلب، وتجنب تحميل جميع النماذج مسبقًا في الذاكرة، مما يوفر الموارد.
استضافة النموذج وطبقة دمج المحولات (Model Hosting & Adapter Merging Layer): جميع نماذج الضبط الدقيق تشترك في نموذج أساسي (base model)، أثناء الاستدلال يتم دمج محول LoRA ديناميكيًا، يدعم عدة محولات

شاهد النسخة الأصلية

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

تسجيلات الإعجاب 21