KevinSimback

vip
العمر 1.3 سنة
الطبقة القصوى 0
لا يوجد محتوى حتى الآن
هناك فرصة حقيقية لمُحْتَسِب طموح في مجال الذكاء الاصطناعي ل:
- إنشاء إطار تقييم لاختبار أدوات الوكلاء مثل Openclaw و Hermes وجميع "المخالب" الأخرى
- توسيع التقييم ليشمل أدوات / إعدادات مختلفة حتى نعرف كيف يتغير الأداء مع إعدادات مختلفة
- إجراء تقييمات قوية عبر نماذج مختلفة بما في ذلك المحلي مقابل API
- قياس الأداء ونشر النتائج، ثم إجراء تحديثات مستمرة مع تطور الوكلاء والنماذج
الفرصة هي أن تكون المصدر الرئيسي للمقاييس الموضوعية للوكلاء
ربما يقوم شخص ما بالفعل بذلك وأنا لست على علم؟ ليست مقارنات لمرة واحدة، بل اختبارات وتقييمات معيارية حقيقية حتى نتمكن من مقارنة النتائج بشكل فعلي
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
أفضل أن أمتلك مهارات اللعنة بدلاً من أموالك اللعينة
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
في الأيام القليلة الماضية، لاحظت زيادة في أمثلة نماذج تقول فيها "لقد أصلحتها" لكن لم يتم إصلاح شيء
هل يراها أحد آخر؟
من الناحية الحدسية، يبدو أن هناك تدهورًا عامًا في الأداء بشكل عام
شاهد النسخة الأصلية
post-image
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
لماذا تشغل نماذج محليًا؟
عادةً سببان رئيسيان - الخصوصية والتكلفة
دعنا نستكشف جانب التكلفة بمثال ونرى كيف تسير الحسابات
لنفترض أنك تريد تشغيل حلقة Autoresearch طوال الليل مثل @karpathy
إذا كان لديك إمكانية الوصول إلى H100، يمكنك تشغيل 100 تجربة طوال الليل باستخدام Opus-4.6 و تكلفة API ستكون على الأرجح في نطاق $10-25
لكن معظمنا لا نحظى بالحظ الكافي للوصول إلى H100
لا يزال يمكننا تشغيل 100 تجربة Autoresearch على MacBook بنفس التكلفة $10-25، لكن لن تكون مقارنة متكافئة
سيكمل H100 50-100x خطوات تدريب أكثر خلال نفس الفترة الزمنية
إذن إذا كنت تريد تكرار نفس عدد خطوات التدريب، قد ينتهي بك الحال لدفع أك
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
بعض التأملات الشخصية حول الذكاء الاصطناعي
بدأت دراسة علوم الحاسوب في الجامعة، لكنني لم أكن مبرمجاً جيداً
أخذت فصلاً في التمويل الشركاتي في سنتي الثالثة وحققت نتائج ممتازة، كنت أفضل بكثير في التمويل من البرمجة فقررت تغيير تخصصي
لكن كان لدي دائماً شعور بالنقص تجاه الأشخاص الذين يستطيعون البرمجة بحقاً
كنت أعلم أنهم يستطيعون تجاوزي بكثير عندما يتعلق الأمر ببناء أي شيء وكنت تحت رحمتهم في التبعيات التقنية
لذا اعتمدت على نماذج Excel والعروض التقديمية الخاصة بي كميزتي التنافسية
ثم أثناء عملي كمستشار في Goldman التقيت ببعض محللي التمويل الكميين الحقيقيين
معظمهم يستطيعون البرمجة وفي نفس الوقت يفهمون الت
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
فكّر مثل الإستراتيجي، اعمل مثل المطوّر -> هذا هو النموذج الجديد
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
خطط Claude Max تشبه بوفيهات الأكل بلا حدود
أنا بالفعل ممتلئ، لكن حسناً، سأأخذ طبقاً آخر من الرموز من فضلك
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
"مرحباً كيفن، لقد كنت تعمل على كل هذا openclaw وأشياء الوكلاء، هل أنت أكثر إنتاجية؟
100% نعم، لكن في نفس الوقت كثافة عملي ارتفعت معها
لذا إذا كنت تعتقد أنها طريقة للجلوس والاسترخاء بينما تعمل الوكلاء بينما تحتسي مارغريتا، فهذا لم يكن الحال
أفترض أنه يمكن أن يكون كذلك بالنسبة للبعض، لكن ميلي الطبيعي هو ببساطة القيام بأشياء أكثر بكثير في نفس عدد ساعات العمل
إنها سلاح ذو حدين"
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
وكلاء الذكاء الاصطناعي هي "لحظة الإنترنت" لهذا الجيل
بالنسبة للشركات الناشئة، إنها فرصة لإعادة تصور كيفية بناء المنتجات وإنجاز العمل
بالنسبة للمؤسسات، إنها إعادة تصميم نموذج التشغيل التي تعيد تشكيل الموضع التنافسي
بالنسبة للمستثمرين، إنها سوق معنونة جديدة تماماً
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
الرابط إلى التحليل:
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
قال الرئيس التنفيذي لشركة Nvidia جنسن اليوم في مؤتمر GTC:
"كل شركة في العالم بحاجة إلى وجود استراتيجية OpenClaw، واستراتيجية وكيل ذكية"
وأعلن عن NemoClaw - نسخة جاهزة للمؤسسات مبنية على OpenClaw مع تعزيز الأمان وأدوات مؤسسية متطورة
شاهد النسخة الأصلية
post-image
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
إعداد مُعظِّم الإنتاجية
أآآآه أنا أكون منتجاً!
شاهد النسخة الأصلية
post-image
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
إليك المجالات الـ 3 التي أهتم بها أكثر هذه الأيام، أود أن أسمع أو أتواصل مع أي شخص في هذه المجالات
1. اعتماد الوكلاء الذكيين
أعتقد أننا في نقطة انعطاف مع وكلاء الذكاء الاصطناعي وهناك الكثير لنستكشفه، مراحل مبكرة جداً في هذا المجال
لدي اقتناع عالي جداً بأن الوكلاء سينتشرون على نطاق ضخم جداً، ولكن اقتناع منخفض جداً (حالياً) بشأن كيفية توزيع القيمة والاستحواذ عليها نتيجة لذلك
2. البنية التحتية للذكاء الاصطناعي
شيء أتحدث عنه بشكل أقل لكنني أعمل خلف الكواليس مع أحد أكثر المشاريع إثارة في هذا المجال، المزيد قادم حول هذا
إذا كنت تؤمن بالنقطة 1 أعلاه، فيجب عليك أن تهتم بعمق بكيفية معالجة الطلب الحسابي
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
"الاقتصاد الوكيلي" هو مجال ناشئ مليء بالمعلقين على الجدول الزمني الذين يعلنون أنهم يعرفون كيف سيكسب الوكلاء أموالهم في المستقبل
وجهة نظري - لا نعرف بعد، دعنا نستمر في التجريب وسنبدأ في الاكتشاف
سؤالي الشامل - إذا كان بناء وتشغيل الوكلاء رخيصاً، فلماذا لا يستمرون في التقليل من بعضهم البعض حتى يصبح السعر الذي يفرضونه على الخدمات المختلفة مجرد تكلفة الاستدلال + ربما هامش صغير؟
هذا بالنسبة لي هو السؤال المحدد للاقتصاد الوكيلي وأي شخص ليس لديه إجابة جيدة على هذا السؤال لم يفكر بعمق كافٍ في الموضوع
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
إليك أفضل 4 حالات استخدام أراها مع OpenClaw / منصات الوكيل:
1. المساعد الشخصي / رئيس الموظفين
حقًا ما صُنع من أجله، جارفيس الشخصي الخاص بك، يمكن استخدامه بشكل متساوٍ للشخصي، المهني أو كلاهما
إذا لم تفعل شيئًا آخر مع الوكلاء، فهذه وحدها تستحق العناء
2. مساعد البرمجة / فريق البرمجة
الوكيلات تعمل بشكل جيد جدًا لبناء الأشياء وعندما تعمل عدة وكلاء متخصصين في فريق، يكون الأمر سحريًا إلى حد كبير
لكن يمكنك بشكل أساسي أن تفعل الشيء نفسه مع Claude Code / Codex والأدوات / MCPs
لذا فإن الفائدة هنا تكمن حقًا في جعلها أكثر سهولة من خلال وكيل دائم، للمطورين المتقدمين الذين يمتلكون أدوات ذكاء اصطناعي جيدة قد
شاهد النسخة الأصلية
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
أجد أن العمل مع وكيلين للبرمجة أفضل من العمل مع وكيل واحد فقط، خاصة إذا كانا يستخدمان نموذجين مختلفين، حيث يُحسن أحدهما على الآخر
شاهد النسخة الأصلية
post-image
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت