العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
أوبن إيه آي تطلق SWE-Lancer: معيار جديد للذكاء الاصطناعي لبرمجة العمل الحر في العالم الحقيقي
اكتشف أهم أخبار وأحداث التكنولوجيا المالية!
اشترك في النشرة الإخبارية لـ FinTech Weekly
يقرأها التنفيذيون في JP Morgan وCoinbase وBlackrock وKlarna وغيرها
معيار جديد لقياس مهارات الذكاء الاصطناعي في البرمجة ضمن اقتصاد الأعمال المؤقتة
يخطو الذكاء الاصطناعي إلى عالم تطوير البرمجيات للعمل الحر عبر معيار جديد مُصمم لاختبار قدراته البرمجية مقابل مهام واقعية. ويُسمّى SWE-Lancer، وهو المعيار الذي قدمته OpenAI، ويقيّم أداء الذكاء الاصطناعي باستخدام أكثر من 1,400 مهمة فعلية لهندسة البرمجيات للعمل الحر من Upwork، تبلغ قيمتها مجتمعة 1 مليون دولار في المدفوعات.
تهدف هذه المبادرة إلى تقديم صورة أوضح عن قدرات الذكاء الاصطناعي في سياق مهني. وبدلاً من الاعتماد على مسائل برمجية اصطناعية، يستخدم SWE-Lancer مهامًا تم إنجازها والدفع مقابلها من قبل شركات حقيقية، ما يوفّر مقياسًا أكثر واقعية لفعالية الذكاء الاصطناعي في هندسة البرمجيات.
وظائف حرة حقيقية، تحديات حقيقية
تركّز معظم معايير ترميز الذكاء الاصطناعي على مشكلات محددة جيدًا مع حلول متوقعة. يختلف SWE-Lancer. يتضمن مجموعة البيانات نطاقًا واسعًا من المهام، بدءًا من إصلاحات بقيمة 50 دولارًا للأخطاء وصولاً إلى تنفيذ ميزات معقدة بقيمة 32,000 دولار. تختبر بعض التكليفات قدرة الذكاء الاصطناعي على كتابة الكود، بينما تتطلب تكليفات أخرى اتخاذ قرارات—محاكاة دور مدير الهندسة عبر الاختيار بين مقترحات تقنية متنافسة.
لضمان الدقة، يتم التحقق من الاختبارات الشاملة من طرف ثلاثة مهندسين ذوي خبرة، ويتم تقييم اختيارات المديرين مقابل قرارات المدراء الذين قاموا بالتوظيف الأصليين. لا يقيس المعيار فقط ما إذا كان بإمكان الذكاء الاصطناعي كتابة الكود—بل يقيم أيضًا ما إذا كان هذا الكود يلبي المعايير المتوقعة من العملاء الذين يدفعون.
كيف يَصِل أداء نماذج الذكاء الاصطناعي؟
النتائج واضحة: حتى أكثر نماذج الذكاء الاصطناعي تقدمًا تواجه صعوبة مع هذه المهام. ورغم أن الذكاء الاصطناعي أثبت قدرته على توليد مقاطع كود والمساعدة في التصحيح، فإنه لا يزال يتراجع عند التعامل مع التعقيد الكامل للعمل الهندسي للعمل الحر. تظل المهام التي تتطلب الإبداع وحل المشكلات والتخطيط طويل الأجل تحديًا.
لهذه الفجوة تداعيات كبيرة. يتزايد دور الذكاء الاصطناعي في تطوير البرمجيات، لكن معايير مثل SWE-Lancer تشير إلى أن الترميز الذاتي بالكامل ما يزال بعيدًا. وحتى الآن، يظل المهندسون البشر ضروريين، خصوصًا للمشروعات المعقدة التي تتجاوز مجرد توليد الكود البسيط.
إتاحة المصدر للأبحاث والرؤى الاقتصادية
لتشجيع المزيد من الدراسة، أتاح فريق SWE-Lancer موارد رئيسية بشكل علني. يمكن للباحثين الوصول إلى صورة Docker موحدة وجزءًا من المعيار، يُسمّى SWE-Lancer Diamond، وذلك لأغراض التقييم. من خلال ربط أداء الذكاء الاصطناعي بالقيمة النقدية الفعلية، يقدم هذا المعيار رؤى جديدة حول كيف يمكن أن يؤثر الذكاء الاصطناعي في الاقتصاد وسوق وظائف هندسة البرمجيات.
وبعيدًا عن تطوير البرمجيات، قد تكون هذه الرؤى مفيدة لشركات التكنولوجيا المالية (fintech) والأعمال التي تعتمد على المواهب للعمل الحر. ومع تحسن نماذج الذكاء الاصطناعي، ستحتاج الشركات إلى طرق أفضل لقياس الأثر المالي والتشغيلي للأتمتة. يوفّر SWE-Lancer أساسًا لفهم كيف يمكن للذكاء الاصطناعي أن يتكامل في العمل المعتمد على العقود.
خطوة نحو مستقبل الذكاء الاصطناعي في تطوير البرمجيات
يسلط إصدار SWE-Lancer الضوء على حقيقة مهمة: يتقدم الذكاء الاصطناعي، لكنه ما يزال يعاني من متطلبات العالم الواقعي لتطوير البرمجيات للعمل الحر. في حين يمكن لأدوات الذكاء الاصطناعي مساعدة المطورين، فإنها ليست بعد بدائل موثوقة للمتخصصين ذوي المهارات.
ومع استمرار أبحاث الذكاء الاصطناعي، ستساعد معايير مثل SWE-Lancer في تتبع التقدم وتطوير النماذج وصياغة النقاشات حول الآثار الاقتصادية للأتمتة. سواء كان الذكاء الاصطناعي سيستبدل مطوري العمل الحر بالكامل أم لا يظل أمرًا غير مؤكد، لكن في الوقت الحالي، يبقى اللمس البشري في هندسة البرمجيات لا يُستبدل.