تقنية النصوص الطويلة تصبح ساحة المعركة الجديدة للنماذج الكبيرة، 400000 توكن قد تكون مجرد البداية
تعمل النماذج الكبيرة على تحسين قدرتها على معالجة النصوص الطويلة بسرعة مذهلة، من 4000 توكن إلى 400000 توكن. يبدو أن القدرة على معالجة النصوص الطويلة أصبحت "المعيار الجديد" لمصنعي النماذج الكبيرة.
سواء داخل البلاد أو خارجها، تركز العديد من شركات التكنولوجيا والنماذج الكبرى الرائدة ومراكز البحث على توسيع طول السياق كاتجاه رئيسي للتحديث. معظم هذه الشركات هي المفضلة في سوق رأس المال، وقد حصلت على استثمارات كبيرة.
تتضمن أسباب تركيز شركات النماذج الكبيرة على تقنية النصوص الطويلة جوانب متعددة:
معالجة صعوبات تطبيق الحلول. النصوص القصيرة تحد من تطبيق العديد من السيناريوهات، مثل الشخصيات الافتراضية، تطوير الألعاب، التحليل في المجالات التخصصية، إلخ.
تمهيد الطريق لتطبيقات Agent و AI الأصلية في المستقبل. تحتاج هذه التطبيقات إلى الاعتماد على كمية كبيرة من المعلومات التاريخية والسياق للحفاظ على التماسك وتجربة مخصصة.
زيادة دقة النموذج. يمكن أن توفر النصوص الطويلة مزيدًا من السياق ومعلومات التفاصيل، مما يقلل من الغموض ويعزز القدرة على الاستنتاج.
تعزيز تطبيق الصناعة. تساعد تقنيات النصوص الطويلة النماذج الكبيرة في مجالات متخصصة مثل المالية والقانون.
ومع ذلك، تواجه تقنيات النصوص الطويلة معضلة "مثلث الاستحالة": من الصعب الموازنة بين طول النص والانتباه وقدرة الحوسبة. السبب الرئيسي هو أن معظم النماذج تعتمد على بنية Transformer، حيث يزيد حجم حساب آلية الانتباه الذاتي بشكل تربيعي مع طول السياق.
حاليا هناك ثلاثة حلول رئيسية:
استخدام أدوات خارجية للمساعدة في معالجة النصوص الطويلة
تحسين حساب آلية الانتباه الذاتي
استخدام طرق تحسين النموذج
على الرغم من أن تقنية النصوص الطويلة لا تزال تواجه تحديات، إلا أن شركات النماذج الكبيرة تستمر في استكشاف النقاط المثلى لتحقيق توازن بين معالجة معلومات كافية مع مراعاة حسابات الانتباه وتكاليف القدرة الحاسوبية. قد تكون القدرة على معالجة 400,000 توكن مجرد بداية، ولا يزال هناك طريق طويل لنقطعه في المستقبل.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
تسجيلات الإعجاب 21
أعجبني
21
9
مشاركة
تعليق
0/400
BakedCatFanboy
· 07-04 13:16
لقد وصلت للتو إلى مليون توكن
شاهد النسخة الأصليةرد0
BoredApeResistance
· 07-03 00:20
لماذا لا يتم طرح 400,000 توكن بشكل مباشر بلا حدود؟
شاهد النسخة الأصليةرد0
ImpermanentPhobia
· 07-02 22:15
لا يُفضل إطالة النصوص بل يُفضل استخدام أربعين ألف صورة.
تنافس النماذج الكبيرة على القدرة على معالجة نصوص طويلة تصل إلى 400,000 توكن استكشاف حدود جديدة لتطبيقات الذكاء الاصطناعي
تقنية النصوص الطويلة تصبح ساحة المعركة الجديدة للنماذج الكبيرة، 400000 توكن قد تكون مجرد البداية
تعمل النماذج الكبيرة على تحسين قدرتها على معالجة النصوص الطويلة بسرعة مذهلة، من 4000 توكن إلى 400000 توكن. يبدو أن القدرة على معالجة النصوص الطويلة أصبحت "المعيار الجديد" لمصنعي النماذج الكبيرة.
سواء داخل البلاد أو خارجها، تركز العديد من شركات التكنولوجيا والنماذج الكبرى الرائدة ومراكز البحث على توسيع طول السياق كاتجاه رئيسي للتحديث. معظم هذه الشركات هي المفضلة في سوق رأس المال، وقد حصلت على استثمارات كبيرة.
تتضمن أسباب تركيز شركات النماذج الكبيرة على تقنية النصوص الطويلة جوانب متعددة:
معالجة صعوبات تطبيق الحلول. النصوص القصيرة تحد من تطبيق العديد من السيناريوهات، مثل الشخصيات الافتراضية، تطوير الألعاب، التحليل في المجالات التخصصية، إلخ.
تمهيد الطريق لتطبيقات Agent و AI الأصلية في المستقبل. تحتاج هذه التطبيقات إلى الاعتماد على كمية كبيرة من المعلومات التاريخية والسياق للحفاظ على التماسك وتجربة مخصصة.
زيادة دقة النموذج. يمكن أن توفر النصوص الطويلة مزيدًا من السياق ومعلومات التفاصيل، مما يقلل من الغموض ويعزز القدرة على الاستنتاج.
تعزيز تطبيق الصناعة. تساعد تقنيات النصوص الطويلة النماذج الكبيرة في مجالات متخصصة مثل المالية والقانون.
ومع ذلك، تواجه تقنيات النصوص الطويلة معضلة "مثلث الاستحالة": من الصعب الموازنة بين طول النص والانتباه وقدرة الحوسبة. السبب الرئيسي هو أن معظم النماذج تعتمد على بنية Transformer، حيث يزيد حجم حساب آلية الانتباه الذاتي بشكل تربيعي مع طول السياق.
حاليا هناك ثلاثة حلول رئيسية:
على الرغم من أن تقنية النصوص الطويلة لا تزال تواجه تحديات، إلا أن شركات النماذج الكبيرة تستمر في استكشاف النقاط المثلى لتحقيق توازن بين معالجة معلومات كافية مع مراعاة حسابات الانتباه وتكاليف القدرة الحاسوبية. قد تكون القدرة على معالجة 400,000 توكن مجرد بداية، ولا يزال هناك طريق طويل لنقطعه في المستقبل.