أطلقت منظمة العفو الدولية الاستقرار بسرعة نموذج ضبط Llama 2 FreeWilly ، الذي يمكن مقارنته بأداء ChatGPT! صرخ مستخدمو الإنترنت أن قواعد اللعبة قد تغيرت

2023-07-23 02:03:54

المصدر: Xinzhiyuan

ليس بعد يومين من إصدار Llama 2 ، قامت Unicorn Stability AI بضبط نموذج FreeWilly بسرعة ، والذي يُقال إنه يمكن مقارنته في الأداء مع ChatGPT.

بمجرد إطلاق Meta Llama 2 ، فجر مجتمع المصادر المفتوحة بالكامل.

كما قال عالم OpenAI Karpathy ، فإن هذا يوم مهم للغاية بالنسبة لمجال نماذج اللغات الكبيرة بأكمله. من بين جميع الموديلات ذات الأوزان المفتوحة ، يعتبر Llama 2 هو الأقوى.

من الآن فصاعدًا ، سيتم تضييق الفجوة بين النماذج الكبيرة مفتوحة المصدر والنماذج الكبيرة ذات المصدر المغلق ، وستكون فرصة بناء نماذج كبيرة مساوية لجميع المطورين.

الآن فقط ، أصدرت Stability AI و CarperAI Labs معًا نموذجًا دقيقًا يعتمد على نموذج LLaMA 2 70B - FreeWilly2.

وبناءً على الضبط الدقيق للطراز الأصلي لـ LLaMA 65B - FreeWilly1.

تجدر الإشارة إلى أن النموذج تم تدريبه على مجموعة بيانات تركيبية جديدة بناءً على تنسيق Alpaca القياسي وخضع لضبط دقيق تحت الإشراف (SFT).

في العديد من الاختبارات المعيارية ، أثبتت FreeWilly2 قدرات تفكير ممتازة ، بل وتجاوزت GPT-3.5 في بعض المهام.

عنوان النموذج:

كلا النموذجين عبارة عن تجارب بحثية وتم إصدارهما بموجب ترخيص غير تجاري.

توليد البيانات وجمعها

قالت منظمة Stability AI أن تدريب نموذج FreeWilly مستوحى بشكل مباشر من ورقة Microsoft "Orca: التعلم التقدمي من آثار الشرح المعقدة لـ GPT-4".

ومع ذلك ، في حين أن عملية توليد البيانات متشابهة ، فإن المصادر مختلفة.

رابط الورق:

يحتوي متغير مجموعة البيانات لـ FreeWilly على 600000 نقطة بيانات (حوالي 10٪ من حجم مجموعة البيانات المستخدمة في ورق Orca الأصلي) ، ويتم تمهيد النموذج باستخدام مجموعة بيانات إرشادية عالية الجودة تم إنشاؤها بواسطة Enrico Shippole:

COT Submix Original
NIV2 Submix Original
FLAN 2021 Submix Original
T0 Submix الأصلي

باستخدام هذا النهج ، أنتج Stability AI 500000 مثال باستخدام نموذج LLM أبسط ، و 100000 مثال إضافي باستخدام نموذج LLM أكثر تعقيدًا.

للحصول على مقارنة عادلة ، قام Stability AI بفحص مجموعات البيانات هذه بعناية وإزالة الأمثلة المستمدة من معيار التقييم.

على الرغم من أن حجم عينة التدريب لا يتجاوز عُشر ورقة Orca الأصلية ، إلا أن نموذج FreeWilly الناتج لا يؤدي أداءً جيدًا فقط في الاختبارات المعيارية المختلفة ، ولكنه يتحقق أيضًا من جدوى طريقة إنشاء مجموعات البيانات الاصطناعية.

تقييم أداء النموذج

فيما يتعلق بتقييم الأداء ، اعتمد باحثو الذكاء الاصطناعي في الثبات على استخدام نظام إلوثرى lm وإضافة الذكاء الاصطناعي العام.

انطلاقا من النتائج ، تتفوق FreeWilly في العديد من المجالات ، بما في ذلك التفكير المعقد ، وفهم التفاصيل الدقيقة للغة ، والإجابة على الأسئلة المعقدة المتعلقة بالمجالات المهنية (مثل حل المشكلات القانونية والرياضية).

في الأساس ، حققت FreeWilly 2 مستوى مشابهًا لـ ChatGPT ، بل وتجاوزته في بعض التقييمات.

معيار GPT4ALL (0 لقطة):

تقييم AGI (0 لقطة):

بالإضافة إلى ذلك ، قام فريق Hugging Face أيضًا بإعادة إنتاج التجربة بشكل مستقل في 21 يوليو.

يمكن ملاحظة أنه في لوحة المتصدرين Open LLM ، تحتل FreeWilly 2 المرتبة الأولى مع تقدم مطلق ، ومتوسط النقاط أعلى بـ 4 نقاط مئوية من الإصدار الأصلي من Llama 2.

لمستقبل مفتوح

يمكن القول أن FreeWilly1 و FreeWilly2 وضعوا معيارًا جديدًا لنماذج اللغات الكبيرة مفتوحة المصدر.

لم يؤدي تقديم هذين النموذجين إلى تقدم كبير في البحث في المجالات ذات الصلة فحسب ، بل عزز القدرة على فهم اللغة الطبيعية ، ولكنه دعم أيضًا إكمال المهام المعقدة.

قالت منظمة Stability AI أن الفريق متحمس جدًا للإمكانيات اللانهائية التي يمكن أن توفرها هذه النماذج لمجتمع الذكاء الاصطناعي ، ويتطلع إلى التطبيقات الجديدة التي ستلهمها.

بالإضافة إلى ذلك ، أتقدم بالشكر الجزيل إلى الفريق الشغوف من الباحثين والمهندسين والشركاء الذين مكنت جهودهم غير العادية وتفانيهم من تحقيق الاستقرار AI للوصول إلى هذا الإنجاز الهام.

وقت حساس

بمجرد إصدار النموذج ، استخدم مستخدم الإنترنت "Phil Howes" إطار Tuhin Srivastava's Llama v2 لإكمال تنفيذ FreeWilly 2 في أقل من دقيقة.

بعد تحميل وزن يبلغ 275 جيجابايت ، يعمل النموذج بسرعة 23 رمزًا / ثانية خارج الصندوق.

بالإضافة إلى ذلك ، صرخ بعض مستخدمي الإنترنت: يمكن تسمية النموذج الذي تم إطلاقه بالاشتراك مع Stability AI و CarperAI بأنه مغير قواعد اللعبة!

تتمتع FreeWilly1 و FreeWilly2 بأهمية ابتكارية كبيرة من حيث المصدر المفتوح والأداء ، ودائرة الذكاء الاصطناعي تستهل لحظة مثيرة.

مراجع:

شاهد النسخة الأصلية

المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.

تسجيلات الإعجاب 1