إتقان Hermes 13B للذكاء الاصطناعي المتقدم

إتقان Hermes 13B للذكاء الاصطناعي المتقدم

أبرز النقاط

  • التقدم التقني: تم تطوير Hermes 13B بواسطة Nous Research مع Teknium وEmozilla، ويتميز بنموذج مضبوط على جهاز 8x a100 80GB DGX، ويدعم المهام المعقدة بطول تسلسل 4096.
  • مجموعة البيانات والتدريب: تم تدريبه على أكثر من 300,000 مخرج من GPT-4 الاصطناعي، تمت تنقيتها من مصادر مثل GPTeacher ومجموعات بيانات لعب الأدوار، ويتميز Hermes 13B بالموثوقية والأداء.
  • أداء المعايير: #1 في ARC-c وARC-e وHellaswag وOpenBookQA، و#2 في Winogrande بين نماذج GPT-4، مما يدل على أداء معياري متفوق.
  • الميزات الرئيسية: يوفر توليد استجابات موسعة، وتقليل الهلوسة، وقدرات مناقشة غير مقيدة، مما يضمن الموثوقية والتنوع.
  • التطبيقات العملية: يدعم التدريس بالذكاء الاصطناعي، وأتمتة التوثيق التقني، وكتابة السيناريوهات، وروبوتات الدردشة القابلة للتخصيص، والبحث الأكاديمي، وتوليد المحتوى، وسرد القصص التفاعلي.
  • التكامل عبر API: يتكامل بسهولة مع Novita AI للوصول السلس إلى قدرات Hermes 13B، مما يبسط التطوير والنشر.
  • التحسين والتحديثات: نصائح حول تحسين جودة مجموعة البيانات، وطول التسلسل، ومعلمات النموذج لتعظيم الأداء، مع التركيز على مواكبة أحدث التطورات.

المقدمة

هل أنت فضولي حول قدرات Hermes 13B، أحدث إبداعات Nous Research؟ هل تتساءل كيف يقارن بسابقاته؟ انضم إلينا بينما نغوص في تفاصيل Hermes 13B، مستكشفين مواصفاته الفنية، ورؤى بيانات التدريب، والتطبيقات العملية، وإعداد API. دعنا نكشف عن إجابات هذه الأسئلة والمزيد.

فهم Hermes 13B

نظرة عامة

Hermes 13B، أو Nous-Hermes-Llama2–13b، هو نموذج لغة متطور تم تطويره بواسطة Nous Research، مع مساهمات كبيرة من Teknium وEmozilla في الضبط الدقيق وتنقية مجموعة البيانات. تم ضبط هذا النموذج بدقة على مجموعة بيانات ضخمة تضم أكثر من 300,000 تعليمة، بهدف تعزيز القدرات مقارنة بسابقه Hermes على Llama-1.

المواصفات الفنية

استخدمت عملية الضبط الدقيق طول تسلسل 4096، مما يشير إلى قدرة النموذج على معالجة المدخلات المعقدة والطويلة. تم التدريب على جهاز 8x a100 80GB DGX، مما يعرض الموارد الحسابية الكبيرة المستثمرة في تطويره.

بيانات التدريب

تم تدريب النموذج بشكل أساسي على مخرجات GPT-4 الاصطناعية، مما يضمن الاحتفاظ بالمعرفة عالية الجودة وإكمال المهام. مجموعة البيانات عبارة عن مجموعة منسقة من مصادر متنوعة، بما في ذلك GPTeacher، ومجموعات بيانات لعب الأدوار، ومجموعات بيانات تعليمات البرمجة، ومواد غير منشورة مثل Nous Instruct & PDACTL.

التعاون والإقرار

كان تطوير النموذج جهدًا تعاونيًا شمل عدة مساهمين ومنظمات رئيسية (Teknium، Karan4D، Nous Research، Huemin Art، وRedmond AI)، مع شكر خاص لـ Redmond AI لرعاية موارد الحوسبة.

التوجيه والتفاعل

يتبع النموذج تنسيق موجه Alpaca، مما يسمح للمستخدمين بالتفاعل معه من خلال تعليمات منظمة وأقسام استجابة.

معايير الأداء

تم تقييم النموذج عبر معايير مختلفة، بما في ذلك AGI-Eval، ومجموعة معايير GPT-4All، واختبار التفكير BigBench. يحتل Hermes 13B حاليًا المرتبة #1 في ARC-c وARC-e وHellaswag وOpenBookQA، والمرتبة #2 في Winogrande، مقارنة بقائمة معايير GPT4all.

الميزات والقدرات الرئيسية

توليد استجابات موسعة محسّن

تم ضبط النموذج لإنتاج استجابات مطولة ومفصلة. هذه القدرة مفيدة بشكل خاص للمهام التي تتطلب إجابات شاملة، مثل الكتابة والتلخيص والتفسيرات المتعمقة.

معدل هلوسة منخفض

تشير “الهلوسة” في سياق نماذج اللغة إلى توليد معلومات معقولة ولكنها غير صحيحة واقعيًا. تم ضبط نموذج Hermes-Llama2–13b لتقليل ذلك، مما يضمن أن الاستجابات أكثر موثوقية ودقة.

غياب آليات الرقابة

على عكس بعض النماذج التي تتضمن رقابة على المحتوى، لا يحتوي Hermes-Llama2–13b على قيود مدمجة على الموضوعات التي يمكنه مناقشتها. وهذا يسمح بحوار أكثر انفتاحًا ويقلل من احتمالية تجنب النموذج لمواضيع معينة.

استخدام مجموعة بيانات عالية الجودة

تم تدريب النموذج على مجموعة بيانات منسقة مشتقة من مخرجات GPT-4 الاصطناعية عالية الجودة، مما يضمن أساسًا قويًا في المعرفة وتنفيذ المهام. يساهم تنوع مجموعة البيانات في تنوع النموذج وفعاليته عبر مختلف المجالات.

التطبيقات العملية لـ Hermes 13B

تطوير نظام التدريس الذكي

قم بتطوير منصة تعليم إلكتروني مخصصة تستفيد من Hermes 13B لتوليد خطط دروس تفاعلية ديناميكية وتقديم شروحات مفصلة مصممة خصيصًا لاحتياجات المتعلمين الفرديين.

أتمتة التوثيق التقني

أنشئ أدوات تعمل على أتمتة توليد التوثيق التقني، مثل توثيق API، ومخططات بنية النظام، وأدلة المستخدم، باستخدام فهم Hermes 13B للمفاهيم التقنية المعقدة.

API لكتابة السيناريوهات للصناعات الإبداعية

قم ببناء خدمة API لكتاب السيناريوهات تستخدم Hermes 13B لتوليد الحوارات وملخصات الحبكة ووصف الشخصيات بتنسيقات وسائط متنوعة، مما يعزز سير العمل الإبداعي.

إطار روبوت الدردشة القابل للتخصيص

صمم إطارًا لبناء روبوتات خدمة عملاء يمكن تخصيصها بسهولة باستخدام قدرات الذكاء الاصطناعي التحادثي لـ Hermes 13B، مما يسمح بتفاعلات خاصة بالمجال.

مساعد البحث والكتابة الأكاديمية

قم بتنفيذ مساعد ذكي للباحثين يستخدم Hermes 13B لصياغة الأوراق الأكاديمية، وتوليد مراجعات الأدبيات، واقتراح اتجاهات البحث بناءً على الأعمال العلمية الحالية.

محرك تركيب المعرفة

طور نظامًا يقوم بتركيب المعلومات من مجالات مختلفة، وإنشاء تقارير شاملة أو تقديم رؤى متعددة التخصصات باستخدام قدرة Hermes 13B على فهم ودمج مواضيع متنوعة.

مولد محتوى التسويق الرقمي

أنشئ أداة لتوليد المحتوى للمسوقين تستفيد من Hermes 13B لإنتاج مواد تسويقية جذابة، ومنشورات على وسائل التواصل الاجتماعي، ونصوص إعلانية تتوافق مع إرشادات العلامة التجارية.

منصة سرد القصص التفاعلي

طور منصة لسرد القصص التفاعلي في الألعاب أو الوسائط الأخرى، حيث يمكن لـ Hermes 13B صياغة حبكات متفرعة وتفاعلات شخصيات بناءً على اختيارات المستخدم.

إعداد API لنموذج Hermes 13B LLM

الخطوة 1: إنشاء حساب

انتقل إلى موقع Novita AI الإلكتروني وانقر على زر “تسجيل الدخول” الموجود في القائمة العلوية. حاليًا، يمكنك تسجيل الدخول باستخدام حساب Google أو GitHub. عند تسجيل الدخول، ستحصل على 0.5 دولار من الرصيد مجانًا!

الخطوة 2: إنشاء مفتاح API

للمصادقة مع API، قم بتضمين رمز Bearer في رأس الطلب (مثال: -H “Authorization: Bearer ***”). سنقدم لك مفتاح API جديدًا.

يمكنك أيضًا إنشاء المفتاح الخاص بك عن طريق تحديد “إضافة مفتاح جديد”.

الخطوة 3: تنفيذ استدعاء API

مع بضعة أسطر من التعليمات البرمجية، يمكنك تنفيذ استدعاء API والاستفادة من قدرات Hermes 13B والنماذج المتقدمة الأخرى:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    # احصل على مفتاح API الخاص بـ Novita AI من خلال الرابط: https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
    api_key="<مفتاح API الخاص بك من Novita AI>",
)
model = "nousresearch/nous-hermes-llama2-13b"
completion_res = client.completions.create(
    model=model,
    prompt="محادثة بين مستخدم فضولي ومساعد ذكاء اصطناعي".
    stream = True, # أو False
    max_tokens = 512,
)

نماذج مشابهة لـ Hermes 13B

Mythomax-l2–13b على Novita AI

الفكرة وراء Mythomax-l2–13b هي أن كل طبقة تتكون من عدة موترات، كل منها مكلف بوظائف محددة. من خلال الاستفادة من قدرات الفهم القوية لـ MythoLogic-L2 كمدخل، ومهارات الكتابة الواسعة لـ Huginn كمخرج، يتفوق النموذج الناتج في كلا المجالين.

Hermes-2-pro-llama-3–8b على Novita AI

Hermes 2 Pro هو تكرار محسّن ومعاد تدريبه من Nous Hermes 2. يتميز بإصدار محدث ومحسّن من مجموعة بيانات OpenHermes 2.5، بالإضافة إلى مجموعة بيانات جديدة لاستدعاء الوظائف ووضع JSON تم تطويرها داخليًا.

Openhermes-2.5-mistral-7b على Novita AI

OpenHermes 2.5 Mistral 7B هو ضبط دقيق متطور لـ Mistral، وهو استمرار لنموذج OpenHermes 2، الذي تم تدريبه على مجموعات بيانات تعليمات برمجية إضافية.

تعظيم أداء النموذج

للحصول على أقصى استفادة من Hermes 13B، من المهم جدًا معرفة كيفية ضبطه بشكل صحيح. إليك بعض النصائح التي يمكن أن تساعدك في التألق:

ضمان مجموعة بيانات عالية الجودة ومتنوعة

مع مجموعة البيانات الخاصة بك، تأكد من أنها متنوعة وأعلى مستوى لأغراض الضبط. قم بتضمين تعليمات من مجالات مختلفة حتى يصبح النموذج أفضل في فهم وإنشاء الردود.

تحسين طول التسلسل

عند النظر في طول التسلسل، حاول الالتزام بـ 2000 أو أقل للحصول على أفضل النتائج. لا تخف من اختبار أطوال مختلفة؛ قد يساعدك ذلك في العثور على نقطة توازن بين أدائه وطول استجاباته.

ضبط معلمات النموذج

بالنسبة لمعلمات النموذج، قم بتعديلها بناءً على ما تحتاجه تحديدًا. العب مع الإعدادات مثل درجة الحرارة وعقوبة التكرار لضبط مستويات الإبداع واتساق الاستجابة.

البقاء على اطلاع بالتحديثات

بخصوص التحديثات: ابق دائمًا على اطلاع بأحدث إصدارات Hermes 13B عن طريق التحقق بانتظام من الإصدارات الجديدة أو الإصلاحات التي قد تعزز الأداء بشكل أكبر.

من خلال وضع هذه النصائح في الاعتبار وتحسين منهجك تجاه الضبط الدقيق باستمرار، يصبح من الممكن استخراج كل جزء من الإمكانات من Hermes 13B للمهام الذكاء الاصطناعي المتطورة.

الخاتمة

في الختام، يمثل Hermes 13B، الذي طورته Nous Research بالتعاون مع آخرين، قفزة كبيرة إلى الأمام في نماذج اللغة للذكاء الاصطناعي.

لقد استكشفنا مواصفاته الفنية القوية، بما في ذلك قدرته على معالجة المدخلات الطويلة والموارد الحسابية الهائلة وراء ضبطه الدقيق. يضمن تدريب النموذج على مجموعة بيانات منسقة من مخرجات GPT-4 الاصطناعية أداءً عالي الجودة عبر مختلف المجالات، وهو ما ينعكس في تصدره للعديد من المعايير. علاوة على ذلك، تمتد تطبيقاته من أنظمة التدريس الذكية إلى توليد محتوى التسويق الرقمي، مما يعرض تنوعه وفائدته في العالم الحقيقي.

أثناء تفكيرك في الاستفادة من Hermes 13B لمشاريعك الخاصة، تذكر أهمية تحسين جودة مجموعة البيانات، وطول التسلسل، ومعلمات النموذج لتعظيم إمكاناته. ابق على اطلاع بأحدث التطورات لتعزيز أدائه باستمرار.

الأسئلة الشائعة

1. ما هي الاختلافات بين Hermes 13B والإصدارات السابقة؟

أولاً، يتمتع Hermes 13B بطريقة أفضل لتوليد استجابات أطول. ثانيًا، ستلاحظ أنه يختلق الأشياء (يهلوس) بشكل أقل. ثالثًا، لا يحتوي على قواعد OpenAI التي تحد مما يمكنه قوله أو فعله. علاوة على ذلك، في جميع أنواع مهام اللغة، فإنه يؤدي بشكل أفضل. أخيرًا، قاموا بتدريبه على مجموعة بيانات أكبر ومتنوعة هذه المرة.

2. كيفية تنزيل Hermes 13B؟

يمكنك تنزيل نموذج Hermes 13B مجانًا على Hugging Face.

Novita AI هي المنصة السحابية الشاملة التي تمكن طموحاتك في الذكاء الاصطناعي. مع واجهات API المتكاملة بسلاسة، والحوسبة غير الخادمة، وتسريع GPU، نقدم الأدوات الفعالة من حيث التكلفة التي تحتاجها لبناء وتوسيع نطاق أعمالك المدعومة بالذكاء الاصطناعي بسرعة. تخلص من متاعب البنية التحتية وابدأ مجانًا — Novita AI تجعل أحلامك في الذكاء الاصطناعي حقيقة واقعة.

قراءة موصى بها

مقدمة عن Openhermes 2.5: فهم قوة رسول الآلهة

استكشاف MythoMax-L2–13B: المزايا والحدود