Gemma 3 27B على Novita AI: هل هو حقًا نموذج يعمل على وحدة معالجة رسومية واحدة؟

Gemma 3 27B على Novita AI: هل هو حقًا نموذج يعمل على وحدة معالجة رسومية واحدة؟

النقاط الرئيسية

متعدد الوسائط، متعدد اللغات، سياق طويل: يعالج Gemma 3 27B النصوص والصور، ويدعم أكثر من 140 لغة، ويتعامل مع ما يصل إلى 128 ألف رمز للمدخلات الطويلة.

درجة Elo: حقق درجة Elo تبلغ 1339، مما يضعه ضمن أفضل 10 نماذج عالميًا.

التوافق مع وحدة معالجة رسومية واحدة: يقدم أداءً متميزًا على وحدة معالجة رسومية واحدة NVIDIA H100، متفوقًا على المنافسين الذين يتطلبون وحدات معالجة رسومية متعددة.

الوصول عبر Novita AI: يقدم Novita AI واجهة برمجة تطبيقات فعالة من حيث التكلفة وملعبًا مجانيًا لاستكشاف قدرات Gemma 3 27B — جربه الآن!

تم إصدار Gemma 3 27B في 12 مارس 2025، وهو إضافة مهمة لمجموعة نماذج اللغة الكبيرة مفتوحة المصدر من Google. بصفته أكبر نموذج في عائلة Gemma 3، إلى جانب المتغيرات المعدلة بالتوجيه ذات الوظائف المحددة، يهدف إلى توفير توازن بين الأداء وإمكانية الوصول. تقدم هذه المقالة نظرة عامة عملية وتقنية على Gemma 3 27B، مع تفاصيل هيكله وقدراته وأدائه في الاختبارات المعيارية والعملية، واعتبارات الأجهزة، وطرق الوصول.

ما هو Gemma 3 27B؟

الميزات البارزة

  • دعم متعدد اللغات متقدم: بفضل محلله الجديد، يعمل Gemma 3 بكفاءة عالية عبر أكثر من 140 لغة.
  • إدخال متعدد الوسائط: القدرة على معالجة كل من الصور والنصوص تجعله أداة متعددة الاستخدامات لمجموعة من التطبيقات.
  • نافذة سياق ممتدة: تسمح سعة 128 ألف رمز بمعالجة مدخلات واسعة ومفصلة.
  • مفتوح المصدر وصديق للمجتمع: كونه مفتوح المصدر، يشجع النموذج على التجربة المجتمعية والتبني الواسع.

تاريخ الإصدار، حجم النموذج، مفتوح المصدر

  • 12 مارس 2025
  • 27 مليار معامل
    يضع هذا الحجم Gemma 3 كنموذج كبير قادر على التعامل مع المهام المعقدة والمتنوعة بفعالية.
  • نموذج مفتوح: تم إصداره كنموذج مفتوح المصدر بواسطة Google.

اللغات المدعومة

  • يدعم أكثر من 140 لغة

    • يتميز بمحلل جديد مصمم لدعم متعدد اللغات بشكل أفضل، مما يجعله متعدد الاستخدامات في التطبيقات العالمية.

هيكل النموذج

  • التقنية: مبني على نفس البحث والتقنية التي تشغل نماذج Google Gemini 2.0.
  • التدريب:
    • تم تدريبه على 14 تريليون رمز باستخدام وحدات TPU من Google.
    • استخدم إطار JAX للتدريب الفعال والقابل للتطوير.
    • التقنيات المستخدمة:
      • التقطير
      • التعلم التعزيزي (بما في ذلك RLHF و RLMF و RLEF)
      • دمج النماذج
    • تعزز هذه التقنيات أداء النموذج في المجالات الحيوية مثل الرياضيات و البرمجة و اتباع التعليمات.

القدرة متعددة الوسائط

  • متعدد الوسائط: نعم
    • يعالج كل من الصور والنصوص كمدخل ويولد نصًا كمخرج.
  • مشفر الرؤية: يعتمد على SigLIP.

نافذة السياق

  • 128 ألف رمز

    • يسمح للنموذج بمعالجة وفهم كميات كبيرة من المعلومات للمهام المتطورة.
    • تفاصيل ما قبل التدريب:
      • تم تدريبه مبدئيًا بتسلسلات 32 ألفًا ثم تم توسيعه إلى 128 ألفًا.
      • تم تحقيقه من خلال تعديلات على التضمينات الموضعية باستخدام RoPE (التضمينات الموضعية الدوارة).

دقة التكميم

  • دقة التدريب الافتراضية: bfloat16

    • ملاحظة الأداء: تعمل النماذج بشكل أفضل باستخدام bfloat16، وقد تتدهور الجودة مع الدقة الأخرى.
  • خيارات التكميم:

    • تجارب المجتمع بمستويات تكميم مثل Q8 gguf quant و EXL2 و IQ4_XS لتحسين استخدام ذاكرة VRAM.
مستوى الدقة الأوزان فقط (جيجابايت) الأوزان + التخزين المؤقت KV (جيجابايت)
bf16 (خام) 54.0 72.7
INT4 14.1 32.8
INT4 (كتل=32) 15.3 34.0
SFP8 27.4 46.1

اختبار Gemma 3 27B

أداء الدردشة

أظهر Gemma 3 27B قدرات ممتازة في التقييمات الأخيرة، حيث حصل على درجة Elo تبلغ 1339 في منصة LMSys Chatbot Arena. يضع هذا الأداء النموذج ضمن أفضل 10 نماذج، بما في ذلك النماذج الرائدة مغلقة المصدر مثل o1-preview، ويبرز قوته في تقييمات تفضيلات البشر. بالإضافة إلى ذلك، يحقق Gemma 3 27B هذه الدرجة العالية بينما يتطلب فقط وحدة معالجة رسومية واحدة من نوع NVIDIA H100، على عكس المنافسين الذين يعتمدون على ما يصل إلى 32 وحدة معالجة رسومية لأداء مماثل.

درجات elo

من Hugging Face

الأداء في الاختبارات المعيارية المحددة

حقق الإصدار المعدل بالتوجيه، Gemma 3 27B IT، نتائج تنافسية عبر مجموعة من التقييمات، وغالبًا ما ينافس نماذج Gemini المغلقة:

الاختبار المعياري الدرجة الوصف
MMLU-Pro 67.5 أداء قوي في فهم اللغة متعددة المهام.
LiveCodeBench 29.7 يظهر نجاحًا معتدلًا في تحديات البرمجة المباشرة.
Bird-SQL 54.4 نتائج تنافسية في توليد وفهم استعلامات SQL.
GPQA Diamond 42.4 أداء جيد في الإجابة على الأسئلة العامة.
MATH 69.0 يتفوق في حل المشكلات الرياضية المعقدة.
FACTS Grounding 74.9 تأريض واقعي ممتاز ودقة في المهام القائمة على المعرفة.
MMMU 64.9 أداء قوي في مهام الفهم متعدد الوسائط.
SimpleQA 10.0 أداء أقل في الإجابة على الأسئلة الأساسية القائمة على الحقائق، مما يترك مجالًا للتحسين.

متطلبات أجهزة Gemma 3 27B

يوصف Gemma 3 27B بأنه “النموذج الأكثر قدرة الذي يمكنك تشغيله على وحدة معالجة رسومية واحدة”!

درجة ELO من Google

الإعداد متطلبات VRAM ملاحظات
نشر سحابي حوالي 80 جيجابايت VRAM (وحدة/وحدات متعددة) يوصى باستخدام وحدات A100 أو H100 للحصول على أداء مثالي للنشر السحابي. أو RTX 4090 24GB (x3)
Apple Silicon مدعوم بواسطة Gemma 3 4B عبر mlx-vlm يتم شحن Gemma 3 4B مع دعم اليوم الأول في mlx-vlm، وهي مكتبة مفتوحة المصدر لتشغيل نماذج الرؤية واللغة على أجهزة Apple Silicon، بما في ذلك أجهزة Mac و iPhone.

اختبار Gemma 3 27B

البرمجة

الموجه: قم بإنشاء محاكاة JavaScript لكرة دوارة ثلاثية الأبعاد مكونة من أحرف أبجدية. يجب أن تكون الحروف الأقرب بلون أكثر سطوعًا، بينما تظهر البعيدة باللون الرمادي.

المخرجات: يبدو أن النموذج لم يلتزم بالكامل بالموجه. بدلاً من ذلك، قام بإنشاء حلقة دوارة بأحرف أبجدية. بالإضافة إلى ذلك، فشلت المعاينتان الأوليتان بسبب عدم كفاية السطوع.

اختبار برمجة gemma 3 27b

الاستدلال المنطقي

الموجه: لديك 14 تفاحة. تأخذ إيما 3 لكنها تعيد 2. تسقط 7 وتلتقط 4. يأخذ ليو 4 ويعطي 5. تأخذ تفاحة واحدة من إيما وتتبادلها مع ليو مقابل 3 تفاحات، ثم تعطي تلك الـ 3 لإيما، التي تعطيك تفاحة وبرتقالة. تأخذ زارا تفاحتك وتعطيك كمثرى. تبادل الكمثرى مع ليو مقابل تفاحة. لاحقًا، تبادل زارا تفاحة مقابل برتقالة وتستبدلها معك بتفاحة أخرى. كم عدد الكمثرى لديك؟ أجب فقط عما هو مطلوب.

المخرجات: في غضون ثوانٍ، حلل جميع السيناريوهات بكفاءة وحسب العدد الإجمالي للكمثرى بدقة.

تحليل الصور

الموجه: أخبرني كم مرة زادت درجة elo من gemma 2 27b إلى gemma 3 27b؟

درجة ELO

من Google

المخرجات: حدد الأرقام بدقة لكنه لم يحسب المضاعفات كما هو مطلوب في الموجه؛ بدلاً من ذلك، قام بحساب الفرق فقط.

بناءً على الصورة، إليك الحساب:

  • درجة Elo لـ Gemma 2 27B: 1220
  • درجة Elo لـ Gemma 3 27B: 1338

الزيادة: 1338 - 1220 = 118

زادت درجة Elo بمقدار 118 نقطة من Gemma 2 27B إلى Gemma 3 27B.

كيفية الوصول إلى Gemma 3 27B؟

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير GPU سحابي ميسور التكلفة وموثوق للبناء والتوسع.

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

تسجيل الدخول والوصول إلى مكتبة النماذج

جرب نسخة Gemma 3 27B التجريبية الآن!

الخطوة 2: ابدأ النسخة التجريبية المجانية

ابدأ النسخة التجريبية المجانية لاستكشاف قدرات النموذج المحدد.

بدء نسخة تجريبية مجانية على gemma 3

الخطوة 3: احصل على مفتاح API الخاص بك

للمصادقة مع واجهة برمجة التطبيقات، سنزودك بمفتاح API جديد. بالانتقال إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

احصل على مفتاح API

الخطوة 4: تثبيت واجهة برمجة التطبيقات

قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

تثبيت واجهة برمجة التطبيقات على gemma 3

بعد التثبيت، قم باستيراد المكتبات الضرورية في بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام واجهة برمجة تطبيقات chat completions لمستخدمي Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "google/gemma-3-27b-it"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Gemma 3 27B هو نموذج قوي مفتوح المصدر من Google، يقدم استدلالًا منطقيًا قويًا، وقدرات متعددة الوسائط، ودعمًا متعدد اللغات، وتكاملًا سهلاً مع منصات مثل Hugging Face، كل ذلك أثناء العمل على أجهزة تجارية.

الأسئلة المتداولة

كم عدد المعاملات في Gemma 3 27B؟

يحتوي Gemma 3 27B على 27 مليار معامل.

هل Gemma 3 27B متعدد الوسائط؟

نعم، يدعم إدخال الصور والنصوص.

ما الأجهزة الموصى بها لتشغيل Gemma 3 27B؟

للاستخدام المحلي، يوصى باستخدام وحدة معالجة رسومية بسعة 24 جيجابايت VRAM على الأقل، مع فائدة وجود VRAM أكبر للأحجام السياقية الأكبر. يمكن أيضًا نشره على منصات سحابية مثل Hugging Face Inference Endpoints مع خيارات GPU متنوعة. أو يمكنك اختيار واجهة برمجة تطبيقات فعالة مثل Novita AI لاستخدامه!

Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير GPU سحابي ميسور التكلفة وموثوق للبناء والتوسع.

قراءات موصى بها