النقاط الرئيسية
متعدد الوسائط، متعدد اللغات، سياق طويل: يعالج Gemma 3 27B النصوص والصور، ويدعم أكثر من 140 لغة، ويتعامل مع ما يصل إلى 128 ألف رمز للمدخلات الطويلة.
درجة Elo: حقق درجة Elo تبلغ 1339، مما يضعه ضمن أفضل 10 نماذج عالميًا.
التوافق مع وحدة معالجة رسومية واحدة: يقدم أداءً متميزًا على وحدة معالجة رسومية واحدة NVIDIA H100، متفوقًا على المنافسين الذين يتطلبون وحدات معالجة رسومية متعددة.
الوصول عبر Novita AI: يقدم Novita AI واجهة برمجة تطبيقات فعالة من حيث التكلفة وملعبًا مجانيًا لاستكشاف قدرات Gemma 3 27B — جربه الآن!
تم إصدار Gemma 3 27B في 12 مارس 2025، وهو إضافة مهمة لمجموعة نماذج اللغة الكبيرة مفتوحة المصدر من Google. بصفته أكبر نموذج في عائلة Gemma 3، إلى جانب المتغيرات المعدلة بالتوجيه ذات الوظائف المحددة، يهدف إلى توفير توازن بين الأداء وإمكانية الوصول. تقدم هذه المقالة نظرة عامة عملية وتقنية على Gemma 3 27B، مع تفاصيل هيكله وقدراته وأدائه في الاختبارات المعيارية والعملية، واعتبارات الأجهزة، وطرق الوصول.
ما هو Gemma 3 27B؟
الميزات البارزة
- دعم متعدد اللغات متقدم: بفضل محلله الجديد، يعمل Gemma 3 بكفاءة عالية عبر أكثر من 140 لغة.
- إدخال متعدد الوسائط: القدرة على معالجة كل من الصور والنصوص تجعله أداة متعددة الاستخدامات لمجموعة من التطبيقات.
- نافذة سياق ممتدة: تسمح سعة 128 ألف رمز بمعالجة مدخلات واسعة ومفصلة.
- مفتوح المصدر وصديق للمجتمع: كونه مفتوح المصدر، يشجع النموذج على التجربة المجتمعية والتبني الواسع.
تاريخ الإصدار، حجم النموذج، مفتوح المصدر
- 12 مارس 2025
- 27 مليار معامل
يضع هذا الحجم Gemma 3 كنموذج كبير قادر على التعامل مع المهام المعقدة والمتنوعة بفعالية. - نموذج مفتوح: تم إصداره كنموذج مفتوح المصدر بواسطة Google.
اللغات المدعومة
-
يدعم أكثر من 140 لغة
- يتميز بمحلل جديد مصمم لدعم متعدد اللغات بشكل أفضل، مما يجعله متعدد الاستخدامات في التطبيقات العالمية.
هيكل النموذج
- التقنية: مبني على نفس البحث والتقنية التي تشغل نماذج Google Gemini 2.0.
- التدريب:
- تم تدريبه على 14 تريليون رمز باستخدام وحدات TPU من Google.
- استخدم إطار JAX للتدريب الفعال والقابل للتطوير.
- التقنيات المستخدمة:
- التقطير
- التعلم التعزيزي (بما في ذلك RLHF و RLMF و RLEF)
- دمج النماذج
- تعزز هذه التقنيات أداء النموذج في المجالات الحيوية مثل الرياضيات و البرمجة و اتباع التعليمات.
القدرة متعددة الوسائط
- متعدد الوسائط: نعم
- يعالج كل من الصور والنصوص كمدخل ويولد نصًا كمخرج.
- مشفر الرؤية: يعتمد على SigLIP.
نافذة السياق
-
128 ألف رمز
- يسمح للنموذج بمعالجة وفهم كميات كبيرة من المعلومات للمهام المتطورة.
- تفاصيل ما قبل التدريب:
- تم تدريبه مبدئيًا بتسلسلات 32 ألفًا ثم تم توسيعه إلى 128 ألفًا.
- تم تحقيقه من خلال تعديلات على التضمينات الموضعية باستخدام RoPE (التضمينات الموضعية الدوارة).
دقة التكميم
-
دقة التدريب الافتراضية: bfloat16
- ملاحظة الأداء: تعمل النماذج بشكل أفضل باستخدام bfloat16، وقد تتدهور الجودة مع الدقة الأخرى.
-
خيارات التكميم:
- تجارب المجتمع بمستويات تكميم مثل Q8 gguf quant و EXL2 و IQ4_XS لتحسين استخدام ذاكرة VRAM.
| مستوى الدقة | الأوزان فقط (جيجابايت) | الأوزان + التخزين المؤقت KV (جيجابايت) |
|---|---|---|
| bf16 (خام) | 54.0 | 72.7 |
| INT4 | 14.1 | 32.8 |
| INT4 (كتل=32) | 15.3 | 34.0 |
| SFP8 | 27.4 | 46.1 |
اختبار Gemma 3 27B
أداء الدردشة
أظهر Gemma 3 27B قدرات ممتازة في التقييمات الأخيرة، حيث حصل على درجة Elo تبلغ 1339 في منصة LMSys Chatbot Arena. يضع هذا الأداء النموذج ضمن أفضل 10 نماذج، بما في ذلك النماذج الرائدة مغلقة المصدر مثل o1-preview، ويبرز قوته في تقييمات تفضيلات البشر. بالإضافة إلى ذلك، يحقق Gemma 3 27B هذه الدرجة العالية بينما يتطلب فقط وحدة معالجة رسومية واحدة من نوع NVIDIA H100، على عكس المنافسين الذين يعتمدون على ما يصل إلى 32 وحدة معالجة رسومية لأداء مماثل.

من Hugging Face
الأداء في الاختبارات المعيارية المحددة
حقق الإصدار المعدل بالتوجيه، Gemma 3 27B IT، نتائج تنافسية عبر مجموعة من التقييمات، وغالبًا ما ينافس نماذج Gemini المغلقة:
| الاختبار المعياري | الدرجة | الوصف |
|---|---|---|
| MMLU-Pro | 67.5 | أداء قوي في فهم اللغة متعددة المهام. |
| LiveCodeBench | 29.7 | يظهر نجاحًا معتدلًا في تحديات البرمجة المباشرة. |
| Bird-SQL | 54.4 | نتائج تنافسية في توليد وفهم استعلامات SQL. |
| GPQA Diamond | 42.4 | أداء جيد في الإجابة على الأسئلة العامة. |
| MATH | 69.0 | يتفوق في حل المشكلات الرياضية المعقدة. |
| FACTS Grounding | 74.9 | تأريض واقعي ممتاز ودقة في المهام القائمة على المعرفة. |
| MMMU | 64.9 | أداء قوي في مهام الفهم متعدد الوسائط. |
| SimpleQA | 10.0 | أداء أقل في الإجابة على الأسئلة الأساسية القائمة على الحقائق، مما يترك مجالًا للتحسين. |
متطلبات أجهزة Gemma 3 27B
يوصف Gemma 3 27B بأنه “النموذج الأكثر قدرة الذي يمكنك تشغيله على وحدة معالجة رسومية واحدة”!
من Google
| الإعداد | متطلبات VRAM | ملاحظات |
|---|---|---|
| نشر سحابي | حوالي 80 جيجابايت VRAM (وحدة/وحدات متعددة) | يوصى باستخدام وحدات A100 أو H100 للحصول على أداء مثالي للنشر السحابي. أو RTX 4090 24GB (x3) |
| Apple Silicon | مدعوم بواسطة Gemma 3 4B عبر mlx-vlm | يتم شحن Gemma 3 4B مع دعم اليوم الأول في mlx-vlm، وهي مكتبة مفتوحة المصدر لتشغيل نماذج الرؤية واللغة على أجهزة Apple Silicon، بما في ذلك أجهزة Mac و iPhone. |
اختبار Gemma 3 27B
البرمجة
الموجه: قم بإنشاء محاكاة JavaScript لكرة دوارة ثلاثية الأبعاد مكونة من أحرف أبجدية. يجب أن تكون الحروف الأقرب بلون أكثر سطوعًا، بينما تظهر البعيدة باللون الرمادي.
المخرجات: يبدو أن النموذج لم يلتزم بالكامل بالموجه. بدلاً من ذلك، قام بإنشاء حلقة دوارة بأحرف أبجدية. بالإضافة إلى ذلك، فشلت المعاينتان الأوليتان بسبب عدم كفاية السطوع.

الاستدلال المنطقي
الموجه: لديك 14 تفاحة. تأخذ إيما 3 لكنها تعيد 2. تسقط 7 وتلتقط 4. يأخذ ليو 4 ويعطي 5. تأخذ تفاحة واحدة من إيما وتتبادلها مع ليو مقابل 3 تفاحات، ثم تعطي تلك الـ 3 لإيما، التي تعطيك تفاحة وبرتقالة. تأخذ زارا تفاحتك وتعطيك كمثرى. تبادل الكمثرى مع ليو مقابل تفاحة. لاحقًا، تبادل زارا تفاحة مقابل برتقالة وتستبدلها معك بتفاحة أخرى. كم عدد الكمثرى لديك؟ أجب فقط عما هو مطلوب.
المخرجات: في غضون ثوانٍ، حلل جميع السيناريوهات بكفاءة وحسب العدد الإجمالي للكمثرى بدقة.

تحليل الصور
الموجه: أخبرني كم مرة زادت درجة elo من gemma 2 27b إلى gemma 3 27b؟

من Google
المخرجات: حدد الأرقام بدقة لكنه لم يحسب المضاعفات كما هو مطلوب في الموجه؛ بدلاً من ذلك، قام بحساب الفرق فقط.
بناءً على الصورة، إليك الحساب:
- درجة Elo لـ Gemma 2 27B: 1220
- درجة Elo لـ Gemma 3 27B: 1338
الزيادة: 1338 - 1220 = 118
زادت درجة Elo بمقدار 118 نقطة من Gemma 2 27B إلى Gemma 3 27B.
كيفية الوصول إلى Gemma 3 27B؟
Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير GPU سحابي ميسور التكلفة وموثوق للبناء والتوسع.
الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج
سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

جرب نسخة Gemma 3 27B التجريبية الآن!
الخطوة 2: ابدأ النسخة التجريبية المجانية
ابدأ النسخة التجريبية المجانية لاستكشاف قدرات النموذج المحدد.

الخطوة 3: احصل على مفتاح API الخاص بك
للمصادقة مع واجهة برمجة التطبيقات، سنزودك بمفتاح API جديد. بالانتقال إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 4: تثبيت واجهة برمجة التطبيقات
قم بتثبيت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة الخاصة بك.

بعد التثبيت، قم باستيراد المكتبات الضرورية في بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال على استخدام واجهة برمجة تطبيقات chat completions لمستخدمي Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "google/gemma-3-27b-it"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Gemma 3 27B هو نموذج قوي مفتوح المصدر من Google، يقدم استدلالًا منطقيًا قويًا، وقدرات متعددة الوسائط، ودعمًا متعدد اللغات، وتكاملًا سهلاً مع منصات مثل Hugging Face، كل ذلك أثناء العمل على أجهزة تجارية.
الأسئلة المتداولة
كم عدد المعاملات في Gemma 3 27B؟
يحتوي Gemma 3 27B على 27 مليار معامل.
هل Gemma 3 27B متعدد الوسائط؟
نعم، يدعم إدخال الصور والنصوص.
ما الأجهزة الموصى بها لتشغيل Gemma 3 27B؟
للاستخدام المحلي، يوصى باستخدام وحدة معالجة رسومية بسعة 24 جيجابايت VRAM على الأقل، مع فائدة وجود VRAM أكبر للأحجام السياقية الأكبر. يمكن أيضًا نشره على منصات سحابية مثل Hugging Face Inference Endpoints مع خيارات GPU متنوعة. أو يمكنك اختيار واجهة برمجة تطبيقات فعالة مثل Novita AI لاستخدامه!
Novita AI هي منصة سحابية للذكاء الاصطناعي تقدم للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة لدينا، مع توفير GPU سحابي ميسور التكلفة وموثوق للبناء والتوسع.
