نقطة نهاية GPT-OSS من Novita: أداء رائد

في Novita AI، نحن ملتزمون بتزويد المطورين بإمكانية وصول سريعة وموثوقة وبأسعار معقولة إلى أفضل نماذج الذكاء الاصطناعي. عندما أصدرت OpenAI نماذجها مفتوحة المصدر، GPT-OSS 120B و20B، قمنا باستضافتها في نفس اليوم. لكن مجرد نشر نموذج لا يكفي. لهذا السبب كرس فريقنا الهندسي أسبوعًا كاملاً لهدف واحد: تحسين نقاط نهاية GPT-OSS لدينا لتقديم تجربة مستخدم استثنائية.

النتيجة؟ تم تصنيف نقطة نهاية Novita كأفضل أداء في الصناعة، وقد تم التحقق من ذلك من قبل Artificial Analysis، وهي منصة تحليل مستقلة لنماذج الذكاء الاصطناعي ومزودي الاستضافة.

العنوان: GPT OSS 120B
المصدر: Hugging Face

ما هو GPT-OSS-120B؟

GPT-OSS-120B هو أحد نماذج OpenAI الجديدة ذات الأوزان المفتوحة التي تم إصدارها في أغسطس 2025، ويتميز بتصميم mixture-of-experts (MoE) مع 117 مليار معلمة. يقوم بتفعيل مجموعة فرعية فقط من تلك المعلمات لكل رمز، مما يتيح استدلالًا فعالًا مع الحفاظ على قدرات تفكير قوية. يدعم هذا النموذج ميزات متقدمة مثل استخدام الأدوات، ونوافذ السياق الموسعة، والتفكير المعقد، كل ذلك بموجب ترخيص Apache 2.0.

التحدي: موازنة متعددة الأبعاد

يتطلب استضافة نماذج LLM مثل GPT-OSS 120B موازنة عدة مقاييس في وقت واحد. كان علينا تحسين عدة مقاييس رئيسية في آنٍ واحد:

الكمون (Latency): ما مدى سرعة استجابة النموذج لطلب المستخدم؟ الكمون المنخفض، خاصة وقت أول رمز (time to first token)، أمر بالغ الأهمية لتجربة محادثة جيدة للمستخدم.
الإنتاجية (Throughput): كم رمزًا في الثانية يمكن لنقطة نهاية Novita معالجتها؟ الإنتاجية العالية تضمن السرعة مما يؤثر بشكل مباشر على تجربة المستخدم.
نافذة السياق (Context Window): هل يمكن للنموذج التعامل مع الاستفسارات الطويلة والمعقدة؟ تمتلك نماذج GPT-OSS نافذة سياق ضخمة تبلغ 131,072 رمزًا، وكان علينا التأكد من أن نشرنا لدعم هذه القدرات بشكل كامل.
جودة النموذج: هل يحافظ تحسيننا على القدرات الأساسية للنموذج، مثل استدعاء الدوال (function calling) (المعروف أيضًا باستدعاء الأدوات) والمخرجات المنظمة/JSON؟ لقد مكننا التفكير وتأكدنا من أن نشرنا لا يقدم أخطاء أو يضر بدقة/قدرات التفكير للنموذج.

النتائج: ما حققناه

لقد أثمر عملنا الجاد. حصلت نقطة نهاية Novita على تصنيف عالٍ في تقرير Artificial Analysis تقرير قياس أداء ومقارنة مزودي API لـ GPT-OSS-120B (عالٍ). تم الاعتراف بنا كأفضل أداء في معايير التفكير AIME (امتحان الرياضيات التمهيدي الأمريكي) و GPQA (أسئلة وأجوبة على مستوى الدراسات العليا المقاومة لجوجل). قدمت Novita بعضًا من أعلى درجات الدقة، والأفضل من ذلك كله، أن تكاليفنا كانت من بين الأقل.

العنوان: ترتيب أداء GPTOSS 120B AIME25x32 حسب مزود LLM
المصدر: Artificial Analysis

العنوان: ترتيب أداء GPTOSS 120B GPQAx16 حسب مزود LLM
المصدر: Artificial Analysis

كما أبرز التقرير أسعارنا التنافسية وسرعتنا:

نافذة السياق: تدعم نقطة نهاية Novita بشكل كامل نافذة السياق الرائعة للنموذج البالغة 131 ألف رمز
إجمالي وقت الاستجابة من البداية إلى النهاية: 11.11 ثانية