Kimi K2.5 متاح الآن على Novita AI: ذكاء اصطناعي متعدد الوسائط للرؤية والبرمجة والوكلاء

جدول المحتويات

ما هو Kimi K2.5؟
الميزات والإمكانيات الرئيسية
أداء ونتائج المعايير
كيفية استخدام Kimi K2.5 على Novita AI
التطبيقات وحالات الاستخدام في العالم الحقيقي
الخلاصة

Kimi K2.5، النموذج الرئيسي مفتوح المصدر متعدد الوسائط والوكيل من Moonshot AI، متاح الآن على Novita AI. يجمع هذا النموذج الاختراقي بين معالجة الرؤية والنص، وأوضاع التفكير والفوري، والتنفيذ متعدد الوكلاء في نظام واحد قوي. تم بناؤه من خلال تدريب مسبق مستمر على ما يقارب 15 تريليون رمز مختلط بصري ونصي، يتفوق Kimi K2.5 على العديد من البدائل مغلقة المصدر.

توفر Novita AI وصولاً سريعًا وبأسعار معقولة إلى Kimi K2.5 عبر كل من تكامل واجهة برمجة التطبيقات و واجهة مساحة اللعب البديهية.

جرّب عرض Kimi K2.5 التوضيحي الآن

ما هو Kimi K2.5؟

المصدر: Artificial Analysis

النموذج الرئيسي متعدد الوسائط والوكيل من Moonshot AI

Kimi K2.5 هو نموذج وكيلي متعدد الوسائط أصلي مفتوح المصدر تم تطويره بواسطة Moonshot AI. تم بناؤه فوق Kimi-K2-Base من خلال تدريب مسبق مستمر على ما يقارب 15 تريليون رمز مختلط بصري ونصي، حيث يدمج النموذج بسلاسة فهم الرؤية واللغة مع إمكانيات وكيلية متقدمة.

على عكس النماذج متعددة الوسائط التقليدية التي تثبت إمكانيات الرؤية على أسس نصية فقط، تم تدريب Kimi K2.5 مسبقًا على رموز الرؤية واللغة من الأساس، مما يتيح التفوق في المعرفة البصرية والاستدلال العابر للوسائط واستخدام الأدوات الوكيلية المبنية على المدخلات البصرية.

نظرة عامة على البنية التحتية

يستخدم Kimi K2.5 بنية تحتية متطورة من نوع خليط الخبراء (MoE):

إجمالي المعلمات: تريليون
العلامات المُفعلة: 32 مليار لكل رمز
عدد الخبراء: 384 (8 مختارون لكل رمز)
طول السياق: 256 ألف رمز
مرمز الرؤية: MoonViT مع 400 مليون معلمة
آلية الانتباه: MLA (الانتباه الكثيف المتعدد الرؤوس)

تتيح هذه البنية التحتية معالجة سياق ضخمة مع الحفاظ على الكفاءة الحسابية من خلال تنشيط الخبراء المتناثرين.

الميزات والإمكانيات الرئيسية

وضعان تشغيليان: التفكير والفوري

وضع التفكير: مصمم للاستدلال المعقد مع عرض محتوى الاستدلال. مثالي للمسائل الرياضية، والتخطيط الاستراتيجي، والمواقف التي تتطلب شفافية في اتخاذ القرار. يستخدم ميزانيات رموز ممتدة (تصل إلى 96 ألف رمز) للمسائل الصعبة.

الوضع الفوري: محسّن للسرعة مع استجابات أسرع دون استدلال ظاهر. مثالي للتطبيقات في الوقت الفعلي، وواجهات المحادثة، والمهام التي تعطي الأولوية للاستجابات الفورية.

يمكن للمطورين التبديل بين الأوضاع باستخدام معامل thinking، مع درجة حرارة موصى بها تبلغ 1.0 لوضع التفكير و 0.6 للوضع الفوري.

تعدد الوسائط الأصلي:

فهم الصور: يضمن مرمز الرؤية MoonViT (400 مليون معلمة) فهمًا بصريًا مفصلًا، من التعرف الضوئي على الحروف في المستندات إلى الاستدلال البصري المعقد.

معالجة الفيديو: يدعم إدخال الفيديو لتطبيقات مثل تحليل المحتوى، وفهم سير العمل، واتباع التعليمات البصرية (تجريبي حاليًا).

سرب الوكلاء

تتيح إمكانية سرب الوكلاء في Kimi K2.5 الانتقال من التنفيذ بواسطة وكيل واحد إلى التنفيذ متعدد الوكلاء المنسق، حيث يتم تفكيك المهام المعقدة إلى مهام فرعية متوازية تنفذها وكلاء مُنشأون ديناميكيًا ومتخصصون في مجالات معينة.

البرمجة مع الرؤية

يتفوق Kimi K2.5 في توليد الكود من المواصفات البصرية:

تحويل تصميمات واجهات المستخدم والنماذج الأولية إلى كود وظيفي
فهم سير عمل الفيديو وتوليد نصوص أتمتة
تنسيق الأدوات بشكل مستقل لمعالجة البيانات البصرية
إجراء تصحيح أخطاء معقد من خلال تحليل لقطات الشاشة وحالات الخطأ

التفكير المتشابك والاستدعاء متعدد الخطوات للأدوات

يقوم النموذج بربط استدعاءات الأدوات المتعددة معًا، ويحافظ على السياق عبر الخطوات، ويعدل الأساليب بناءً على النتائج الوسيطة - وهو أمر ضروري للبحث الوكيلي، وخطوط تحليل البيانات، وسير عمل البحث الآلي.

أداء ونتائج المعايير

يحقق Kimi K2.5 أداءً رائدًا على مستوى العالم عبر مجالات متعددة، مما يرسخ مكانته كرائد في الذكاء الاصطناعي الوكيلي، وفهم الرؤية، وإمكانيات البرمجة.

أفضل أداء عالمي على معايير الوكلاء

يُظهر Kimi K2.5 أداءً غير مسبوق على المهام الوكيلية المعقدة، متفوقًا على جميع المنافسين بما في ذلك GPT-5.2 و Claude Opus 4.5 و Gemini 3 Pro.

المعيار	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
امتحان البشرية الأخير (الكامل)	50.2%	45.5%	43.2%	45.8%
BrowseComp	74.9%	65.8%	57.8%	59.2%
DeepSearchQA	77.1%	71.3%	76.1%	63.2%

الإنجاز الرئيسي: يحقق Kimi K2.5 أفضل أداء عالمي على المجموعة الكاملة لامتحان البشرية الأخير (HLE) بنسبة 50.2% و على BrowseComp بنسبة 74.9%، مما يظهر قدرات استدلال وكيلية وتنقل ويب فائقة.

أفضل أداء مفتوح المصدر على فهم الرؤية

يتصدر Kimi K2.5 النماذج مفتوحة المصدر على معايير تعدد الوسائط والرؤية، حيث يقدم أداءً استثنائيًا على مهام فهم الصور والفيديو.

فهم الصور

المعيار	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
MMMU Pro	78.5%	79.5%	74.0%	81.0%
MathVision	84.2%	83.0%	77.1%	86.1%
OmniDocBench 1.5	88.8%	85.7%	87.7%	88.5%

فهم الفيديو

المعيار	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
VideoMMMU	86.6%	85.9%	84.4%	87.6%
LongVideoBench	79.8%	76.5%	67.2%	77.7%

الإنجاز الرئيسي: يحقق Kimi K2.5 أفضل أداء مفتوح المصدر على MMMU Pro (78.5%) و VideoMMMU (86.6%)، حيث يتفوق في الاستدلال متعدد الوسائط المعقد عبر الصور والفيديو.

أفضل أداء مفتوح المصدر على معايير البرمجة

يُظهر Kimi K2.5 أداءً تنافسيًا في البرمجة، ويتفوق بشكل خاص عند دمج فهم الرؤية مع توليد الكود.

المعيار	Kimi K2.5	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
SWE-bench Verified	76.8%	80.0%	80.9%	76.2%
SWE-bench Multilingual	73.0%	72.0%	77.5%	65.0%

الإنجاز الرئيسي: يحقق Kimi K2.5 أفضل أداء مفتوح المصدر على SWE-bench Verified بنسبة 76.8%، مما يظهر قدرات قوية في هندسة البرمجيات في العالم الحقيقي.

كود بذوق: تصميم جمالي من المدخلات البصرية

بالإضافة إلى معايير البرمجة التقليدية، يتفوق Kimi K2.5 في ترجمة المدخلات البصرية إلى كود جمالي ووظيفي. يمكن للنموذج تحويل المحادثات والصور والفيديو إلى مواقع ويب معبرة مع تصميم حركة متطور، مما يتيح للمطورين إنشاء نماذج أولية سريعة لواجهات جذابة بصريًا من التصاميم المفاهيمية.

سرب الوكلاء (تجريبي): معالجة متوازية على نطاق واسع

تتيح تقنية سرب الوكلاء في Kimi K2.5 عمل وكلاء مستقلين بشكل متوازي على نطاق غير مسبوق:

ما يصل إلى 100 وكيل فرعي يعملون في نفس الوقت على المهام المعقدة
1500 استدعاء أداة منسقة عبر سير عمل متوازية
أسرع بـ 4.5 مرة مقارنة بإعدادات الوكيل الواحد في مهام البحث والاستقصاء المعقدة

تتيح هذه البنية التحتية الرائدة لـ Kimi K2.5 تفكيك المشاكل المعقدة إلى مهام فرعية متخصصة، مما يحسن بشكل كبير السرعة والدقة في سير عمل الوكيل على مستوى المؤسسات.

كيفية استخدام Kimi K2.5 على Novita AI

استخدم مساحة اللعب (لا يتطلب برمجة)

جرب Kimi K2.5 فورًا من خلال مساحة اللعب التفاعلية لـ Novita AI. ارفع صورًا أو فيديوهات، واختبر مطالبات متعددة الوسائط، وبدّل بين وضعي التفكير والفوري مع نافذة السياق الكاملة البالغة 256 ألف رمز.

التكامل عبر واجهة برمجة التطبيقات (للمطورين)

from openai import OpenAI

client = OpenAI(
    api_key="<Your API Key>",
    base_url="https://api.novita.ai/openai"
)

response = client.chat.completions.create(
    model="moonshotai/kimi-k2.5",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello, how are you?"}
    ],
    max_tokens=262144,
    temperature=0.7
)

print(response.choices[0].message.content)

الاتصال بمنصات طرف ثالث

أطر الوكلاء: Continue و AnythingLLM و LangChain و Dify و Langflow عبر موصلات رسمية.

تكامل مع Hugging Face: تعد Novita AI مزود استدلال رسمي لتوافق سلس مع النظام البيئي.

واجهة برمجة تطبيقات متوافقة مع OpenAI: تعمل مع Cline و Kilo Code و Cursor و Trae و OpenCode و Qwen Code مع أقل قدر من التغييرات البرمجية.

واجهة برمجة تطبيقات متوافقة مع Anthropic: تتكامل مع Claude Code لسير عمل البرمجة الوكيلية.

التطبيقات وحالات الاستخدام في العالم الحقيقي

برمجة النمط والتطوير البصري

توليد كود من نماذج أولية لواجهة المستخدم، أو رسومات تخطيطية، أو رسومات يدوية. تفسير سير عمل الفيديو لإنشاء نصوص أتمتة، مما يقلل بشكل كبير من الوقت بين التصميم والتنفيذ.

البحث الوكيلي للمؤسسات

تصفح مواقع ويب متعددة بشكل مستقل، وقارن وتركّب المعلومات من مصادر مختلفة، وتحقق من الحقائق من خلال الرجوع إلى مستندات متعددة، وأدر السياق بشكل فعال حتى عندما تتجاوز نتائج البحث حدود الرموز النموذجية. يقوم وضع سرب الوكلاء بتفكيك الاستعلامات الواسعة إلى مهام فرعية متوازية، وهو مثالي لاستخبارات المنافسين، وأبحاث السوق، ومراجعات الأدبيات الأكاديمية.

مهام الاستدلال المعقد

حل المسائل الرياضية: أداء شبه مثالي في مسابقات الرياضيات (
الاستدلال العلمي: فيزياء وكيمياء وأحياء على مستوى الدراسات العليا
التخطيط الاستراتيجي: اتخاذ قرارات متعددة الخطوات مع استدلال شفاف
التحليل القانوني: مراجعة المستندات وبحث في السوابق القضائية مع نوافذ سياق واسعة

تحليل المحتوى متعدد الوسائط

استخراج وتحليل المعلومات من ملفات PDF، والمستندات الممسوحة ضوئيًا، والرسوم البيانية المعلوماتية. تحليل محتوى الفيديو للامتثال، أو ضمان الجودة، أو الإشراف. فحص صور المنتجات أو لقطات التصنيع لتحديد العيوب.

تنسيق الأدوات المستقل

أتمتة خطوط أنابيب البيانات، ومساعدو بحث يجمعون المعلومات بشكل مستقل ويعدون التقارير، ودعم العملاء الذي يعالج استفسارات متعددة الخطوات معقدة، وأتمتة DevOps لإدارة البنية التحتية وتصحيح الأخطاء.

الخلاصة

يمثل Kimi K2.5 قفزة كبيرة إلى الأمام في الذكاء الاصطناعي متعدد الوسائط مفتوح المصدر، حيث يضاهي أو يتفوق على البدائل مغلقة المصدر عبر مجموعة واسعة من المعايير. بفضل تعدد الوسائط الأصلي، ونافذة السياق البالغة 256 ألف رمز، ووضعي التفكير المزدوجين، وتقنية سرب الوكلاء، يُعتبر Kimi K2.5 أساسًا متعدد الاستخدامات لتطبيقات الذكاء الاصطناعي من الجيل التالي.

هل أنت مستعد لتجربة قوة Kimi K2.5؟ ابدأ البناء باستخدام Kimi K2.5 على Novita AI اليوم وافتح مستقبل الذكاء الاصطناعي متعدد الوسائط مفتوح المصدر.

Novita AI هي منصة سحابة رائدة للذكاء الاصطناعي توفر للمطورين واجهات برمجة تطبيقات سهلة الاستخدام وبنية تحتية لـ GPU موثوقة وبأسعار معقولة لبناء وتوسيع نطاق تطبيقات الذكاء الاصطناعي.

Kimi K2.5 متاح الآن على Novita AI: ذكاء اصطناعي متعدد الوسائط للرؤية والبرمجة والوكلاء

ما هو Kimi K2.5؟