يواجه المطورون اليوم تعقيدًا متزايدًا عند بناء التطبيقات الذكية التي تجمع بين الرؤية والأكواد. تعاني النماذج النصية التقليدية من صعوبة في فهم واجهات المستخدم، وترجمة التخطيطات، والاستدلال البصري المنظم. Qwen3-VL-235B-A22B يسد هذه الفجوة من خلال تصميم متعدد الوسائط قوي يدمج الإدراك البصري مع منطق البرمجة.
سيفهم القراء ليس فقط كيف يتفوق Qwen3-VL-235B-A22B على النماذج المماثلة مثل GLM-4.5V، ولكن أيضًا كيفية تنفيذه بكفاءة عبر بيئات التطوير مثل Cursor و Trae و Codex.
ما هو Qwen3-VL-235B-A22B؟
نوع النموذج: نموذج كبير متعدد الوسائط (رؤية-لغة) من عائلة Qwen3.
البنية: مزيج من الخبراء (MoE) مع ~235 مليار معلمة إجمالية، ~22 مليار معلمة مُفعلة لكل استدلال.
طول السياق: يدعم ما يصل إلى 256 ألف رمز، ويمكن تمديده إلى 1 مليون رمز.
القدرات البصرية: يتفوق في التعرف على عناصر واجهة المستخدم الرسومية (GUI)، وتحويل لقطات الشاشة إلى أكواد (HTML/CSS/JS/Draw.io)، والاستدلال المكاني ثنائي وثلاثي الأبعاد.
الأداء اللغوي: يطابق نماذج اللغات الكبيرة النصية فقط في الفهم والاستدلال مع دمج الإدخال البصري بسلاسة.
التعرف الضوئي على الحروف (OCR) واللغات المتعددة: يتعامل مع 32 لغة بأداء قوي في حالات التمويه، الميلان، أو الإضاءة المنخفضة.
النسخ:
- Instruct — مُحسّن للمهام التفاعلية والحوار.
- Thinking — مُعدل للاستدلال المطول واستدلال سلسلة الأفكار.
يتفوق Qwen3-VL-235B-A22B في التعرف الضوئي على الحروف (OCR)، والاستدلال على واجهات المستخدم الرسومية (GUI)، وتوليد الأكواد، مما يظهر كفاءة متعددة الوسائط واسعة. وتكمن نقاط الضعف الرئيسية في التأسيس المكاني ثلاثي الأبعاد المعقد ومهام المحاذاة الذاتية. بشكل عام، هو أحد أكثر نماذج الرؤية-اللغة توازنًا وأداءً عاليًا التي تم اختبارها حاليًا.

من Qwen
كيفية استخدام Qwen3-VL-235B-A22B لإنشاء عرض أكواد سريع؟
يُظهر Qwen3-VL-235B-A22B قوة لا مثيل لها في البرمجة البصرية. مع رقم قياسي 92.0 في Design2Code و 80.5 في ChartMimic، يمكنه ترجمة الواجهات المعقدة والرسوم البيانية واللوحات التحكم بدقة إلى أكواد نظيفة وقابلة للتنفيذ.
تقدم Novita AI واجهات برمجة تطبيقات (APIs) تدعم نافذة سياق تبلغ 32.8 ألف رمز، بسعر 0.98 دولار لكل 1 ألف رمز إدخال و 3.95 دولار لكل 1 ألف رمز إخراج. توفر أداءً قويًا مع متوسط زمن استجابة يبلغ 1.17 ثانية ومعدل إنتاجية يبلغ 26.78 رمز في الثانية (TPS).
كيفية تطوير قدرات البرمجة لـ Qwen3-VL-235B-A22B؟
هندسة الأوامر لسير العمل من البصري إلى الأكواد
- أولاً، اطلب من النموذج وصف صورة واجهة المستخدم أو الرسم البياني بالتفصيل، ثم اطلب توليد الأكواد. (التقنية: سلسلة الوصف).
- قدم أمثلة واضحة لتحويلات “لقطة الشاشة → HTML/CSS/JS” حتى يتعلم النموذج تعيين الأنماط.
تكامل الأدوات والوكلاء
- تفعيل قدرة النموذج على استدعاء أدوات تحرير الأكواد: فتح الملفات، تطبيق الفروقات، تشغيل الاختبارات. استخدمه كـ “مساعد” تفاعلي بدلاً من مولد أكواد ثابت.
- حلقة: خطط → تصرف → لاحظ → عدل، مع ملاحظات حقيقية من أدوات فحص الأكواد/الاختبارات، حتى يحسن النموذج أداءه عبر البيئة.
الضبط الدقيق / ضبط التعليمات على مجموعات بيانات الأكواد
- اجمع مجموعات بيانات من لقطات شاشة واجهات المستخدم + الأكواد المستهدفة + الاختبارات. اضبط النموذج بدقة (أو استخدم LoRA) مع مزيج من حوارات الاستدلال وتوليد الأكواد.
- امزج مهام الاستدلال ومهام الأكواد حتى يحتفظ النموذج بفهم المنطق والتنفيذ.
الوعي بالسياق الطويل والملفات المتعددة
- استغل نافذة السياق الكبيرة للنموذج (تصل إلى 256 ألف رمز) لتغذية المشاريع بالكامل: ملفات متعددة، تبعيات، مواصفات الواجهات.
- أضف مراجع عبر الملفات ومواصفات المهام حتى يكون إخراج الأكواد سياقيًا وصحيحًا.
التقييم والتكرار
- قيم الأداء باستخدام مهام مثل “تحويل نموذج واجهة المستخدم → أكواد” (مقاييس: الصحة، دقة واجهة المستخدم، وقت التشغيل).
- راقب أنواع الأخطاء (عدم تطابق التخطيط، أخطاء منطقية، تبعيات مفقودة) وكرر مجموعة البيانات والأوامر وفقًا لذلك.
كيفية الوصول إلى Qwen3-VL-235B-A22B؟
1. الواجهة (الأسهل للمبتدئين)

2. الوصول عبر واجهة برمجة التطبيقات (للمطورين)
الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج
سجل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

الخطوة 2: اختر النموذج الخاص بك
تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ تجربتك المجانية
ابدأ تجربتك المجانية لاستكشاف قدرات النموذج المحدد.

الخطوة 4: احصل على مفتاح واجهة برمجة التطبيقات الخاص بك
للمصادقة مع واجهة برمجة التطبيقات، سنزودك بمفتاح API جديد. عند الدخول إلى صفحة “الإعدادات”، يمكنك نسخ مفتاح API كما هو موضح في الصورة.

الخطوة 5: تثبيت واجهة برمجة التطبيقات
ثبت واجهة برمجة التطبيقات باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.
بعد التثبيت، استورد المكتبات الضرورية إلى بيئة التطوير الخاصة بك. قم بتهيئة واجهة برمجة التطبيقات باستخدام مفتاح API الخاص بك لبدء التفاعل مع نماذج اللغات الكبيرة لـ Novita AI. هذا مثال على استخدام واجهة برمجة تطبيقات إكمال الدردشة لمستخدمي بايثون.
curl "https://api.novita.ai/openai/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer session_edv1fJHNhzoHlVygGK0VnwTpo2gxM4nMxwcg-Wp0sEDOr0f-lQSFbRWwqOUMyXhtRQHShteDw48v2QNP86fLPA==" \
-d @- << 'EOF'
{
"model": "qwen/qwen3-vl-235b-a22b-thinking",
"messages": [
{
"role": "system",
"content": "Be a helpful assistant"
},
{
"role": "user",
"content": "Hi there!"
}
],
"response_format": { "type": "text" },
"max_tokens": 16384,
"temperature": 1,
"top_p": 1,
"min_p": 0,
"top_k": 50,
"presence_penalty": 0,
"frequency_penalty": 0,
"repetition_penalty": 1
}
EOF
3. النشر المحلي أو نقطة نهاية مخصصة
المتطلبات:
- Qwen3-VL-235B-A22B: 8 وحدات معالجة رسومية NVIDIA H200.
خطوات التثبيت:
- تنزيل أوزان النموذج من HuggingFace أو ModelScope
- اختر إطار عمل الاستدلال: مدعوم من vLLM أو SGLang
- اتبع دليل النشر في مستودع GitHub الرسمي
ستختار نقطة نهاية مخصصة عندما تحتاج إلى استدلال مستقر عالي الأداء، وتحكم مخصص في النموذج، وتكلفة أقل تحت أحمال عمل مستمرة أو ثقيلة، بدلاً من صيانة وحدات المعالجة الرسومية المحلية والبنية التحتية.

جرب نقطة النهاية المخصصة الآن!
4. تكامل أدوات وكلاء الأكواد
باستخدام خدمة Novita AI، يمكنك تجاوز القيود الإقليمية لـ Claude Code. توفر Novita AI أيضًا أدلة وصول لـ Trae و Qwen Code، والتي يمكن العثور عليها في المقالات التالية.
توفر Novita أيضًا ضمانات اتفاقية مستوى الخدمة (SLA) مع استقرار خدمة بنسبة 99%، مما يجعلها مناسبة بشكل خاص للسيناريوهات عالية التردد مثل توليد الأكواد والاختبارات الآلية.
بالإضافة إلى Deepseek 0324، يمكن للمستخدمين أيضًا الوصول إلى نماذج برمجة قوية مثل Kimi-k2 و Qwen3 Coder، التي أداءها قريب من Sonnet 4 المغلق لـ Claude، بتكلفة أقل من خُمس التكلفة الأصلية.
أولاً: احصل على مفتاح API

Qwen3-VL-235B-A22B في Cursor
الخطوة 1: تثبيت وتفعيل Cursor
- قم بتنزيل أحدث إصدار من بيئة التطوير المتكاملة Cursor من cursor.com
- اشترك في الخطة الاحترافية لتفعيل الميزات المعتمدة على واجهة برمجة التطبيقات
- افتح التطبيق وأنهِ التهيئة الأولية
الخطوة 2: الوصول إلى إعدادات النماذج المتقدمة

- افتح إعدادات Cursor (استخدم Ctrl + F للعثور عليها بسرعة)
- انتقل إلى علامة التبويب “النماذج” في القائمة اليسرى
- ابحث عن قسم “تهيئة واجهة برمجة التطبيقات”
الخطوة 3: تكوين تكامل Novita AI
- قم بتوسيع قسم “مفاتيح واجهة برمجة التطبيقات”
- ✅ تفعيل مفتاح التبديل “مفتاح API OpenAI”
- ✅ تفعيل مفتاح التبديل “تجاوز عنوان URL الأساسي لـ OpenAI”
- في حقل “مفتاح API OpenAI”: الصق مفتاح API Novita AI الخاص بك
- في حقل “تجاوز عنوان URL الأساسي لـ OpenAI”: استبدل القيمة الافتراضية بـ:
https://api.novita.ai/openai
الخطوة 4: إضافة نماذج أكواد ذكاء اصطناعي متعددة
انقر على “+ إضافة نموذج مخصص” وأضف كل نموذج:
qwen/qwen3-vl-235b-a22b-thinkingzai-org/glm-4.6deepseek/deepseek-v3.1moonshotai/kimi-k2-0905openai/gpt-oss-120bgoogle/gemma-3-12b-it
الخطوة 5: اختبار التكامل الخاص بك

- ابدأ دردشة جديدة في وضع السؤال أو وضع الوكيل
- اختبر نماذج مختلفة لمهام برمجة مختلفة
- تحقق من أن جميع النماذج تستجيب بشكل صحيح
Qwen3-VL-235B-A22B في Claude Code
لنظام Windows
افتح موجه الأوامر واضع متغيرات البيئة التالية:
set ANTHROPIC_BASE_URL=https://api.novita.ai/anthropic
set ANTHROPIC_AUTH_TOKEN=<Novita API Key>
set ANTHROPIC_MODEL=qwen/qwen3-vl-235b-a22b-thinking
set ANTHROPIC_SMALL_FAST_MODEL=qwen/qwen3-vl-235b-a22b-thinking
استبدل <[مفتاح API Novita](https://novita.ai/settings/key-management)> بمفتاح API الفعلي الذي حصلت عليه من منصة Novita AI. تظل هذه المتغيرات نشطة للجلسة الحالية ويجب إعادة تعيينها إذا أغلقت موجه الأوامر.
لنظامي Mac و Linux
افتح Terminal وقم بتصدير متغيرات البيئة التالية:
export ANTHROPIC_BASE_URL="https://api.novita.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="<Novita API Key>"
export ANTHROPIC_MODEL="qwen/qwen3-vl-235b-a22b-thinking"
export ANTHROPIC_SMALL_FAST_MODEL="qwen/qwen3-vl-235b-a22b-thinking"
بدء تشغيل Claude Code
بعد اكتمال التثبيت والتهيئة، يمكنك الآن بدء تشغيل Claude Code في دليل المشروع الخاص بك. انتقل إلى موقع المشروع المطلوب باستخدام الأمر cd:
cd <your-project-directory>
claude .
Qwen3-VL-235B-A22B في Trae
الخطوة 1: افتح Trae وانتقل إلى النماذج
تشغيل تطبيق Trae. انقر على زر تبديل الشريط الجانبي للذكاء الاصطناعي في الزاوية العلوية اليمنى لفتح الشريط الجانبي للذكاء الاصطناعي. ثم انتقل إلى إدارة الذكاء الاصطناعي واختر النماذج.


الخطوة 2: أضف نموذجًا مخصصًا واختر Novita كمزود
انقر على زر إضافة نموذج لإنشاء إدخال نموذج مخصص. في مربع حوار إضافة النموذج، اختر المزود = Novita من القائمة المنسدلة.


الخطوة 3: اختر أو أدخل النموذج
من القائمة المنسدلة للنماذج، اختر النموذج المطلوب (DeepSeek-R1-0528، Kimi K2 DeepSeek-V3-0324، أو MiniMax-M1-80k، GLM 4.6). إذا لم يتم سرد النموذج المحدد بدقة، فما عليك سوى كتابة معرف النموذج الذي قمت بتدوينه من مكتبة Novita. تأكد من اختيار الإصدار الصحيح من النموذج الذي تريد استخدامه.
Qwen3-VL-235B-A22B في Codex
إعداد ملف التهيئة
يستخدم Codex CLI ملف تهيئة بتنسيق TOML يقع في:
- macOS/Linux:
~/.codex/config.toml - Windows:
%USERPROFILE%\.codex\config.toml
قالب التهيئة الأساسي
model = "qwen/qwen3-vl-235b-a22b-thinking"
model_provider = "novitaai"
[model_providers.novitaai]
name = "Novita AI"
base_url = "https://api.novita.ai/openai"
http_headers = {"Authorization" = "Bearer YOUR_NOVITA_API_KEY"}
wire_api = "chat"
تشغيل Codex CLI
codex
أمثلة الاستخدام الأساسية
توليد الأكواد:
> Create a Python class for handling REST API responses with error handling
تحليل المشروع:
> Review this codebase and suggest improvements for performance
إصلاح الأخطاء:
> Fix the authentication error in the login function
الاختبار:
> Generate comprehensive unit tests for the user service module
5. تكامل منصات الطرف الثالث
- واجهة برمجة تطبيقات متوافقة مع OpenAI: استمتع بالهجرة والتكامل بدون متاعب مع أدوات مثل Cline و Cursor، المصممة لمعيار واجهة برمجة تطبيقات OpenAI.
- Hugging Face: استخدم النماذج في Spaces، أو خطوط الأنابيب، أو مع مكتبة Transformers عبر نقاط نهاية Novita AI.
- أطر العمل للوكلاء والتنسيق: اتصل بسهولة بـ Novita AI مع منصات الشركاء مثل Continue، AnythingLLM,LangChain، Dify و Langflow عبر موصلات رسمية وأدلة تكامل خطوة بخطوة.
يُظهر Qwen3-VL-235B-A22B أداءً رائدًا في البرمجة البصرية، والتعرف الضوئي على الحروف (OCR)، والاستدلال، مما يعيد تعريف معايير البرمجة متعددة الوسائط. مع واجهة برمجة التطبيقات ذات سياق 32.8 ألف رمز من Novita AI، والنشر المرن (محلي أو نقطة نهاية مخصصة)، والتكامل مع وكلاء البرمجة الحديثين، يوفر النموذج دقة عالية وقابلية توسع بتكلفة تنافسية.
الأسئلة الشائعة
ما الذي يجعل Qwen3-VL-235B-A22B فريدًا بين النماذج متعددة الوسائط؟
يجمع بين بنية مزيج من الخبراء (MoE) ذات 235 مليار معلمة مع استدلال بصري قوي، محققًا نتائج رائدة في اختبارات Design2Code و ChartMimic.
كيف يمكنني تعزيز قدرات البرمجة لـ Qwen3-VL-235B-A22B؟
طبق أوامر سلسلة الوصف، ودمج أدوات تحرير الأكواد، واضبط النموذج بدقة باستخدام مجموعات بيانات من واجهات المستخدم إلى الأكواد، واستغل سياقه البالغ 256 ألف رمز للاستدلال عبر ملفات متعددة.
هل يمكن دمج Qwen3-VL-235B-A22B في بيئات التطوير المتكاملة (IDEs)؟
نعم. يتصل بسلاسة مع Cursor و Codex و Trae عبر نقاط نهاية واجهة برمجة التطبيقات المتوافقة مع OpenAI لـ Novita AI.
Novita AI هي منصة سحابية للذكاء الاصطناعي توفر للمطورين طريقة سهلة لنشر نماذج الذكاء الاصطناعي باستخدام واجهة برمجة التطبيقات البسيطة الخاصة بنا، مع توفير سحابة وحدات معالجة رسومية بأسعار معقولة وموثوقة للبناء والتوسع.
