الوصول إلى Kling 1.6 T2V وأيضًا I2V (10 ثوانٍ) الآن على Novita AI

جدول المحتويات

تأثير توليد فيديوهات مدتها 5 ثوانٍ على اتساق الذكاء الاصطناعي
توليد فيديوهات مدتها 10 ثوانٍ: نهج جديد لتعزيز الاتساق
أخبار مثيرة! Kling 1.6 T2V يُولّد الآن فيديوهات مدتها 10 ثوانٍ على Novita AI!
ما هو Kling 1.6؟
كيف تصل إلى Kling 1.6 T2V 10s؟

قم بإحالة أصدقائك إلى Novita AI وستحصل أنت وكل منهم على 10$ من أرصدة LLM API — حتى 500$ إجمالي المكافآت.

لدعم مجتمع المطورين، تتوفر نماذج Qwen2.5-7B و Qwen 3 0.6B و Qwen 3 1.7B و Qwen 3 4B مجانًا حاليًا على Novita AI.

لطالما كان الحفاظ على الاتساق في المحتوى المُنشَأ بالذكاء الاصطناعي تحديًا. غالبًا ما تؤدي الفيديوهات القصيرة، خاصة تلك التي تقل عن 10 ثوانٍ، إلى تقلبات حبكة غير متوقعة وتناقضات في الشخصيات. تكافح هذه الفيديوهات للحفاظ على الاستمرارية البصرية، حيث تفتقر نماذج الذكاء الاصطناعي عادةً إلى الوقت الكافي لبناء سرديات متماسكة وتصاميم شخصيات ثابتة.

لمواجهة هذا التحدي، يقدم Kling 1.6 وضعًا جديدًا لتوليد فيديوهات مدتها 10 ثوانٍ. هذه الميزة، المتاحة للتجربة على Novita AI، توفر مزيدًا من الوقت للذكاء الاصطناعي لتحسين انتقالات المشاهد، والحفاظ على مظهر ثابت للشخصيات، وإنشاء سرديات أكثر ترابطًا.

تقدم Novita AI Kling 1.6 بأسعار معقولة جدًا — فقط 0.27$ لمقطع فيديو 5 ثوانٍ من نص إلى فيديو (T2V) بدقة 720p، و0.46$ فقط لمخرج 10 ثوانٍ من صورة إلى فيديو (I2V) بدقة 1080p. فيديو الـ10 ثوانٍ يكلف فقط ضعف السعر.

تأثير توليد فيديوهات مدتها 5 ثوانٍ على اتساق الذكاء الاصطناعي

1. تقلبات الحبكة غير المتوقعة

تفتقر الفيديوهات القصيرة المُنشَأة بالذكاء الاصطناعي غالبًا إلى العمق السردي لإنشاء سياق أو بناء ترابط. يمكن أن يؤدي هذا الإيجاز إلى سيناريوهات غير متوقعة وفكاهية. على سبيل المثال، قد ينتقل الفيديو فجأة من مشهد حديقة هادئ إلى غزو فضائي فوضوي، تاركًا المشاهدين في حيرة ومرح بسبب التقلب المفاجئ في الحبكة.

هذا الفيديو هو التصور المثالي لكيفية كون الذكاء الاصطناعي التوليدي مجرد تعلم آلي يلعب لعبة التليفون المكسور مع نفسه. لا يعرف ما سينتجه بعد ذلك، ومع كل إطار يبدأ في عدم فهم ما يفترض أن يولده ثم يرى شيئًا جديدًا فيما تبقى ويأخذ ذلك في اتجاه مختلف، لذلك يمكن أن يتحول اللون الأبيض أو كرة النار أو الدخان إلى ثلج، والذي بدوره يولد بعض الظلال الزرقاء التي يبدأ الذكاء الاصطناعي في الاعتقاد أنها ماء وهكذا.

2. تناقضات الشخصيات

يمثل الحفاظ على اتساق الشخصيات في الفيديوهات القصيرة تحديًا للذكاء الاصطناعي. قد تظهر شخصية بتسريحة شعر مختلفة، أو زي مختلف، أو حتى نوع كائن مختلف في كل إطار، مما يخلق تأثيرًا كوميديًا. يمكن أن تكون هذه التناقضات مسلية وفي نفس الوقت دليلًا على القيود الحالية للذكاء الاصطناعي في فهم الاستمرارية والحفاظ عليها.

https://www.youtube.com/watch?v=4MQZjmh01zM

نظرًا لأن المحتوى المُنشَأ بالذكاء الاصطناعي يعاني من العديد من المشكلات المتعلقة بالاتساق، فقد بدأ العديد من مطوري الفيديوهات في مشاركة دروس تعليمية حول كيفية إنشاء شخصيات متسقة.

توليد فيديوهات مدتها 10 ثوانٍ: نهج جديد لتعزيز الاتساق

1. تقليل تغييرات المشاهد

في الفيديو الأقصر، لا يضطر الذكاء الاصطناعي إلى التعامل مع العديد من انتقالات المشاهد المعقدة، مما يقلل من احتمالية التحولات المفاجئة في الخلفيات أو تفاصيل الشخصيات.
تركز الفيديوهات الأقصر غالبًا على مجموعة أصغر من الإجراءات أو الإعدادات، مما يسمح للذكاء الاصطناعي بالحفاظ على الاتساق البصري بسهولة أكبر.

2. هيكل قصة مبسط

مع وقت أقل، يمكن للذكاء الاصطناعي الحفاظ على قصة أبسط، وتجنب الفوضى التي قد تخلقها السرديات الأطول. العناصر الأقل في القصة تجعل الحفاظ على ترابط الفيديو أسهل.
هذا مهم بشكل خاص للحفاظ على اتساق تعابير الشخصيات وأفعالهم وملابسهم وخلفياتهم.

3. التركيز على إجراء أو تعبير واحد

تميل الفيديوهات التي تبلغ مدتها 10 ثوانٍ إلى التركيز على مشهد أو إجراء معين، مما يسمح للذكاء الاصطناعي بتوليد هذا المقطع بدقة أكبر، مما يؤدي إلى عدد أقل من التناقضات البصرية.
على سبيل المثال، إذا احتاج الذكاء الاصطناعي إلى توليد ابتسامة شخصية، فإن 10 ثوانٍ كافية للحفاظ على اتساق تعبير الوجه دون خطر التباين.

4. عدد أقل من تغييرات التفاصيل

كلما كان الفيديو أقصر، قل احتمال تغير التفاصيل الصغيرة طوال الفيديو. على سبيل المثال، من غير المرجح أن تتغير تسريحة شعر الشخصية أو زيّها أو البيئة الخلفية بشكل ملحوظ خلال 10 ثوانٍ فقط.

5. تحسين النموذج للمحتوى الأقصر

بعض نماذج توليد الفيديو تم تحسينها خصيصًا للفيديوهات الأقصر، مثل المقاطع التي تبلغ مدتها 10 ثوانٍ. يمكن لهذه النماذج التحكم بدقة في التوقيت وانتقالات المشاهد، مما يجعلها أكثر ملاءمة لإنشاء فيديوهات متسقة.
يمكن للذكاء الاصطناعي التركيز على تلبية احتياجات الفيديو القصير بشكل أكثر فعالية، مما يقلل من التباين الذي قد يظهر في التنسيقات الأطول.

أخبار مثيرة! Kling 1.6 T2V يُولّد الآن فيديوهات مدتها 10 ثوانٍ على Novita AI!

Kling 1.6 5s

kling 1.6 10s

الاتساق: الفيديو الذي تبلغ مدته 10 ثوانٍ أكثر اتساقًا من حيث الاستمرارية البصرية. تسمح المدة الأطول بانتقالات أكثر سلاسة وعدد أقل من الاضطرابات في المشهد.

السلاسة: يُظهر الفيديو الذي تبلغ مدته 10 ثوانٍ سلاسة أفضل بسبب مدته الأطول، مما يمنح الذكاء الاصطناعي مساحة أكبر لتحسين وتثبيت حركات الشخصيات وعناصر الخلفية.

الإخلاص البصري: يتمتع كلا الفيديوين بدقة ومعدل إطارات مماثلين (720p، 24 إطارًا في الثانية)، وبالتالي فإن جودة القوام والإضاءة متشابهة. ومع ذلك، فإن اتساق الحركة أفضل في الفيديو الذي تبلغ مدته 10 ثوانٍ.

السرد القصصي: يمكن للفيديو الأطول (فيديو 10 ثوانٍ) تطوير سرد أكثر ترابطًا، مع وجود إطارات أكثر تسمح بانتقالات مشهد أكثر تفصيلاً وإجراءات شخصيات.

ما هو Kling 1.6؟

الميزات الرئيسية لـ Kling 1.6

معالجة سريعة وسهلة للاستفسارات النصية:
يسمح Kling 1.6 للمستخدمين بتوليد فيديوهات بسهولة من خلال تقديم استفسارات نصية بسيطة أو مفصلة. يفسر النموذج هذه المدخلات بدقة عالية، منتجًا فيديوهات تطابق المشاهد والإجراءات والبيئات الموصوفة بشكل وثيق. مقارنة بالإصدارات السابقة، يقدم Kling 1.6 معالجة محسّنة للاستفسارات، مما يوفر مخرجات فيديو أكثر دقة وواقعية.

جودة فيديو فائقة وواقعية:
ينتج Kling 1.6 فيديوهات بدقة تصل إلى 1080p وبمعدل 30 إطارًا في الثانية، مما يضمن حركة سلسة وإخلاصًا بصريًا استثنائيًا. باستخدام تقنيات متقدمة مثل Diffusion Transformer Architecture، يقلل من الوميض ويحافظ على تماسك الإطارات، مما يؤدي إلى صور بجودة سينمائية مع إضاءة واقعية، وقوام بشري، وحركات شخصيات سلسة.

تحكم متقدم في الحركة والكاميرا:
مع Kling 1.6، يمكن للمستخدمين تخصيص حركات الكاميرا مثل التصوير البانورامي والإمالة والتكبير والتدوير، بما في ذلك الحركات المركبة (مثل التصوير البانورامي إلى اليسار مع التكبير). تتيح هذه الميزات للمبدعين صياغة سرد قصصي ديناميكي وسينمائي مباشرة من الاستفسارات النصية، مما يضيف طبقة إضافية من التفاعل إلى الفيديوهات المُنشأة.

من getimg.ai

Kling 1.6 مقابل Kling 1.5 و Kling 1.0

تقديم أسرع: يحقق Kling 1.6 أوقات تقديم أسرع بنسبة تصل إلى 30% مقارنة بـ Kling 1.5 و 1.0، بفضل تسريع GPU المحسّن.
جودة محسّنة: مع Diffusion Transformer Architecture الجديد، يقدم Kling 1.6 حركة أكثر سلاسة وإخلاصًا بصريًا أفضل مقارنة بالإصدارات السابقة.
ميزات أكثر مرونة: تقدم النسخة الاحترافية من Kling 1.6 ميزات متقدمة مثل فترات فيديو أطول، وإسناد متعدد الصور، وصوت مُنشأ بالذكاء الاصطناعي، والتي لم تكن متوفرة في الإصدارات السابقة.
معالجة محسّنة للاستفسارات: يحسّن Kling 1.6 معالجة الاستفسارات، مما يوفر مخرجات أكثر دقة وواقعية من Kling 1.5 و 1.0.

كيف تصل إلى Kling 1.6 T2V 10s؟

الخطوة 1: تسجيل الدخول والوصول إلى مكتبة النماذج

سجّل الدخول إلى حسابك وانقر على زر مكتبة النماذج.

جرب Kling 1.6 الآن!

الخطوة 2: اختر نموذجك

تصفح الخيارات المتاحة واختر النموذج الذي يناسب احتياجاتك.

الخطوة 3: ابدأ تجربتك المجانية

الخطوة 4: تثبيت API

قم بتثبيت API باستخدام مدير الحزم الخاص بلغة البرمجة التي تستخدمها.

بعد التثبيت، قم باستيراد المكتبات اللازمة إلى بيئة التطوير الخاصة بك. قم بتهيئة API باستخدام مفتاح API الخاص بك لبدء التفاعل مع Novita AI LLM. هذا مثال لاستخدام chat completions API لمستخدمي Python.

import requests

url = "https://api.novita.ai/v3/async/kling-v1.6-i2v"

payload = {
    "mode": "<string>",
    "image_url": "<string>",
    "end_image_url": "<string>",
    "prompt": "<string>",
    "negative_prompt": "<string>",
    "guidance_scale": 123
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)

يمثل توليد الفيديو لمدة 10 ثوانٍ من Kling 1.6 قفزة كبيرة إلى الأمام في إنشاء محتوى الذكاء الاصطناعي. من خلال تقليل التعقيد، والتركيز على هياكل القصة البسيطة، وإتاحة مساحة أكبر للضبط الدقيق، يؤدي هذا التحسين إلى فيديوهات أكثر اتساقًا وتماسكًا بصريًا. إنها ترقية أساسية للمطورين الذين يهدفون إلى إنتاج محتوى فيديو أكثر دقة يعتمد على الذكاء الاصطناعي مع تناقضات أقل، وسلاسة حركة أفضل، وقدرة محسّنة على سرد القصص المتماسكة.

الأسئلة الشائعة

ما الفرق بين توليد الفيديو لمدة 5 ثوانٍ و10 ثوانٍ في Kling 1.6؟

الفرق الرئيسي هو أن فيديوهات الـ10 ثوانٍ توفر وقتًا أكبر للذكاء الاصطناعي للحفاظ على اتساق مظهر الشخصيات والخلفيات والحركات.

كيف يعزز Kling 1.6 جودة الفيديو المُنشَأ بالذكاء الاصطناعي؟

يحسّن Kling 1.6 جودة الفيديو من خلال Diffusion Transformer Architecture الخاص به، الذي يقلل من الوميض، ويضمن تماسك الإطارات، ويعزز الإخلاص البصري.

هل يمكن لـ Kling 1.6 توليد فيديوهات أطول من 10 ثوانٍ؟

نعم، تدعم النسخة الاحترافية من Kling 1.6 فترات فيديو أطول، تصل إلى 3 دقائق.

Novita AI هي منصة سحابية شاملة تعزز طموحاتك في الذكاء الاصطناعي. واجهات برمجة تطبيقات متكاملة، حوسبة بدون خادم، مثيلات GPU — الأدوات الفعالة من حيث التكلفة التي تحتاجها. تخلص من البنية التحتية، ابدأ مجانًا، وحوّل رؤيتك للذكاء الاصطناعي إلى واقع.

الوصول إلى Kling 1.6 T2V وأيضًا I2V (10 ثوانٍ) الآن على Novita AI