Пригласите друзей в Novita AI, и вы оба получите по $10 в виде LLM API кредитов — вплоть до $500 суммарного вознаграждения.
В поддержку сообщества разработчиков Qwen2.5-7B, Qwen 3 0.6B, Qwen 3 1.7B, Qwen 3 4B сейчас доступны бесплатно на Novita AI.
Поддержание согласованности в AI-генерируемом контенте долгое время было сложной задачей. Короткие видео, особенно короче 10 секунд, часто страдают от непредсказуемых сюжетных поворотов и несогласованности персонажей. Таким видео трудно сохранять визуальную целостность, поскольку AI-моделям обычно не хватает времени для создания связных повествований и стабильного дизайна персонажей.
Чтобы решить эту проблему, Kling 1.6 представляет новый режим генерации видео длительностью 10 секунд. Эта функция, доступная для тестирования на Novita AI, предоставляет больше времени AI для улучшения переходов между сценами, поддержания единообразного внешнего вида персонажей и создания более связных повествований.
Novita AI предлагает Kling 1.6 по крайне доступным ценам — всего $0.27 за 720P текстовое-в-видео (T2V) 5-секундный клип и только $0.46 за 1080P изображение-в-видео (I2V) 10-секундный результат. 10-секундное видео стоит лишь вдвое дороже.
Влияние 5-секундной генерации видео на согласованность AI
1. Непредсказуемые сюжетные повороты
Коротким AI-видео часто не хватает повествовательной глубины для установления контекста или построения связности. Эта краткость может приводить к неожиданным и забавным сценариям. Например, видео может резко перейти от мирной парковой сцены к хаотичному вторжению инопланетян, оставляя зрителей в недоумении и веселя их внезапным поворотом сюжета.
Это видео — идеальная визуализация того, как генеративный AI по сути является просто машинным обучением, играющим в «испорченный телефон» с самим собой. Модель не знает, что произведёт дальше, и с каждым кадром начинает терять понимание того, что должна генерировать, видит что-то новое в остатке и уводит сюжет в другом направлении. Так белый шар из огня или дыма может превратиться в снег, который затем порождает синеватые тени, и AI начинает думать, что это вода, и т.д.
2. Несогласованность персонажей
Поддержание согласованности персонажей в коротких видео — сложная задача для AI. Персонаж может появляться с разной причёской, одеждой или даже видом в каждом кадре, создавая комический эффект. Подобные несоответствия могут быть одновременно забавными и свидетельствовать о текущих ограничениях AI в понимании и поддержании непрерывности.
https://www.youtube.com/watch?v=4MQZjmh01zM
Из-за множества проблем с согласованностью в AI-контенте многие видео и разработчики начали делиться уроками по созданию постоянных персонажей.
Генерация 10-секундных видео: новый подход к повышению согласованности
1. Меньше смен сцен
- В более коротком видео AI не нужно обрабатывать столько сложных переходов между сценами, что снижает вероятность резких изменений фонов или деталей персонажей.
- Короткие видео часто фокусируются на меньшем наборе действий или обстановок, что позволяет AI легче поддерживать визуальную согласованность.
2. Упрощённая структура сюжета
- С меньшим временем AI может поддерживать более простой сюжет, избегая хаоса, который могут создать длинные повествования. Меньшее количество элементов в истории упрощает сохранение когерентности видео.
- Это особенно важно для поддержания согласованности выражений лиц, действий, одежды и фонов.
3. Фокус на одном действии или выражении
- 10-секундные видео обычно сосредоточены на конкретной сцене или действии, что позволяет AI генерировать этот сегмент с большей точностью, приводя к меньшему количеству визуальных несоответствий.
- Например, если AI нужно сгенерировать улыбку персонажа, 10 секунд достаточно для поддержания согласованности выражения лица без риска изменений.
4. Меньше изменений деталей
- Чем короче видео, тем менее вероятно, что мелкие детали будут меняться на протяжении всего видео. Например, причёска, одежда персонажа или фоновое окружение вряд ли заметно изменятся за 10 секунд.
5. Оптимизация модели для короткого контента
- Некоторые модели генерации видео специально оптимизированы для коротких роликов, например 10-секундных. Эти модели могут точно контролировать время и переходы между сценами, что делает их более подходящими для создания согласованных видео.
- AI может более эффективно сосредоточиться на потребностях короткого видео, уменьшая вариативность, которая может появиться в более длинных форматах.
Захватывающая новость! Kling 1.6 T2V теперь генерирует 10-секундные видео на Novita AI!
Kling 1.6 5s
Kling 1.6 10s
- Согласованность: Видео 10s более согласовано с точки зрения визуальной непрерывности. Большая длительность позволяет делать более плавные переходы и меньше нарушать сцену.
- Плавность: Видео 10s демонстрирует лучшую плавность благодаря большей длительности, что даёт AI больше пространства для уточнения и стабилизации действий персонажа и фоновых элементов.
- Визуальное качество: Оба видео имеют схожее разрешение и частоту кадров (720p, 24 FPS), поэтому качество текстур и освещения сопоставимо. Тем не менее, согласованность движений лучше в видео 10s.
- Повествование: Более длинное видео (10s) может развивать более связный сюжет, большее количество кадров позволяет детальнее проработать переходы между сценами и действия персонажей.
Что такое Kling 1.6?
Ключевые особенности Kling 1.6
Удобная обработка запросов:
Kling 1.6 позволяет пользователям легко генерировать видео, предоставляя простые или подробные текстовые подсказки. Модель интерпретирует эти вводы с высокой точностью, создавая видео, которые точно соответствуют описанным сценам, действиям и окружению. По сравнению с предыдущими версиями, Kling 1.6 предлагает улучшенную обработку запросов, обеспечивая более точные и реалистичные результаты.
Превосходное качество видео и реализм:
Kling 1.6 создаёт видео с разрешением до 1080p при 30 кадрах в секунду, обеспечивая плавное движение и исключительную визуальную точность. Используя передовые методы, такие как архитектура Diffusion Transformer, модель минимизирует мерцание и поддерживает когерентность кадров, что даёт кинематографическое качество с реалистичным освещением, текстурами кожи и естественными движениями персонажей.
Расширенное управление движением и камерой:
С Kling 1.6 пользователи могут настраивать движения камеры, такие как панорамирование, наклон, масштабирование и вращение, включая комбинированные движения (например, панорамирование влево с одновременным приближением). Эти функции позволяют создателям воплощать динамичные кинематографические повествования прямо из текстовых подсказок, добавляя дополнительный уровень вовлеченности в генерируемые видео.
Из getimg.ai
Kling 1.6 против Kling 1.5 и Kling 1.0
- Более быстрый рендеринг: Kling 1.6 достигает до 30% более быстрого времени рендеринга по сравнению с Kling 1.5 и 1.0 благодаря улучшенному ускорению GPU.
- Улучшенное качество: Благодаря новой архитектуре Diffusion Transformer, Kling 1.6 обеспечивает более плавное движение и лучшее визуальное качество по сравнению с предыдущими версиями.
- Более гибкие функции: Версия Pro Kling 1.6 вводит расширенные возможности, такие как увеличенная длительность видео, многократное обращение к изображениям и AI-генерируемый звук, которые отсутствовали в более ранних версиях.
- Улучшенная обработка запросов: Kling 1.6 улучшает обработку запросов, обеспечивая более точные и реалистичные результаты, чем Kling 1.5 и 1.0.

Как получить доступ к Kling 1.6 T2V 10s?
Шаг 1: Войдите в систему и откройте Model Library
Войдите в свою учётную запись и нажмите кнопку Model Library.

Шаг 2: Выберите свою модель
Просмотрите доступные варианты и выберите модель, которая соответствует вашим потребностям.

Шаг 3: Начните бесплатное тестирование

Шаг 4: Установите API
Установите API с помощью менеджера пакетов, подходящего для вашего языка программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с Novita AI LLM. Ниже приведён пример использования API чат-завершений для пользователей Python.
import requests
url = "https://api.novita.ai/v3/async/kling-v1.6-i2v"
payload = {
"mode": "<string>",
"image_url": "<string>",
"end_image_url": "<string>",
"prompt": "<string>",
"negative_prompt": "<string>",
"guidance_scale": 123
}
headers = {
"Content-Type": "<content-type>",
"Authorization": "<authorization>"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)
Генерация 10-секундных видео от Kling 1.6 — значительный скачок вперёд в создании AI-контента. Уменьшая сложность, фокусируясь на простых структурах сюжета и предоставляя больше возможностей для тонкой настройки, это улучшение приводит к более согласованным и визуально цельным видео. Это важное обновление для разработчиков, стремящихся создавать более качественный AI-видеоконтент с меньшим количеством несоответствий, лучшей плавностью движений и улучшенной способностью рассказывать связные истории.
Часто задаваемые вопросы
В чём разница между генерацией 5-секундных и 10-секундных видео в Kling 1.6?
Ключевое отличие в том, что 10-секундные видео предоставляют больше времени AI для поддержания согласованности внешности персонажей, фонов и движений.
Как Kling 1.6 улучшает качество AI-генерируемых видео?
Kling 1.6 улучшает качество видео благодаря архитектуре Diffusion Transformer, которая минимизирует мерцание, обеспечивает когерентность кадров и повышает визуальную точность.
Может ли Kling 1.6 создавать видео длиннее 10 секунд?
Да, версия Pro Kling 1.6 поддерживает более длительные видео — до 3 минут.
Novita AI — это универсальная облачная платформа, которая воплощает ваши AI-амбиции. Интегрированные API, бессерверные вычисления, GPU-инстансы — экономичные инструменты, которые вам нужны. Устраните инфраструктуру, начните бесплатно и воплотите ваше AI-видение в реальность.
