現在在 Novita AI 上使用 Kling 1.6 T2V 和 I2V(10 秒)

現在在 Novita AI 上使用 Kling 1.6 T2V 和 I2V(10 秒)

推薦您的朋友使用 Novita AI,雙方都可獲得 $10 的 LLM API 點數,總獎勵最高達 $500。

為支援開發者社群,目前 Novita AI 上 Qwen2.5-7B、Qwen 3 0.6B、Qwen 3 1.7B、Qwen 3 4B 均可免費使用。

維持 AI 生成內容的一致性一直是個挑戰。短片,特別是不滿 10 秒的影片,經常會出現無法預測的情節轉折和角色不一致。這些影片難以保持視覺連續性,因為 AI 模型通常沒有足夠時間來建立連貫的敘事和穩定的角色設計。

為了解決這個挑戰,Kling 1.6 推出了全新的 10 秒影片生成模式。這個功能現已在 Novita AI 上提供試用,讓 AI 有更多時間來優化場景轉換、維持角色外觀一致,並創造更連貫的敘事。

Novita AI 提供 Kling 1.6,價格極其實惠——720P 文字轉影片(T2V)5 秒片段僅需 $0.27,而 1080P 圖片轉影片(I2V)10 秒輸出僅需 $0.46。10 秒影片的價格只是 5 秒的兩倍。

5 秒影片生成對 AI 一致性的影響

1. 無法預測的情節轉折

AI 生成的短影片往往缺乏敘事深度來建立背景或連貫性。這種簡短可能導致意想不到且滑稽的情境。例如,影片可能突然從寧靜的公園場景轉變為混亂的外星人入侵,讓觀眾對突如其來的情節轉折感到困惑又好笑。

這部影片完美展示了生成式 AI 基本上只是機器學習在跟自己玩「電話遊戲」。它不知道接下來會產生什麼,隨著每一幀畫面,它開始不再理解自己應該生成什麼,然後在殘留的畫面中看到新的東西,接著朝不同方向發展,因此白色的火球或煙霧可能變成雪,雪又產生一些藍色調陰影,AI 開始認為那是水等等。

2. 角色不一致

在短影片中維持角色一致性對 AI 來說是個挑戰。角色可能在每一幀中出現不同的髮型、服裝甚至物種,產生喜劇效果。這些不一致既有趣,也證明了 AI 在理解和維持連續性方面的當前限制。

https://www.youtube.com/watch?v=4MQZjmh01zM

由於 AI 生成的內容在一致性上有許多問題,因此許多影片和開發者開始分享如何建立一致角色的教學。

10 秒影片生成:提升一致性的新方法

1. 減少場景變化

  • 在較短的影片中,AI 不需要處理那麼多複雜的場景轉換,從而降低了背景或角色細節突然改變的可能性。
  • 較短的影片通常專注於較少的動作或場景設定,讓 AI 更容易維持視覺一致性。

2. 簡化故事結構

  • 時間較短,AI 可以維持更簡單的故事,避免較長敘事可能帶來的混亂。故事元素越少,越容易保持影片的連貫性。
  • 這對於維持角色表情、動作、服裝和背景的一致性尤其重要。

3. 專注於單一動作或表情

  • 10 秒影片傾向於專注於特定場景或動作,讓 AI 能夠更精確地生成該特定片段,從而減少視覺不一致的情況。
  • 例如,如果 AI 需要生成一個角色的微笑,10 秒足以維持表情的一致性,而無需擔心變化。

4. 細節變化更少

  • 影片越短,小細節在整部影片中變化的可能性就越低。例如,角色的髮型、服裝或背景環境在短短 10 秒內不太可能發生明顯變化。

5. 模型針對簡短內容最佳化

  • 部分影片生成模型專門針對較短影片(例如 10 秒片段)進行最佳化。這些模型可以精細控制時間和場景轉換,更適合製作一致的影片。
  • AI 可以更有效地專注於滿足簡短影片的需求,減少在較長格式中可能出現的變化。

好消息!Kling 1.6 T2V 現在可在 Novita AI 上生成 10 秒影片!

Kling 1.6 5s

kling 1.6 10s

  • 一致性:10 秒影片在視覺連續性方面更加一致。較長的持續時間允許更流暢的轉換和更少的場景中斷。
  • 流暢度:10 秒影片由於持續時間更長,顯示出更好的流暢度,讓 AI 有更多空間來優化和穩定角色動作及背景元素。
  • 視覺保真度:兩部影片具有相似的解析度和幀率(720p,24 FPS),因此紋理和光線品質相當。但 10 秒影片的運動一致性更好。
  • 敘事能力:較長的影片(10 秒)可以發展出更連貫的敘事,更多的幀數允許更詳細的場景轉換和角色動作。

什麼是 Kling 1.6?

Kling 1.6 的主要功能

易於使用的提示處理:
Kling 1.6 允許使用者透過提供簡單或詳細的文字提示輕鬆生成影片。該模型以高準確度解讀這些輸入,產生的影片能緊密匹配所描述的場景、動作和環境。與先前版本相比,Kling 1.6 提供了改進的提示處理,輸出更精確、更逼真的影片。

卓越的影片品質與真實感:
Kling 1.6 可產生高達 1080p 解析度、每秒 30 幀的影片,確保流暢的動作和卓越的視覺保真度。利用擴散變換器架構等先進技術,它減少了閃爍並維持了幀間連貫性,從而產生電影級品質的視覺效果,具有逼真的光線、皮膚質感和流暢的角色動作。

進階運動與相機控制:
使用 Kling 1.6,使用者可以自訂相機移動,例如平移、傾斜、變焦和旋轉,包括組合運動(例如,向左平移同時變焦)。這些功能使創作者能夠直接從文字提示中創作出動態的電影敘事,為生成的影片增添額外的吸引力。

來自 getimg.ai

Kling 1.6 與 Kling 1.5 及 Kling 1.0 的比較

  • 更快的渲染:得益於增強的 GPU 加速,Kling 1.6 的渲染時間比 Kling 1.5 和 1.0 快 30%。
  • 改進的品質:憑藉新的擴散變換器架構,Kling 1.6 提供比先前版本更流暢的動作和更好的視覺保真度。
  • 更靈活的功能:Kling 1.6 專業版引入了進階功能,例如更長的影片持續時間、多圖像參考和 AI 生成的音效,這些在早期版本中並未提供。
  • 增強的提示處理:Kling 1.6 改進了提示處理,比 Kling 1.5 和 1.0 產出更準確、更逼真的結果。

kling 1.6 vs other models

如何存取 Kling 1.6 T2V 10 秒功能?

步驟 1:登入並存取 模型庫

登入您的帳戶,然後點擊 模型庫 按鈕。

Log In and Access the Model Library

立即試用 Kling 1.6!

步驟 2:選擇您的模型

瀏覽可用選項,然後選擇適合您需求的模型。

kling 1.6 video

步驟 3:開始您的免費試用

start your trail

步驟 4:安裝 API

使用適合您程式語言的套件管理器安裝 API。

install api

安裝完成後,將必要的函式庫匯入到您的開發環境中。使用您的 API 金鑰初始化 API,以開始與 Novita AI LLM 互動。以下是 Python 使用者使用聊天補全 API 的範例。

import requests

url = "https://api.novita.ai/v3/async/kling-v1.6-i2v"

payload = {
    "mode": "<string>",
    "image_url": "<string>",
    "end_image_url": "<string>",
    "prompt": "<string>",
    "negative_prompt": "<string>",
    "guidance_scale": 123
}
headers = {
    "Content-Type": "<content-type>",
    "Authorization": "<authorization>"
}

response = requests.request("POST", url, json=payload, headers=headers)

print(response.text)
  
  

Kling 1.6 的 10 秒影片生成標誌著 AI 內容創作的一大躍進。透過降低複雜性、專注於簡單的故事結構,並為微調提供更多空間,這項增強功能可產生更一致、視覺上更連貫的影片。對於希望製作出更精緻、不一致性更少、動作流暢度更高且敘事能力更強的 AI 驅動影片內容的開發者而言,這是一項重要的升級。

常見問題

Kling 1.6 中 5 秒與 10 秒影片生成有何不同?

主要差異在於 10 秒影片為 AI 提供了更多時間來維持角色外觀、背景和動作的一致性。

Kling 1.6 如何提升 AI 生成影片的品質?

Kling 1.6 透過其擴散變換器架構改善影片品質,該架構可減少閃爍、確保幀間連貫性,並增強視覺保真度。

Kling 1.6 能否生成比 10 秒更長的影片?

可以,Kling 1.6 專業版支援更長的影片持續時間,最長可達 3 分鐘。

Novita AI 是一站式雲端平台,助力您的 AI 願景。整合 API、無伺服器、GPU 實例——您所需的成本效益工具。消除基礎設施負擔,免費開始,讓您的 AI 願景成真。

推薦閱讀