重點摘要
Llama 3.3 70B: 專注於 ** 效率與指令遵循**,擁有 700 億參數,旨在以顯著更低的運算需求達到與更大模型相當的效能。針對多語言聊天機器人、程式碼支援與內容創作等任務進行優化。
Llama 3.2 90B: 屬於 Llama 3.2 版本的一部分,引入了 ** 多模態能力**,可同時處理文字與圖片輸入。專為涉及 ** 圖片理解**、視覺推理與文件分析的複雜任務而設計。
Llama 3.1 405B: 最大模型,擁有 4050 億參數 ,專為 合成資料生成與模型蒸餾等要求嚴苛的任務打造。在需要廣泛知識與複雜推理的領域表現出色,但運算需求高。
如果你想在自身使用案例上評估 Llama 3.3 70b,註冊後 Novita AI 會提供 $0.5 的點數,讓你立刻上手!
Meta 的大型語言模型(LLM)系列 Llama 演進迅速,每次迭代都帶來新的功能與改進。本文技術性地比較 Llama 家族中的三個知名模型:Llama 3.3 70B、Llama 3.2 90B 與 Llama 3.1 405B。比較目的是協助開發者根據自身特定需求與資源限制做出明智選擇,重點在於架構、效能與實際應用。
模型基本介紹
在開始比較之前,我們先了解每個模型的基本特性。
Llama 3.3 70b
- 發布日期:2024 年 12 月 6 日
- 模型規模:
- 主要特色:
- 指令微調、純文字模型
- 採用分組查詢注意力機制(GQA)提升效率
- 支援英文、德文、法文、義大利文、葡萄牙文、印地文、西班牙文與泰文
Llama 3.2 90b
- 發布日期:2024 年 9 月 25 日
- 其他 Llama 3.2 模型:
- meta-llama/llama-3.2-1B
- meta-llama/llama-3.2-3B
- meta-llama/llama-3.2-11B
- meta-llama/llama-3.2-90B
- 主要特色:
- 多模態模型,支援文字與圖片輸入
- 支援英文、德文、法文、義大利文、葡萄牙文、印地文、西班牙文與泰文
Llama 3.1 405b
- 發布日期:2024 年 7 月 23 日
- 其他 Llama 3.1 模型:
- 主要特色:
- 支援 8 種語言
- 128K token 上下文視窗
模型比較

總體而言,這三個版本的 Llama 模型在模型規模、架構設計與量化精度上有所差異,但都維持相同的上下文大小。Llama 3.1 405B 參數量最大,而 Llama 3.3 70B 則在架構與量化方面進行了優化,以達到更高效率。
速度比較
如果你想自行測試,可以在 Novita AI 網站上開始免費試用。

速度比較



資料來源:artificialanalysis
成本比較

資料來源:artificialanalysis
綜合來看,Llama 3.2 90B(Vision)在總回應時間與延遲方面表現最佳,而 Llama 3.3 70B 在輸出速度上表現最佳。Llama 3.1 405B 在這三項指標上表現較差。這表示在選擇模型時,需要根據具體應用場景與需求來權衡這些指標。而從價格角度來看,llama 3.3 70b 更具成本效益。
基準測試比較
在了解每個模型的基本特性後,讓我們深入探討它們在各項基準測試中的表現。這個比較有助於說明它們在不同領域的優勢。
| 基準測試指標 | Llama 3.3 70B | Llama 3.2 90B (vision) | Llama 3.1 405B |
|---|---|---|---|
| MMLU | 86 | 84 | 88.6 |
| HumanEval | 88.4 | 80 | 89 |
| MATH | 77 | 65 | 73.8 |
| GPQA Diamond | 50.5 | 42 | 49 |
總結:
- Llama 3.3 70B: 數學與問答能力最佳
- Llama 3.2 90B (Vision): 支援多模態視覺,適合視覺任務
- Llama 3.1 405B: 多任務理解與程式碼生成能力最佳
選擇模型時,需要根據具體的應用場景與需求來權衡這些指標與能力。如果你想知道更多關於 llama3.3 基準測試的知識,可以參考以下文章:
如果你想看更多 llama 3.3 與其他模型的比較,可以參考以下文章:
- Qwen 2.5 72b vs Llama 3.3 70b: Which Model Suits Your Needs?
- Llama 3.1 70b vs. Llama 3.3 70b: Better Performance, Higher Price
- Discover the Power of Llama 3 Models
應用與使用場景
Llama 3.3 70B:
- 多語言聊天機器人與助手
- 程式碼輔助與生成
- 合成資料生成
- 多語言內容創作與在地化
- 知識型應用,如問答系統
Llama 3.2 90B:
- 圖片理解與推理
- 文件層級理解,包含圖表
- 圖片標題生成
- 視覺定位任務
- 結合視覺輸入的即時語言翻譯
Llama 3.1 405B:
- 大規模合成資料生成
- 模型蒸餾以改善較小模型
- 進階研究與實驗
- 針對複雜任務要求高效能的產業專用解決方案
透過 Novita AI 的存取與部署
步驟 1:登入並存取模型庫
登入你的帳戶,點選 Model Library 按鈕。

步驟 2:選擇你的模型
瀏覽可用選項,選擇符合你需求的模型。

步驟 3:開始免費試用
開始免費試用,探索所選模型的能力。

步驟 4:取得 API 金鑰
為了驗證 API,我們會提供一個新的 API 金鑰。進入 Settings 頁面,即可複製如圖所示的 API 金鑰。

步驟 5:安裝 API
使用適合你程式語言的套件管理器安裝 API。

安裝完成後,將必要的函式庫導入你的開發環境。使用你的 API 金鑰初始化 API,開始與 Novita AI LLM 互動。以下是一個給 Python 使用者使用聊天補全 API 的範例。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# 參考 https://novita.ai/docs/get-started/quickstart.html#_2-manage-api-key 取得 Novita AI API 金鑰
api_key="<YOUR Novita AI API Key>",
)
model = "meta-llama/llama-3.3-70b-instruct"
stream = True # or False
max_tokens = 512
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "")
else:
print(chat_completion_res.choices[0].message.content)
註冊後,Novita AI 會提供 $0.5 的點數,讓你立刻上手!
如果免費點數用完,你可以付費繼續使用。
結論
Llama 系列提供多種模型,針對不同需求量身打造:
- Llama 3.3 (70B) 在效能與可及性之間取得平衡,適用於多元應用。
- Llama 3.2 (90B) 引入強大的多模態能力,可同時處理圖片與文字資料。
- Llama 3.1 (405B) 在複雜任務上表現出色,但需要大量資源。
選擇正確的模型取決於具體的專案需求、運算資源以及是否需要多模態能力。
常見問題
Llama 3、3.1、3.2 與 3.3 的主要差異
Llama 3 (原始版): 8B 與 70B 模型、8k 上下文視窗、專注於文字任務(僅英文)。8B 模型可與 ChatGPT 3.5 Turbo 匹敵。
Llama 3.1: 將上下文擴展至 128k,新增 8 種語言、工具呼叫與 405B 模型。透過從 405B 蒸餾改善 8B/70B。
Llama 3.2: 引入視覺模型(11B、90B)與輕量文字模型(1B、3B)。視覺模型一次處理一張圖片;輕量模型適合裝置端使用。
Llama 3.3: 70B 模型專注於指令遵循、多語言支援與安全性。表現可與 405B 相比,但使用更少資源,採用 RLHF 訓練與 128k 上下文視窗。
為何 Llama 3.1 405B 模型如此重要?
它是最大的開放基礎模型,為合成資料生成與模型蒸餾等任務提供了無與倫比的彈性。使用 16,000 顆 H100 GPU 訓練了 15 兆個 token,並協助透過蒸餾開發出 8B 與 70B 等較小模型。
Llama 3.2 輕量模型(1B 與 3B)的角色
專為行動裝置與邊緣裝置設計,支援 128k 上下文視窗,並針對 Qualcomm、MediaTek 與 Arm 硬體進行優化。在裝置端執行摘要、指令遵循與文字改寫等任務表現優異。
Novita AI 是整合 API、無伺服器、GPU 執行個體的全方位雲端平台,提供你實現 AI 抱負所需的高成本效益工具。無須基礎設施,免費開始,讓你的 AI 願景成真。
