Llama 3.2 模型现已在 Novita AI 上可用

Llama 3.2 的新特性
Novita AI 上可用的 Llama 3.2 模型
基于开源基础推进多模态 AI
开始使用：您的 Novita AI 之旅
准备好变革您的 AI 开发了吗？

体验 Novita AI 与 Meta Llama 3.2 模型最新集成带来的下一代 AI 开发能力。我们的平台现提供一套全面的模型，旨在满足多样化的开发需求，同时保持成本效益和卓越性能。

Llama 3.2 的新特性

|||||||

|---|---|---|---|---|---| ||Llama 2.0 (7B, 13B, 70B)|Llama 3.0 (8B, 70B)|Llama 3.1 (8B, 70B, 405B)|Llama 3.2 多模态 (11B & 90B)|Llama 3.2 轻量文本 (1B & 3B)| |发布日期|2023年7月18日|2024年4月18日|2024年7月23日|2024年9月25日|2024年9月25日| |上下文窗口|4K|8K|128K|128K|128K| |词汇量|32K|128K|128K|128K|128K| |官方多语言|仅英文|仅英文|8种语言|8种语言|8种语言| |工具调用|否|否|是|是|是| |知识截止日期|2022年9月|2023年3月(8B) / 12月(70B)|2023年12月|2023年12月|2023年12月|

1) 11B 和 90B 模型中的多模态输入

来源：Meta

图像理解：识别对象、场景和绘画，并具备 OCR 能力。
字幕生成与问答：根据视觉内容生成描述并回答问题。
视觉推理：分析方程式、图表和文档，增强视觉推理能力。

2) 1B 和 3B 纯文本模型的更小尺寸

新的 SLM（小型语言模型）用例：
- 设备端摘要
- 写作和翻译
- 多语言问答

Novita AI 上可用的 Llama 3.2 模型

Novita AI 自豪地提供三种强大的 Llama 3.2 变体，每种都为不同的用例进行了优化：

Llama 3.2 1B Instruct：高效 AI 入门之选

使用我们最易访问的模型转换您的开发工作流程，该模型拥有惊人的 131,000 令牌上下文窗口。仅需 $0.02/M 令牌即可获得卓越价值，适合快速原型设计和轻量级应用。立即尝试 Llama 3.2 1B Instruct

Llama 3.2 3B Instruct：性能与实力并存

使用我们的中端模型解锁增强的推理能力，提供 32,768 令牌的上下文长度。输入令牌 $0.03/M 和输出令牌 $0.05/M 的竞争性定价，使其非常适合需要稳健性能的中等规模应用。立即尝试 Llama 3.2 3B Instruct

Llama 3.2 11B Vision Instruct：多模态卓越之选

使用我们先进的视觉模型体验最先进的多模态处理。支持 131,000 令牌上下文长度，价格为 $0.06/M 令牌，在复杂的视觉语言任务中表现出色。立即尝试 Llama 3.2 11B Vision Instruct

基于开源基础推进多模态 AI

Llama 3.2 模型的应用

拥有 110 亿和 900 亿参数的 Llama 3.2 视觉模型，提供了强大的多模态能力，可处理图像和文本。当与 Novita AI 平台集成时，这一组合可以解锁重要的实际应用，例如：

多模态用例

交互式代理：开发能够响应文本和图像输入的 AI 代理，提供增强的用户体验。
图像描述生成：为电子商务、内容创作和数字无障碍创建高质量图像描述。
视觉搜索：允许用户使用图像进行搜索，提高电子商务和零售场景中的搜索效率。
文档智能：分析包含文本和视觉内容的文档，如法律合同和财务报告。

行业特定应用

Novita AI 的 Llama 3.2 端点为各行各业开辟了新的可能性：

医疗保健：增强医学图像分析，提高诊断准确性和患者护理水平。
零售与电子商务：通过基于图像和文本的搜索以及个性化推荐，转变购物体验。
金融与法律：通过分析图形和文本内容简化工作流程，优化合同审查和审计。
教育与培训：开发处理文本和视觉的交互式教育工具，提升参与度。

开始使用：您的 Novita AI 之旅

步骤 1：选择您的模型

根据您的具体要求进行选择：

用于原型设计：访问我们的 Llama 3.2 1B Instruct 演示进行初步测试。
用于生产应用：尝试 Llama 3.2 3B Instruct 模型以获得增强能力。
用于视觉语言任务：在我们的 Llama 3.2 11B Vision Instruct 演示中测试多模态功能。

或者使用我们的 Python SDK 将 Llama 模型快速集成到您的应用程序中：

步骤 2：集成和部署

遵循我们简单的集成流程：

注册 Novita AI 账户。
访问我们全面的 LLM API 文档。
用您偏好的编程语言实现 API 调用。
在开发环境中进行彻底测试。

Python 客户端示例

from openai import OpenAI

client = OpenAI(base_url="https://api.novita.ai/v3/openai",api_key="Your API Key",
)

model = "meta-llama/llama-3.2-11b-vision-instruct"stream = True  # or Falsemax_tokens = 65500system_content = "Be a helpful assistant"temperature = 1top_p = 1min_p = 0top_k = 50presence_penalty = 0frequency_penalty = 0repetition_penalty = 1response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(model=model,messages=[
        {"role": "system","content": system_content,
        },
        {"role": "user","content": "Hi there!",
        }
    ],stream=stream,max_tokens=max_tokens,temperature=temperature,top_p=top_p,presence_penalty=presence_penalty,frequency_penalty=frequency_penalty,response_format=response_format,extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
)
if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

JavaScript 客户端示例

import OpenAI from "openai";

const openai = new OpenAI({
  baseURL: "https://api.novita.ai/v3/openai",
  apiKey: "Your API Key",
});
const stream = true; // or false

async function run() {
  const completion = await openai.chat.completions.create({
    messages: [
      {
        role: "system",
        content: "Be a helpful assistant",
      },
      {
        role: "user",
        content: "Hi there!",
      },
    ],
    model: "meta-llama/llama-3.2-3b-instruct",
    stream,
    response_format: { type: "text" },
    max_tokens: 16384,
    temperature: 1,
    top_p: 1,
    min_p: 0,
    top_k: 50,
    presence_penalty: 0,
    frequency_penalty: 0,
    repetition_penalty: 1
  });

  if (stream) {
    for await (const chunk of completion) {
      if (chunk.choices[0].finish_reason) {
        console.log(chunk.choices[0].finish_reason);
      } else {
        console.log(chunk.choices[0].delta.content);
      }
    }
  } else {
    console.log(JSON.stringify(completion));
  }
}

run();

Curl 客户端示例

curl "https://api.novita.ai/v3/openai/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer Your API Key" \
  -d @- << 'EOF'
{
    "model": "meta-llama/llama-3.2-3b-instruct",
    "messages": [
        {
            "role": "system",
            "content": "Be a helpful assistant"
        },
        {
            "role": "user",
            "content": "Hi there!"
        }
    ],
    "response_format": { "type": "text" },
    "max_tokens": 16384,
    "temperature": 1,
    "top_p": 1,
    "min_p": 0,
    "top_k": 50,
    "presence_penalty": 0,
    "frequency_penalty": 0,
    "repetition_penalty": 1
}
EOF

步骤 3：优化和扩展

最大化您的实现效果：

监控令牌使用量和成本。
优化提示以提高效率。
根据性能需求扩展应用程序。
充分利用扩展的上下文长度能力。

准备好变革您的 AI 开发了吗？

立即访问 Novita AI，开始使用 Llama 3.2 构建。我们的团队随时准备支持您从实验到生产部署的整个旅程，确保您充分利用这些强大模型。

原文发表于 Novita AI

Novita AI 是一体化云平台，助力您的 AI 雄心。集成 API、无服务器、GPU 实例——您所需的低成本工具。无需基础设施，免费开始，让您的 AI 愿景成为现实。

推荐阅读

Llama 3.2 模型现已在 Novita AI 上可用

Llama 3.2 的新特性

1) 11B 和 90B 模型中的多模态输入

2) 1B 和 3B 纯文本模型的更小尺寸

Novita AI 上可用的 Llama 3.2 模型

Llama 3.2 1B Instruct：高效 AI 入门之选

Llama 3.2 3B Instruct：性能与实力并存

Llama 3.2 11B Vision Instruct：多模态卓越之选

基于开源基础推进多模态 AI

多模态用例

行业特定应用

开始使用：您的 Novita AI 之旅

步骤 1：选择您的模型

步骤 2：集成和部署

步骤 3：优化和扩展

准备好变革您的 AI 开发了吗？

Product

RESOURCES

Partners

Company

Llama 3.2 的新特性

1) 11B 和 90B 模型中的多模态输入

2) 1B 和 3B 纯文本模型的更小尺寸

Novita AI 上可用的 Llama 3.2 模型

Llama 3.2 1B Instruct：高效 AI 入门之选

Llama 3.2 3B Instruct：性能与实力并存

Llama 3.2 11B Vision Instruct：多模态卓越之选

基于开源基础推进多模态 AI

多模态用例

行业特定应用

开始使用：您的 Novita AI 之旅

步骤 1：选择您的模型

步骤 2：集成和部署

步骤 3：优化和扩展

准备好变革您的 AI 开发了吗？

相关文章

Product

RESOURCES

Partners

Company