Qwen、Llama、GLM、bge 在 Novita AI 上免费使用 – 立即尝试!

Qwen、Llama、GLM、bge 在 Novita AI 上免费使用 – 立即尝试!

领取 $10 的 LLM API 额度

为了支持开源 AI 社区并加速自然语言处理领域的创新,Novita AI 已通过 API 免费开放了五款强大模型。其中包括轻巧但能力不弱的 Llama 3.2 1B Instruct、多功能的 Qwen2.5-7B Instruct、高性能的 GLM-4-9B-0414GLM-Z1-9B-0414,以及多语言多功能的嵌入模型 BGE-M3。通过开放这些模型,Novita AI 旨在帮助开发者、研究人员和初创公司更高效地构建、测试和扩展 AI 应用——无需承担高昂的基础设施成本。

Llama 3.2 1b instruct

Llama-3.2-1b-instruct

立即尝试 Llama 3.2 1B!

  • 模型大小:1.23B 参数
  • 架构:优化的 Transformer,采用分组查询注意力(GQA)、SwiGLU 激活、旋转位置嵌入(RoPE)和 RMSNorm
  • 上下文长度:128K 词元
  • 多语言:官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语;训练数据涵盖更广泛的语言集合
  • 模态:文本到文本(输入和输出)
  • 训练数据:基于公开在线数据,最多训练 9 万亿词元
  • 开源:✅
  • 基准测试:在指令遵循、摘要、提示重写和工具使用等任务中表现出色;与同类参数规模的模型相比具有竞争力

Qwen2.5-7b-instruct

Qwen 2.5 7B

立即尝试 Qwen 2.5 7B!

Qwen 2.5 7B 是一款多语言开源 Transformer 模型,在通用、数学、编程和多语言任务中表现强劲。它专为多功能、轻量级部署和广泛语言支持而构建。

  • 模型大小:7.61B 参数
  • 架构:Transformer,采用 RoPE、SwiGLU、RMSNorm 和 Attention QKV 偏置
  • 上下文长度:128K 词元
  • 多语言:支持超过 29 种语言
  • 模态:文本到文本
  • 训练数据:基于 18T+ 词元训练
  • 开源:✅
  • 基准测试:Qwen 2.5 7B 在该基准测试套件的 ** 所有类别(通用任务、STEM、编程和多语言理解)中持续排名第一**,尽管参数数量相对紧凑。

GLM-4-9b-0414 和 GLM-Z1-9b-0414

GLM-4-9b-0414 and GLM-Z1-9b-0414

立即尝试 GLM-4 9B-0414!

GLM-4-9B-0414 和 GLM-Z1-9B-0414 是 THUDM 开发的两款 90 亿参数的开源语言模型,分别针对不同任务进行了优化。​

  • GLM-4-9B-0414:专为对话生成而设计,继承了 GLM-4-32B 的架构,在多轮对话、翻译和摘要等任务中表现出色。支持 32K 上下文窗口,适合资源受限部署中需要强大语言理解和生成能力的场景。​
  • GLM-Z1-9B-0414:专注于数学推理和通用任务,采用了扩展强化学习和成对排序对齐等技术。在数学、代码和逻辑任务中表现强劲,超越了许多同重量级的开源模型。
特性
模型大小 9B 参数
**优势 ** - GLM-4-9B-0414:性能/大小比高,擅长数学与推理
- GLM-Z1-9B-0414:在数学和通用任务中表现强劲
**任务导向 ** - GLM-4-9B-0414:对话导向
- GLM-Z1-9B-0414:推理导向
模态 文本到文本,支持 HTML/SVG 可视化
上下文窗口 32K 词元
训练与对齐 从 GLM-4-32B 蒸馏而来。基础模型在 15 万亿词元的高质量数据(尤其是合成推理数据)上进行预训练,并通过人类偏好调优进行对话任务对齐。

bge-m3

bge m3

立即尝试 bge m3!

BGE-M3 是由 ** 北京智源人工智能研究院(BAAI)** 开发的一款前沿文本嵌入模型。它专为卓越的多功能性而设计,在 ** 功能**、** 语言支持 输入粒度 三个核心维度上表现出色。BGE-M3 在 MKQAMLDR 等多个基准测试中达到了 ** 最先进水平,在 ** 单语和 ** 跨语言检索场景中持续优于竞争模型。

  • 多功能:BGE-M3 在统一架构中无缝集成了三种检索策略:
    • 稠密检索 – 为每个输入生成单个向量表示,适用于通用语义匹配。
    • 稀疏检索 – 强调词元级别的重要性,类似于传统的词法匹配。
    • 多向量检索 – 为每个输入生成多个向量,以捕获细粒度语义并提高检索精度。
  • **多语言 **:支持超过 100 种语言,具备多语言和跨语言检索能力。
  • **多粒度 **:设计用于处理从短短语到长文档的多种输入长度,每个输入最多支持 8192 个词元

如何在 Novita AI 上访问免费模型?

第 1 步:登录并访问模型库

登录您的账户,点击 模型库 按钮。

登录并访问模型库

第 2 步:选择您的模型

浏览可用选项,选择适合您需求的模型。

选择您的模型

第 3 步:开始免费试用

开始免费试用,探索所选模型的功能。

开始免费试用

第 4 步:获取您的 API 密钥

为了通过 API 进行身份验证,我们将为您提供一个新 API 密钥。进入“设置”页面,您可以按照图片所示复制 API 密钥。

获取 API 密钥

第 5 步:安装 API

使用您编程语言对应的包管理器安装 API。

安装后,将必要的库导入到您的开发环境中。使用您的 API 密钥初始化 API,开始与 Novita AI LLM 交互。以下是为 Python 用户使用聊天补全 API 的示例。

from openai import OpenAI
  
from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<YOUR Novita AI API Key>",
)

model = "model name"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

无论您是在构建智能聊天机器人、语义搜索引擎还是多语言推荐系统,免费访问 Novita AI 的模型 都能为您提供快速上手所需的一切。凭借世界一流的性能和简单的 API 集成,这些模型使可扩展的 AI 比以往任何时候都更容易获得。

Novita AI 是一个 AI 云平台,为开发者提供通过简单 API 部署 AI 模型的便捷方式,同时还提供经济实惠且可靠的 GPU 云用于构建和扩展。

推荐阅读