
オープンソース AI コミュニティを支援し、自然言語処理のイノベーションを加速するため、 Novita AI は 5 つの強力なモデルを API 経由で無料で利用できるようにしました。これには、コンパクトで高性能な Llama 3.2 1B Instruct 、汎用性の高い Qwen2.5-7B Instruct 、高性能な GLM-4-9B-0414 と GLM-Z1-9B-0414 、そして多言語・多機能な埋め込みモデル BGE-M3 が含まれます。これらのモデルへのオープンアクセスを提供することで、Novita AI は開発者、研究者、スタートアップが高額なインフラコストを負担することなく、AI アプリケーションをより効率的に構築、テスト、スケールできるようにすることを目指しています。
Llama 3.2 1b instruct

- モデルサイズ: 1.23B パラメータ
- アーキテクチャ: Grouped-Query Attention (GQA)、SwiGLU 活性化関数、Rotary Positional Embeddings (RoPE)、RMSNorm を備えた最適化トランスフォーマー
- コンテキスト長: 128K トークン
- 多言語: 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語を公式サポート。より広範な言語セットでトレーニング済み
- モダリティ: テキスト間(入出力)
- トレーニングデータ: 公開されているオンラインデータから最大 9 兆トークンでトレーニング
- オープンソース: ✅
- ベンチマーク: 指示追跡、要約、プロンプト書き換え、ツール使用などのタスクで強力なパフォーマンスを発揮。同パラメータクラスの他のモデルと競争力があります。
Qwen2.5-7b-instruct

Qwen 2.5 7B は、汎用、数学、コーディング、多言語タスクにわたって強力なパフォーマンスを発揮する多言語オープンソーストランスフォーマーモデルです。汎用性、軽量デプロイ、幅広い言語サポートを備えています。
- モデルサイズ: 7.61B パラメータ
- アーキテクチャ: RoPE、SwiGLU、RMSNorm、Attention QKV bias を備えたトランスフォーマー
- コンテキスト長: 128K トークン
- 多言語: 29 以上の言語をサポート
- モダリティ: テキスト間
- トレーニングデータ: 18T+ トークンでトレーニング
- オープンソース: ✅
- **ベンチマーク : Qwen 2.5 7B は、比較的コンパクトなパラメータ数にもかかわらず、このベンチマークスイートの ** すべてのカテゴリ(汎用タスク、STEM、コーディング、多言語理解)で一貫して #1 を獲得 しています。
GLM-4-9b-0414 と GLM-Z1-9b-0414

GLM-4-9B-0414 と GLM-Z1-9B-0414 は、THUDM が開発した 2 つの 90 億パラメータのオープンソース言語モデルであり、それぞれ異なるタスクに最適化されています。
- GLM-4-9B-0414: 対話生成向けに設計され、GLM-4-32B のアーキテクチャを継承し、マルチターン会話、翻訳、要約などのタスクで優れています。32K コンテキストウィンドウをサポートし、堅牢な言語理解と生成能力が求められるリソース制約のあるデプロイに適しています。
- GLM-Z1-9B-0414: 数学的推論と汎用タスクに焦点を当て、拡張強化学習やペアワイズランキングアライメントなどの技術を採用しています。数学、コード、論理タスクで強力なパフォーマンスを示し、同重量クラスの多くのオープンソースモデルを上回ります。
| 機能 | 値 |
|---|---|
| モデルサイズ | 9B パラメータ |
| **強み ** | - GLM-4-9B-0414: 高い性能対サイズ比、Math & Reasoning で優れる - GLM-Z1-9B-0414: Math および General Tasks で強力なパフォーマンス |
| **タスク指向 ** | - GLM-4-9B-0414: チャット指向 - GLM-Z1-9B-0414: 推論重視 |
| モダリティ | HTML/SVG 可視化サポート付きテキスト間 |
| コンテキストウィンドウ | 32K トークン |
| トレーニングとアライメント | GLM-4-32B から蒸留。ベースモデルは 15 兆トークンの高品質データ(特に合成推論データ)で事前学習され、対話タスクのための人間の嗜好調整によってアライメント済み。 |
bge-m3

BGE-M3 は ** 北京人工智能研究院(BAAI)** が開発した最先端のテキスト埋め込みモデルです。** 機能性 、 言語サポート 、 入力粒度 の 3 つのコア次元にわたって卓越した汎用性を発揮するように設計されています。BGE-M3 は MKQA や MLDR を含む複数のベンチマークで ** 最先端の結果 ** を達成し、 単言語 ** および ** 言語間** の両方の検索シナリオで競合モデルを一貫して上回ります。
- 多機能性: BGE-M3 は統一アーキテクチャ内で 3 つの検索戦略をシームレスに統合します。
- Dense Retrieval – 入力ごとに単一のベクトル表現を生成し、一般的な意味マッチングに最適。
- Sparse Retrieval – トークンレベルの重要度に焦点を当て、従来の語彙マッチングに類似。
- Multi-Vector Retrieval – 入力ごとに複数のベクトルを生成し、細かい意味を捉えて検索精度を向上。
- **多言語性 **: 100 以上の言語 をサポートし、多言語および言語間検索機能を実現。
- **多粒度性 **: 短いフレーズから長文書まで、入力あたり最大 8192 トークン をサポートし、幅広い入力長を処理するよう設計。
Novita AI で無料モデルにアクセスする方法
ステップ 1: ログインしてモデルライブラリにアクセス
アカウントにログインし、モデルライブラリ ボタンをクリックします。

ステップ 2: モデルを選択
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ 3: 無料トライアルを開始
無料トライアルを開始して、選択したモデルの機能を試します。

ステップ 4: API キーを取得
API で認証するために、新しい API キーを提供します。「Settings」ページに移動し、画像のように API キーをコピーできます。

ステップ 5: API をインストール
使用しているプログラミング言語に応じたパッケージマネージャーを使用して API をインストールします。
インストール後、必要なライブラリを開発環境にインポートします。API キーを使用して API を初期化し、Novita AI LLM との対話を開始します。以下は Python ユーザー向けのチャット補完 API の使用例です。
from openai import OpenAI
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "model name"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
インテリジェントなチャットボット、セマンティック検索エンジン、または多言語レコメンデーションシステムを構築している場合でも、 Novita AI のモデルへの無料アクセス は、迅速に始めるために必要なすべてを提供します。ワールドクラスのパフォーマンスと簡単な API 統合により、これらのモデルはスケーラブルな AI をこれまで以上にアクセスしやすくします。
Novita AI は、開発者がシンプルな API を使用して AI モデルを簡単にデプロイできる AI クラウドプラットフォームであり、構築とスケーリングのための手頃で信頼性の高い GPU クラウドも提供しています。
