Novita AI は、数学とコーディングに優れた5つの高性能 THUDM モデルを発表できることを嬉しく思います : GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414、GLM-Z1-9B-0414。開発者とオープンソースコミュニティをサポートするため、GLM-4-9B-0414 と GLM-Z1-9B-0414 は現在無料の API アクセスを提供しています!
Novita AI は、5つのトップクラスの THUDM モデル、GLM-4-32B-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414、GLM-4-9B-0414、GLM-Z1-9B-0414 を自信を持ってリリースします。 GLM-4-32B-0414 は、15T の高品質データと人間の嗜好アライメントに基づいて構築されており、強力な汎用能力を誇り、指示追従、ツール使用、検索 QA で優れた性能を発揮します。 高性能またはコスト効率の高いソリューションを求める開発者のために、Novita AI は現在 GLM-4-9B-0414 および GLM-Z1-9B-0414 への無料 API アクセスを提供しています。
GLM-4 シリーズモデルとは?

THUDM の GLM シリーズは、特に数学、コーディング、推論タスクにおいて、強力な技術的パフォーマンスを示しています。
- 32B モデル(GLM-4-32B、GLM-Z1-32B、GLM-Z1-Rumination)は、汎用能力 ** と深い推論 ** のバランスを提供し、GLM-Z1-Rumination はオープンエンドの問題解決と検索拡張推論 に特化しています。
- 9B モデル(GLM-4-9B、GLM-Z1-9B)は、数学的推論 ** と一般的なタスクパフォーマンス** に高度に最適化されており、軽量デプロイに理想的な印象的な性能対サイズ比を実現しています。
GLM-4-32B-Base-0414 はシリーズ全体の技術基盤として機能します。
- 推論重視の合成データを大量に含む15T の高品質データで事前学習され、複雑なタスク処理のための強固な基盤を確立しました。
- 事後トレーニングの最適化には 人間の嗜好アライメント が含まれており、モデルが自然でユーザーに合わせた対話体験を提供する能力が向上しています。
明確なモデル階層がさまざまな開発ニーズをサポートします。
- 複雑な推論、深い文章作成、クロスドメイン分析 には、GLM-Z1-Rumination-32B が推奨されます。
- 強力な汎用パフォーマンス には、GLM-4-32B が理想的な選択肢です。
- 予算重視のプロジェクト ** や大規模バッチ処理**(例:翻訳、QA)には、無料の GLM-4-9B および GLM-Z1-9B モデルが優れたコストパフォーマンスを提供します。
GLM-4-32B-0414 ベンチマーク

GLM-4-32B-0414 の最も得意とする分野
指示追従 (IFEval): GLM-4-32B-0414 は指示の理解と実行に優れており、全モデル中で最高スコアを達成しました。
ツール使用能力 (BFCL-v3 / TAU-Bench): GLM-4-32B-0414 は、複数の業界(小売、航空)にわたるツール使用タスクで卓越したパフォーマンスを示し、シングルターンおよびマルチターンの両方のシナリオでトップまたは同率1位を記録しました。 特に複雑なマルチターンのツール使用においてその優位性が顕著で、2位のモデルを約10ポイント上回っています。
検索ベースの質問応答 (SimpleQA、HotpotQA): GLM-4-32B-0414 は検索 QA で強力な能力を示し、SimpleQA で最高スコア(88.1)を達成し、HotpotQA では GPT-4o-1120 にほぼ匹敵し、DeepSeek-V3-0324 と Qwen2.5-Max を大幅に上回りました。
GLM-4 シリーズの能力
Code VS Gemini 2.5 Flash
GLM-4 シリーズモデルにアクセスする方法?
ステップ1: ログインしてモデルライブラリにアクセス
アカウントにログインし、モデルライブラリ ボタンをクリックします。

ステップ2: モデルを選択
利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ3: 無料トライアルを開始
選択したモデルの機能を試すために、無料トライアルを開始します。

ステップ4: APIキーを取得
API で認証するために、新しい API キーを提供します。“設定” ページに移動し、画像のように API キーをコピーします。

ステップ5: API をインストール
使用するプログラミング言語に固有のパッケージマネージャーを使用して API をインストールします。

インストール後、必要なライブラリを開発環境にインポートします。API キーを使って API を初期化し、Novita AI LLM との対話を開始します。以下は、Python ユーザー向けのチャット補完 API の使用例です。
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="<YOUR Novita AI API Key>",
)
model = "thudm/glm-4-32b-0414"
stream = True # or False
max_tokens = 2048
system_content = """Be a helpful assistant"""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
まとめ
GLM-4-32B-0414 は、指示への従順性から複雑なマルチターンのツール使用に至るまで、主要な AI タスクで卓越した強みを発揮します。バランスの取れた能力と微調整された対話最適化により、堅牢で多用途なモデルを必要とする開発者にとって理想的な選択肢です。 Novita AI のサポートにより、GLM モデルの探索はかつてないほど簡単になりました。今すぐ モデルプレイグラウンド に飛び込んで、GLM-4 が何ができるかを確かめてください。
よくある質問
GLM-4-32B-0414 が他のモデルと比べて特別な点は何ですか?
GLM-4-32B-0414 は、指示追従、マルチターンのツール使用、検索ベースの QA に優れており、広範な事前学習と微調整された対話最適化に支えられています。
Novita AI 経由で GLM-4-32B-0414 を試せますか?
はい、GLM-4-32B-0414 は Novita AI で競争力のある API 価格で利用可能であり、GLM-4-9B と GLM-Z1-9B は無料でアクセスできます。
GLM-4 シリーズモデルはどのような用途に最適ですか?
GLM-4-32B-0414 は、深い推論、複雑な対話、高精度の指示実行を必要とするタスクに最適です。
Novita AI は、開発者がシンプルな API を使用して AI モデルを簡単にデプロイできるようにするとともに、手頃で信頼性の高い GPU クラウドを提供し、構築とスケーリングを支援する AI クラウドプラットフォームです。
