ERNIE-4.5-21B-A3B-ThinkingはNovita AIプラットフォームで利用可能になり、開発者や企業が開発者に優しいインフラを通じて百度の画期的な思考(Thinking)機能を利用できるようになります。百度の最新リリースは軽量AIモデルの大きな進歩を表しており、前世代と一線を画す強化された推論の深さと品質を導入しています。
効率的な混合専門家(Mixture-of-Experts, MoE)アーキテクチャにより、トークンごとに21Bのパラメータのうち3Bのみをアクティブ化するERNIE-4.5-21B-A3B-Thinkingは、軽量なリソース要件で重厚なパフォーマンスを提供します。
複雑な推論アプリケーションの開発、数学ソルバーの構築、高度なAI機能の探索を行っている場合でも、Novita AI上のERNIE-4.5-21B-A3B-Thinkingは最適化されたインフラと簡単な統合オプションにより開発プロセスを簡素化します。
Novita AIでの現在の料金: 131,072コンテキスト、入力トークン1Mあたり$0.07、出力トークン1Mあたり$0.28
ERNIE-4.5-21B-A3B-Thinkingのデモを試す
ERNIE-4.5-21B-A3B-Thinkingとは?
ERNIE-4.5-21B-A3B-Thinkingは、百度の画期的なERNIE 4.5シリーズ(全10モデルで構成)のテキストベース混合専門家(Mixture of Experts, MoE)ポストトレーニングモデルです。このモデルはAIの思考能力の大きな進化を表しており、トークンごとに3Bのみがアクティブ化される21Bの総パラメータを特徴としています。
前バージョンに対する3つの主要な改善点:
強化された思考能力: ERNIE-4.5-21B-A3B-Thinkingは、論理的推論、数学、科学、コーディング、テキスト生成、通常は人間の専門知識を必要とする学術ベンチマークなどの推論タスクで大幅に改善されたパフォーマンスを提供します。モデルは思考の長さが増加しており、特に高度に複雑な推論タスクで効果的です。
効率的なツール活用: このモデルはツールの使用と関数呼び出しで優れた能力を示し、エージェントベースのアプリケーションに最適です。これにより、実世界のアプリケーション向けに外部システムやAPIとのシームレスな統合が可能になります。
拡張されたコンテキスト理解: 強化された128Kの長文コンテキスト理解能力(131,072トークン)により、ERNIE-4.5-21B-A3B-Thinkingはコンテキストや精度を失うことなく、膨大なドキュメント、コードベース、複雑なマルチターン会話を処理できます。
ERNIE-4.5-21B-A3B-Thinkingは、SFT(教師あり微調整)、DPO(直接選好最適化)、百度独自のUPO(統合選好最適化)を含む高度なポストトレーニング技術を利用しています。このモデルはTransformerスタイルの重みを公開し、幅広いコミュニティとの互換性を確保しており、PyTorchとPaddlePaddleのエコシステム(vLLMやFastDeployを含む)の両方と互換性があります。この広範な互換性により、既存のワークフローへの統合が容易になり、80GB × 1 GPUの要件で計算効率を維持できます。
ERNIE-4.5-21B-A3B-ThinkingをNovita AI Playgroundで探索する →
モデル仕様
ERNIE-4.5-21B-A3B-Thinkingは、パフォーマンスと効率性の両方に最適化された洗練された混合専門家アーキテクチャを採用しています。モデルの設計により、トークンごとに関連性の高いエキスパートが選択的にアクティブ化され、機能性と計算コストの最適なバランスを実現しています。
コア仕様:
- 総パラメータ: 21B
- アクティブパラメータ: トークンごとに3B
- レイヤー数: 28
- アテンションヘッド数: クエリヘッド20個 / キー・バリューヘッド4個
- テキストエキスパート数: 合計64個 / トークンごとに6個アクティブ
- 共有エキスパート数: 2
- コンテキスト長: 131,072トークン
- 最大出力: 65,536トークン
- 入出力機能: テキスト
- トレーニング段階: ポストトレーニング
- プロバイダ: 百度
- ライセンス: Apache 2.0
- 量子化: FP8
- GPU要件: 80GB × 1 GPU
- 推論サポート: あり
ERNIE-4.5-21B-A3B-ThinkingのMoEアーキテクチャは、モダリティ分離ルーティングやルーター直交損失技術など、ERNIE 4.5シリーズ全体のイノベーションを継承しており、効率的なAI設計のブレークスルーを表しています。トークンごとに3Bのパラメータのみをアクティブ化しながら21Bの総パラメータにアクセスできることで、このモデルは典型的な計算オーバーヘッドなしにエンタープライズグレードのパフォーマンスを提供します。
このモデルの131,072トークンのコンテキストウィンドウと65,536トークンの出力機能により、膨大なドキュメントの処理と包括的な応答の生成が可能になり、複雑な分析タスク、長文コンテンツ生成、詳細な技術ドキュメント作成に最適です。
パフォーマンスのハイライト
ERNIE-4.5-21B-A3B-Thinkingは複数のドメインで優れたパフォーマンスを示し、ERNIE 4.5ファミリーの一員として最先端(SOTA)の結果を達成しています。強化された思考能力と改善された推論の深さにより、特にマルチステップ分析や複雑な問題解決を必要とするタスクで効果的です。

主要なパフォーマンスの強み:
- 論理的推論: ERNIE-4.5-21B-A3B-Thinkingは複雑な論理的推論タスクで優れ、パズル、シロギズム、慎重な分析と体系的な思考を必要とするマルチステップ推論問題で優れたパフォーマンスを示します。
- 数学: このモデルは高度な数学の問題解決能力を示し、基本的な算術から複雑な微積分、線形代数、抽象的な数学概念まで、高い精度で処理します。
- 科学: 強化された科学的推論と分析能力により、ERNIE-4.5-21B-A3B-Thinkingは物理学、化学、生物学などの科学ドメインの問題に取り組み、詳細な説明と正確な解決策を提供します。
- コーディング: 複数のプログラミング言語での改善されたコード生成とデバッグ能力により、このモデルはコードの作成、分析、最適化を行いながら、プログラミング概念とベストプラクティスの明確な説明を提供できます。
- テキスト生成: 高品質な自然言語生成により、ERNIE-4.5-21B-A3B-Thinkingは、ニュアンスのある理解と表現を必要とするクリエイティブライティング、技術ドキュメント、コンテンツ作成タスクに最適です。
- 学術ベンチマーク: このモデルは人間レベルの専門知識を必要とするベンチマークで競争力のあるパフォーマンスを達成し、プロフェッショナルおよび学術用途での準備ができていることを示しています。
Novita AI PlaygroundでERNIE-4.5-21B-A3B-Thinkingの能力をテストする →
Novita AIプラットフォームでのERNIE-4.5-21B-A3B-Thinkingの利用開始
Novita AIは、異なる技術的専門知識レベルとユースケースに合わせて、ERNIE-4.5-21B-A3B-Thinkingにアクセスするための複数のパスを提供しています。AI機能を探索しているビジネスユーザーでも、本番アプリケーションを構築している開発者でも、当社のプラットフォームは必要なツールと柔軟性を提供します。
プレイグラウンドを利用する(今すぐ利用可能 – コーディング不要)
Novita AIのプレイグラウンドは、技術的なセットアップなしでERNIE-4.5-21B-A3B-Thinkingの能力を体験する最速の方法です:
即時アクセス: サインアップして数秒でERNIE-4.5-21B-A3B-Thinkingの実験を開始できます。初期テストにはAPIキーや設定は不要です。
インタラクティブなインターフェース: 直感的なWebインターフェースでプロンプトをテストし、リアルタイムで出力を視覚化できます。温度(デフォルト0.7)、最大トークン数(最大65,536)、システムプロンプトなどのパラメータを調整して、モデルの動作への影響を確認できます。
モデル設定: 応答形式、温度、top-p、min-p、top-k、存在ペナルティ、頻度ペナルティ、反復ペナルティを微調整して、特定のユースケースに最適な出力を得られます。
プレイグラウンドは、プロトタイピング、アイデアのテスト、完全な実装前にモデルの能力を理解するのに最適です。成功したプロンプトと設定をコードに直接エクスポートして、本番環境へのシームレスな移行を実現できます。
プレイグラウンドでのERNIE-4.5-21B-A3B-Thinkingのテストを開始する →
API経由での統合(本番運用可能 – 開発者向け)
本番デプロイ向けに、Novita AIはOpenAI互換のエンドポイントを通じて、エンタープライズグレードの信頼性とパフォーマンスでERNIE-4.5-21B-A3B-Thinkingへの堅牢なAPIアクセスを提供します。
直接API統合(Python例)
OpenAI互換APIを使用してERNIE-4.5-21B-A3B-Thinkingをアプリケーションに接続します:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/openai",
api_key="",
)
model = "baidu/ernie-4.5-21B-a3b-thinking"
stream = True # or False
max_tokens = 32768
system_content = "Be a helpful assistant"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
TypeScript、Java、Go、Shell向けの追加SDKサポートも利用可能で、異なる技術スタック全体でシームレスな統合を実現します。
OpenAI Agents SDKを使用したマルチエージェントワークフロー
ERNIE-4.5-21B-A3B-Thinkingの強化された思考能力を活用した高度なマルチエージェントシステムを構築します:
- プラグアンドプレイ統合: 変更なしで任意のOpenAI AgentsワークフローでERNIE-4.5-21B-A3B-Thinkingを使用可能
- 高度なエージェント機能: 複雑なワークフロー向けにハンドオフ、ルーティング、ツール統合を完全サポート
- 関数呼び出し: 構造化されたインタラクションとツール使用のためにJsonSchema定義を活用可能
デプロイオプション
Novita AIは、特定の要件と使用パターンに合わせて、柔軟なデプロイオプションを提供しています。
サーバーレスAPI
ERNIE-4.5-21B-A3B-ThinkingはNovitaのサーバーレスAPIで利用可能で、即時アクセスとトークン単位の従量課金を提供します:
- セットアップ不要: インフラ管理なしでモデルをすぐに使用開始可能
- 従量課金制: 入力トークン1Mあたり$0.07、出力トークン1Mあたり$0.28
- OpenAI互換エンドポイント: 既存のOpenAI統合のドロップイン置換
- 自動スケーリング: キャパシティプランニングなしで変動するワークロードを処理
オンデマンドデプロイ
大規模または低レイテンシーが要求されるアプリケーション向けに、オンデマンドデプロイは専用リソースを提供します:
- 高性能サービングスタック: 最大スループット向けに最適化された推論エンジン
- 高信頼性: 専用GPUリソースが一貫したパフォーマンスを確保
- レート制限なし: 人工的な制限なしで必要に応じてスケール
- GPU要件: 80GB VRAM(最適なパフォーマンスのためNVIDIA A100 80GBまたはH100 80GBを推奨)
サードパーティプラットフォームとの連携
Novita AI上のERNIE-4.5-21B-A3B-Thinkingは、既存の開発エコシステムとシームレスに統合されます:
開発ツール: OpenAI互換APIを通じて、Cursor、Cline、Continue、Codex、Qwen Codeなどの人気IDEや開発環境との直接統合。
オーケストレーションフレームワーク: 公式コネクタを使用して、LangChain、Dify、CrewAI、LangflowなどのAIオーケストレーションプラットフォームをネイティブサポート。
Hugging Face統合: Hugging Faceの公式インファレンスプロバイダーとして、Novita AIは幅広いエコシステムの互換性と簡単なモデルデプロイを確保します。
結論
Novita AI上のERNIE-4.5-21B-A3B-Thinkingは、効率的なAI推論のブレークスルーを表しており、開発者や組織が信頼性が高くスケーラブルな当社プラットフォームを通じて、百度の最も先進的な思考能力にアクセスできるようにします。
このモデルの強化された推論の深さ、効率的なツール活用、131Kのコンテキスト理解の独自の組み合わせにより、複雑な推論タスクに最適な選択肢となります。3Bのアクティブパラメータで21Bパラメータのパフォーマンスを提供し、80GBのGPUメモリのみを必要とすることで、ERNIE-4.5-21B-A3B-Thinkingは能力と効率性の比類のないバランスを提供します。
ERNIE-4.5-21B-A3B-Thinkingの威力を体験する準備はできましたか?当社のプレイグラウンドはセットアップ不要で即時アクセスを提供しており、モデルの能力の探索とユースケースのテストに最適です。まずインタラクティブなインターフェースでモデルの強みを理解し、本番デプロイの準備ができたらAPI統合にシームレスに移行できます。
今すぐNovita AI PlaygroundでERNIE-4.5-21B-A3B-Thinkingにアクセスする →
1M入力トークンあたりわずか$0.07で、高度なAI推論でプロジェクトを変換しましょう。数秒で探索を開始できます!
Novita AIは、シンプルなAPIでAIモデルをデプロイする開発者に簡単な方法を提供するとともに、構築とスケーリングのための手頃で信頼性の高いGPUクラウドを提供するAIクラウドプラットフォームです。
