ERNIE 4.5は、強力なテキスト処理とマルチモーダル処理を実現するBaiduの高度なAIモデルファミリーです。大規模導入と軽量導入の両方のオプションを備えたERNIE 4.5は、開発者と企業に効率的なパフォーマンスと費用対効果の高いアクセスを提供します。テキスト、画像、またはその両方を扱う場合でも、ERNIE 4.5はWebインターフェース、API、クラウドプラットフォームから簡単にアクセスでき、複雑な設定は必要ありません。
ERNIE 4.5 の簡単な紹介
ERNIE 4.5は、Baiduが開発した高度なAIモデルファミリーであり、効率的なマルチモーダルおよびテキストベースの処理に重点を置いています。これらのモデルは、大規模なバリアントにはMixture of Experts(MoE)アーキテクチャを、小規模なバリアントにはDenseアーキテクチャを採用しています。テキストおよびビジョンモダリティをサポートし、事前学習(PT)バージョンとベースバージョンのオプションが用意されています。以下は、主要なモデルバリアントの一覧表と、ERNIEのAI学習フローにおけるイノベーションを示す図です。
| モデル | ベース(Base) | 有効 | タイプ | モダリティ | 遊園地列車 |
|---|---|---|---|---|---|
| アーニー 4.5 VL 424B A47B | 424B | 47B | 萌え | T+V | PT |
| ERNIE 4.5 VL 424B A47B ベース | 424B | 47B | 萌え | T+V | ベース(Base) |
| アーニー 4.5 VL 28B A3B | 28B | 3B | 萌え | T+V | PT |
| ERNIE 4.5 VL 28B A3B ベース | 28B | 3B | 萌え | T+V | ベース(Base) |
| ERNIE 4.5 VL 28B A3B シンキング | 28B | 3B | 萌え | T+V | PT |
| アーニー 4.5 300B A47B | 300B | 47B | 萌え | テキスト | PT |
| ERNIE 4.5 300B A47B ベース | 300B | 47B | 萌え | テキスト | ベース(Base) |
| アーニー 4.5 21B A3B | 21B | 3B | 萌え | テキスト | PT |
| ERNIE 4.5 21B A3B ベース | 21B | 3B | 萌え | テキスト | ベース(Base) |
| アーニー 4.5 21B A3B シンキング | 21B | 3B | 萌え | テキスト | PT |
| アーニー 4.5 0.3B | 0.3B | – | 密集 | テキスト | PT |
| ERNIE 4.5 0.3B ベース | 0.3B | – | 密集 | テキスト | ベース(Base) |
AIトレーニングフロー:ERNIEのイノベーションのハイライト
1. マルチモーダル異種MoE事前トレーニング
異種の MoE 構造、モダリティ分離ルーティング、バランスのとれたマルチモーダル損失によるテキストとビジョンの共同事前トレーニング。
2. スケーリング効率の高いインフラストラクチャ
ハイブリッド並列処理、階層型負荷分散、エキスパート並列処理、メモリ最適化スケジューリング、ロスレス量子化により、高スループットと効率的な推論を実現します。
3. モダリティ別の事後トレーニング
テキストまたはビジョンタスクを微調整し、SFT、DPO、UPO をサポートして、さまざまな実際のアプリケーションのニーズに対応します。
パフォーマンス比較: ERNIE 4.5 vs. GPT-4o
ERNIE 4.5はGPT-4oと比較して優れたパフォーマンスと優れたコスト効率を実現しており、大規模なAI導入において非常に競争力のある選択肢となっています。 Novita AI!
- アーニー 4.5 VL 424B A47B
- 0.336万入力トークンあたり1ドル
- 1万出力トークンあたり1ドル
- アーニー 4.5 300B A47
- 0.224万入力トークンあたり1ドル
- 0.88万出力トークンあたり1ドル
- アーニー 4.5 21B A3B / ERNIE-4.5-21B-A3B-思考
- 0.056万入力トークンあたり1ドル
- 0.224万出力トークンあたり1ドル
- アーニー 4.5 VL 28B A3B
- 0.112万入力トークンあたり1ドル
- 0.448万出力トークンあたり1ドル
- ERNIE-4.5-VL-28B-A3B-思考
- 0.39万入力トークンあたり1ドル
- 0.39万出力トークンあたり1ドル

BaiduプラットフォームからERNIE 4.5にアクセス(無料トライアル)
Baiduプラットフォームのウェブインターフェースから直接お試しいただけます。インストールは不要です。ウェブサイトにアクセスして、すぐに無料トライアルを開始してください。

あるいは、Novita API Playground を使用して、開発者に優しい環境で ERNIE 4.5 を試すこともできます。

ERNIE 4.5 にローカルでアクセス
Ernie 4.5 を使用するためのシステム要件は何ですか?
FP16 精度
| モデル | パラメータ(アクティブ) | 必要なVRAM | 理想的 GPU(S) |
|---|---|---|---|
| アーニー 4.5 VL 424B | 424B(アクティブ47B) | 〜945 GB | NVIDIA H100 (80GB) × 12 |
| アーニー 4.5 300B | 300B(アクティブ47B) | 〜668 GB | NVIDIA H100 (80GB) × 9 |
| ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B シンキング | 28B(アクティブ3B) | 〜80 GB | NVIDIA A100/H100 (80GB) |
| アーニー 4.5 21B / アーニー 4.5 21B A3B シンキング | 21B(アクティブ3B) | 〜48GB | NVIDIA RTX 4090 (24GB)×2 |
| アーニー 4.5 0.3B | 300M | 〜2.5 GB | NVIDIA RTX 4090 (8GB) / RTX 3060 (12GB) |
INT4精度
| モデル | パラメータ(アクティブ) | 必要なVRAM | 理想的 GPU(S) |
|---|---|---|---|
| アーニー 4.5 VL 424B | 424B(アクティブ47B) | 〜237 GB | NVIDIA H100 (80GB) × 3 |
| アーニー 4.5 300B | 300B(アクティブ47B) | 〜168 GB | NVIDIA H100 (80GB) × 3 |
| アーニー 4.5 VL 28B / ERNIE 4.5 VL 28B A3B シンキング | 28B(アクティブ3B) | 〜17 GB | NVIDIA RTX 4090 (24GB) / A10G (24GB) |
| アーニー 4.5 21B / ERNIE 4.5 21B A3B 思考 | 21B(アクティブ3B) | 〜13 GB | NVIDIA RTX 4080 (16GB) / A10G (24GB) |
| アーニー 4.5 0.3B | 300M | 〜1.8 GB | ブリッジ GPU4GB以上のVRAMを搭載した |
公式 ERNIEToolkit とオープンソースリリースに基づいています:
- OS: Linux を強く推奨します (Ubuntu または類似のもの)。
- フレームワーク: PaddlePaddle(最新バージョン)が必要です。
- 推論/トレーニングの場合: アーニーキット (PaddlePaddle に基づく)。
- 導入を加速するには ファストデプロイ.
- 依存関係:
- Python 3.8以降
- CUDAとcuDNNがあなたの GPU セットアップ。
- PyTorch環境の場合: モデルは以下からも入手可能です。
transformerstrust_remote_code=True
購入する場合 GPU 費用がかかりすぎると思われる場合は、 Novita AIコスト効率が高く信頼性の高いクラウド GPU サービス。例えば、1GBのVRAMを搭載した100x H80 SXM 80GBインスタンスを2.56時間あたりわずか8ドルで利用できます。また、最大XNUMX台まで拡張できます。 GPU時給 20.48 ドル。
PythonアプリケーションからERNIE 4.5にアクセスする
- ハグ顔: QERNIE 4.5をSpaces、パイプライン、またはTransformersライブラリで使用します。 Novita AI エンドポイント
- エージェントとオーケストレーション フレームワーク: 簡単に接続 Novita AI パートナープラットフォーム 続ける, 何もLLM, ラングチェーン, ディファイ の三脚と ラングフロー 公式コネクタとステップバイステップの統合ガイドを通じて。

API経由でERNIE 4.5にアクセスする
ステップ1: ログインしてモデルライブラリにアクセスする
アカウントにログインして、 モデルライブラリ

ステップ2: モデルを選択する
利用可能なオプションを参照して、ニーズに合ったモデルを選択してください。

ステップ 3: 無料トライアルを開始する
無料トライアルを開始して、選択したモデルの機能を調べてください。

ステップ4: APIキーを取得する
API で認証するには、新しい API キーが提供されます。「設定」ページに入ると、画像に示されているように API キーをコピーできます。

ステップ5: APIをインストールする
プログラミング言語固有のパッケージ マネージャーを使用して API をインストールします。
インストール後、開発環境に必要なライブラリをインポートします。APIキーでAPIを初期化して、 Novita AI LLMこれは、Python ユーザー向けのチャット補完 API の使用例です。
openai からインポート OpenAI クライアント = OpenAI( base_url="https://api.novita.ai/v3/openai", api_key="", ) model = "baidu/ernie-4.5-300b-a47b-paddle" stream = True # または False max_tokens = 6000 system_content = ""役に立つアシスタントになりましょう"" temperature = 1 top_p = 1 min_p = 0 top_k = 50 presence_penalty = 0 frequency_penalty = 0 repetition_penalty = 1 response_format = { "type": "text" } chat_completion_res = client.chat.completions.create( model=model, messages=[ { "role": "system", "content": system_content, }, { "role": "user", "content": "こんにちは!", } ], stream=stream, max_tokens=max_tokens, temperature=temperature, top_p=top_p, presence_penalty=presence_penalty, frequency_penalty=周波数ペナルティ、response_format=レスポンスフォーマット、extra_body={ "top_k": top_k、 "repetition_penalty": repetition_penalty、 "min_p": min_p } ) ストリームの場合: for chunk in chat_completion_res: print(chunk.choices[0].delta.content or "", end="") else: print(chat_completion_res.choices[0].message.content)
ERNIE 4.5へのアクセスは柔軟かつシンプルです。即時のWebトライアルから、堅牢なAPI統合、そしてローカルデプロイメントまで、ワークフローに合ったアプローチをお選びいただけます。優れたパフォーマンスとリーズナブルな価格設定により、ERNIE 4.5は次世代AIアプリケーションにとって実用的な選択肢となります。
よくある質問
はい、ERNIE 4.5 はほとんどのベンチマークで DeepSeek V3 671B よりも高いスコアを獲得しており、他のトップモデルと非常に競争力があります。
要件はモデルのサイズによって異なりますが、Linuxシステム、Python 3.8以上、PaddlePaddle、互換性のあるNVIDIAが必要です。 GPU。 雲 GPU ローカルハードウェアがない場合には、オプションが利用可能です。
ERNIE 4.5の最大バージョン(424Bや300Bなど)を実行するには、数百GBの非常に高いVRAMと複数のハイエンド GPUより小さいバージョンや量子化されたバージョンでは、必要な VRAM が大幅に少なくなります。
Novita AI AIへの野心を実現するオールインワンのクラウドプラットフォームです。統合API、サーバーレス、 GPU インスタンス — コスト効率の高い、必要なツール。インフラストラクチャを不要にし、無料で始め、AIビジョンを現実にしましょう。
読書をお勧めします
- Qwen3 Reranker 8Bが利用可能になりました Novita AI: AI検索精度の向上
- GLM 4.1V 9B Thinking vs Qwen2.5 VL 72B: どちらが何に適合しますか?
- Qwen3 埋め込み 8B: 強力な検索、柔軟なカスタマイズ、多言語対応
Novitaの詳細を見る
最新の投稿をメールで受け取るには購読してください。





