ERNIE 4.5 へのアクセス方法：Web、API、コードを使った簡単な方法

ERNIE 4.5 の簡単な紹介
Baidu プラットフォームを通じて ERNIE 4.5 にアクセスする（無料トライアル）
ERNIE 4.5 をローカルで使用する
Python アプリケーションから ERNIE 4.5 にアクセスする
よくある質問

ERNIE 4.5 は、Baidu の高度な AI モデルファミリーであり、強力なテキストおよびマルチモーダル処理を実現します。大規模展開と軽量展開の両方に対応したオプションを備え、開発者や企業にとって効率的なパフォーマンスと費用対効果の高いアクセスを提供します。テキスト、画像、またはその両方を扱う場合でも、ERNIE 4.5 は Web インターフェース、API、クラウドプラットフォームを通じて簡単にアクセスでき、複雑なセットアップは必要ありません。

ERNIE 4.5 の簡単な紹介

ERNIE 4.5 は、Baidu が開発した高度な AI モデルファミリーであり、効率的なマルチモーダルおよびテキストベースの処理に重点を置いています。これらのモデルは、大規模バリアントには Mixture of Experts（MoE）アーキテクチャを、小規模バリアントには Dense アーキテクチャを採用しています。テキストとビジョンモダリティをサポートし、事前学習（PT）バージョンとベースバージョンのオプションがあります。以下は主要なモデルバリアントの表と、ERNIE の AI トレーニングフローにおける革新性を示す図です。

Model	Base	Active	Type	Modality	Train
ERNIE 4.5 VL 424B A47B	424B	47B	MoE	T+V	PT
ERNIE 4.5 VL 424B A47B Base	424B	47B	MoE	T+V	Base
ERNIE 4.5 VL 28B A3B	28B	3B	MoE	T+V	PT
ERNIE 4.5 VL 28B A3B Base	28B	3B	MoE	T+V	Base
ERNIE 4.5 VL 28B A3B Thinking	28B	3B	MoE	T+V	PT
ERNIE 4.5 300B A47B	300B	47B	MoE	Text	PT
ERNIE 4.5 300B A47B Base	300B	47B	MoE	Text	Base
ERNIE 4.5 21B A3B	21B	3B	MoE	Text	PT
ERNIE 4.5 21B A3B Base	21B	3B	MoE	Text	Base
ERNIE 4.5 21B A3B Thinking	21B	3B	MoE	Text	PT
ERNIE 4.5 0.3B	0.3B	–	Dense	Text	PT
ERNIE 4.5 0.3B Base	0.3B	–	Dense	Text	Base

AI トレーニングフロー：ERNIE の革新性に焦点

1. マルチモーダル異種 MoE 事前学習

異種 MoE 構造、モダリティ分離ルーティング、バランスの取れたマルチモーダル損失を用いたテキストとビジョンの共同事前学習。

2. スケーリング効率の高いインフラストラクチャ

ハイブリッド並列処理、階層的負荷分散、エキスパート並列処理、メモリ最適化スケジューリング、ロスレス量子化により、高スループットと効率的な推論を実現。

3. モダリティ固有の事後学習

テキストまたはビジョンタスク向けのファインチューニングをサポート。SFT、DPO、UPO を活用し、多様な実世界のアプリケーションニーズに対応します。

パフォーマンス比較：ERNIE 4.5 vs. GPT-4o

ERNIE 4.5 は、GPT-4o と比較して優れたパフォーマンスと卓越したコスト効率を提供し、大規模 AI 導入において非常に競争力のある選択肢です。これは Novita AI での価格です！

ERNIE 4.5 VL 424B A47B
- $0.336 / 100万入力トークン
- $1 / 100万出力トークン
ERNIE 4.5 300B A47
- $0.224 / 100万入力トークン
- $0.88 / 100万出力トークン
ERNIE 4.5 21B A3B / ERNIE-4.5-21B-A3B-Thinking
- $0.056 / 100万入力トークン
- $0.224 / 100万出力トークン
ERNIE 4.5 VL 28B A3B
- $0.112 / 100万入力トークン
- $0.448 / 100万出力トークン
ERNIE-4.5-VL-28B-A3B-Thinking
- $0.39 / 100万入力トークン
- $0.39 / 100万出力トークン

インターネットより

Baidu プラットフォームを通じて ERNIE 4.5 にアクセスする（無料トライアル）

Baidu プラットフォームの Web インターフェースから直接試すことができ、インストールは不要です。ウェブサイトにアクセスして、すぐに無料トライアルを開始してください。

または、Novita API Playground を使用して、開発者に優しい環境で ERNIE 4.5 を試すこともできます。

今すぐ Novita AI を試す！

ERNIE 4.5 をローカルで使用する

ERNIE 4.5 を使用するためのシステム要件は？

FP16 精度

モデル	パラメータ（アクティブ）	必要 VRAM	推奨 GPU
ERNIE 4.5 VL 424B	424B (47B active)	~945 GB	NVIDIA H100（80GB）× 12
ERNIE 4.5 300B	300B (47B active)	~668 GB	NVIDIA H100（80GB）× 9
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking	28B (3B active)	~80 GB	NVIDIA A100/H100（80GB）
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking	21B (3B active)	~48GB	NVIDIA RTX 4090（24GB）× 2
ERNIE 4.5 0.3B	300M	~2.5 GB	NVIDIA RTX 4090（8GB）/ RTX 3060（12GB）

INT4 精度

モデル	パラメータ（アクティブ）	必要 VRAM	推奨 GPU
ERNIE 4.5 VL 424B	424B (47B active)	~237 GB	NVIDIA H100（80GB）× 3
ERNIE 4.5 300B	300B (47B active)	~168 GB	NVIDIA H100（80GB）× 3
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking	28B (3B active)	~17 GB	NVIDIA RTX 4090（24GB）/ A10G（24GB）
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking	21B (3B active)	~13 GB	NVIDIA RTX 4080（16GB）/ A10G（24GB）
ERNIE 4.5 0.3B	300M	~1.8 GB	VRAM が 4GB を超えるほとんどの GPU

公式の ERNIEToolkit とオープンソースリリースに基づく：

OS: Linux を強く推奨（Ubuntu または類似のもの）。
フレームワーク: PaddlePaddle（最新バージョン）が必要。
- 推論/トレーニングには ERNIEKit（PaddlePaddle ベース）を使用。
- デプロイメントは FastDeploy で高速化可能。
依存関係:
- Python 3.8+
- GPU 設定に一致する CUDA および cuDNN。
- PyTorch 環境の場合：モデルは trust_remote_code=True を指定した transformers からも利用可能。

GPU の購入がコスト高に感じられる場合は、Novita AI の費用対効果が高く信頼性の高いクラウド GPU サービスを利用できます。たとえば、80 GB VRAM の 1x H100 SXM 80GB インスタンスを 1 時間あたりわずか $2.56 で利用でき、8 GPU までスケールアップすると $20.48/時間です。

今すぐ Novita AI を試す！

Python アプリケーションから ERNIE 4.5 にアクセスする

Hugging Face: Spaces、パイプライン、または Novita AI エンドポイントを介した Transformers ライブラリで QERNIE 4.5 を使用します。
エージェントとオーケストレーションフレームワーク: Novita AI を Continue、AnythingLLM、LangChain、Dify、Langflow などのパートナープラットフォームと、公式コネクタおよびステップバイステップの統合ガイドを通じて簡単に接続できます。
OpenAI 互換 API: OpenAI API 標準向けに設計された Cline や Cursor などのツールと、手間のかからない移行と統合を楽しめます。

詳細は Docs をご覧ください

API 経由で ERNIE 4.5 にアクセスする

ステップ 1: ログインしてモデルライブラリにアクセス

アカウントにログインし、モデルライブラリ ボタンをクリックします。

ERNIE 4.5 を今すぐ試す！

ステップ 2: モデルを選択

利用可能なオプションを参照し、ニーズに合ったモデルを選択します。

ステップ 3: 無料トライアルを開始

無料トライアルを開始して、選択したモデルの機能を試してみましょう。

ステップ 4: API キーを取得

API で認証するために、新しい API キーを提供します。[設定] ページに移動し、画像の指示に従って API キーをコピーします。

ステップ 5: API をインストール

使用するプログラミング言語に適したパッケージマネージャーを使用して API をインストールします。

インストール後、開発環境に必要なライブラリをインポートします。API キーを使用して API を初期化し、Novita AI LLM との連携を開始します。これは、Python ユーザー向けのチャット補完 API の使用例です。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "baidu/ernie-4.5-300b-a47b-paddle"
stream = True # or False
max_tokens = 6000
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

ERNIE 4.5 へのアクセスは柔軟で簡単です。インスタント Web トライアルから堅牢な API 統合、ローカルデプロイメントまで、ワークフローに合ったアプローチを選択できます。優れたパフォーマンスと効率的な価格設定により、ERNIE 4.5 は次世代 AI アプリケーションにとって実用的な選択肢です。

よくある質問

ERNIE 4.5 は本当に他の大規模 AI モデルより優れていますか？

はい、ERNIE 4.5 はほとんどのベンチマークで DeepSeek V3 671B よりも高いスコアを獲得しており、他のトップモデルと非常に競争力があります。

ERNIE 4.5 をローカルで実行するためのシステム要件は？

要件はモデルサイズによって異なりますが、Linux システム、Python 3.8+、PaddlePaddle、および互換性のある NVIDIA GPU が必要です。ローカルハードウェアがない場合は、クラウド GPU オプションも利用できます。

ERNIE 4.5 を実行するにはどのくらいの VRAM が必要ですか？

ERNIE 4.5 の最大バージョン（424B や 300B など）を実行するには、非常に高い VRAM（数百 GB と複数のハイエンド GPU）が必要です。小規模または量子化バージョンでは、はるかに少ない VRAM で済みます。

Novita AI は、AI の野望を実現するオールインワンのクラウドプラットフォームです。統合 API、サーバーレス、GPU インスタンス — 必要なコスト効率の高いツールを提供します。インフラストラクチャを排除し、無料で開始して、AI ビジョンを現実のものにしましょう。

ERNIE 4.5 へのアクセス方法：Web、API、コードを使った簡単な方法

ERNIE 4.5 の簡単な紹介

AI トレーニングフロー：ERNIE の革新性に焦点

1. マルチモーダル異種 MoE 事前学習

2. スケーリング効率の高いインフラストラクチャ

3. モダリティ固有の事後学習

パフォーマンス比較：ERNIE 4.5 vs. GPT-4o

Baidu プラットフォームを通じて ERNIE 4.5 にアクセスする（無料トライアル）

ERNIE 4.5 をローカルで使用する

ERNIE 4.5 を使用するためのシステム要件は？

FP16 精度

INT4 精度

Python アプリケーションから ERNIE 4.5 にアクセスする

API 経由で ERNIE 4.5 にアクセスする

よくある質問

おすすめの記事

Product

RESOURCES

Partners

Company

ERNIE 4.5 の簡単な紹介

AI トレーニングフロー：ERNIE の革新性に焦点

1. マルチモーダル異種 MoE 事前学習

2. スケーリング効率の高いインフラストラクチャ

3. モダリティ固有の事後学習

パフォーマンス比較：ERNIE 4.5 vs. GPT-4o

Baidu プラットフォームを通じて ERNIE 4.5 にアクセスする（無料トライアル）

ERNIE 4.5 をローカルで使用する

ERNIE 4.5 を使用するためのシステム要件は？

FP16 精度

INT4 精度

Python アプリケーションから ERNIE 4.5 にアクセスする

API 経由で ERNIE 4.5 にアクセスする

よくある質問

おすすめの記事

関連記事

Product

RESOURCES

Partners

Company