O ERNIE 4.5 é a família de modelos avançados de IA da Baidu para processamento multimodal e de texto poderoso. Com opções tanto para implantação em larga escala quanto leve, o ERNIE 4.5 oferece desempenho eficiente e acesso econômico para desenvolvedores e empresas. Seja trabalhando com texto, imagens ou ambos, o ERNIE 4.5 pode ser acessado facilmente por meio de interfaces web, APIs e plataformas em nuvem — sem necessidade de configuração complexa.
Introdução Simples ao ERNIE 4.5
O ERNIE 4.5 é uma família de modelos avançados de IA desenvolvidos pela Baidu, focada em processamento multimodal e baseado em texto eficiente. Esses modelos utilizam arquiteturas Mixture of Experts (MoE) para variantes maiores e arquiteturas densas para as menores. Eles suportam modalidades de texto e visão, com opções para versões pré-treinadas (PT) e base. Abaixo está uma tabela das principais variantes do modelo e um diagrama destacando as inovações do ERNIE no fluxo de treinamento de IA.
| Modelo | Base | Ativos | Tipo | Modalidade | Treino |
|---|---|---|---|---|---|
| ERNIE 4.5 VL 424B A47B | 424B | 47B | MoE | T+V | PT |
| ERNIE 4.5 VL 424B A47B Base | 424B | 47B | MoE | T+V | Base |
| ERNIE 4.5 VL 28B A3B | 28B | 3B | MoE | T+V | PT |
| ERNIE 4.5 VL 28B A3B Base | 28B | 3B | MoE | T+V | Base |
| ERNIE 4.5 VL 28B A3B Thinking | 28B | 3B | MoE | T+V | PT |
| ERNIE 4.5 300B A47B | 300B | 47B | MoE | Texto | PT |
| ERNIE 4.5 300B A47B Base | 300B | 47B | MoE | Texto | Base |
| ERNIE 4.5 21B A3B | 21B | 3B | MoE | Texto | PT |
| ERNIE 4.5 21B A3B Base | 21B | 3B | MoE | Texto | Base |
| ERNIE 4.5 21B A3B Thinking | 21B | 3B | MoE | Texto | PT |
| ERNIE 4.5 0.3B | 0.3B | – | Denso | Texto | PT |
| ERNIE 4.5 0.3B Base | 0.3B | – | Denso | Texto | Base |
Fluxo de Treinamento de IA: Inovações do ERNIE em Destaque
1. Pré-treinamento MoE Heterogêneo Multimodal
Pré-treinamento conjunto de texto e visão com estrutura MoE heterogênea, roteamento isolado por modalidade e perda multimodal balanceada.
2. Infraestrutura de Escalabilidade Eficiente
Paralelismo híbrido, balanceamento de carga hierárquico, paralelismo de especialistas, escalonamento otimizado de memória e quantização sem perdas para alta taxa de transferência e inferência eficiente.
3. Pós-treinamento Específico por Modalidade
Ajuste fino para tarefas de texto ou visão, suportando SFT, DPO e UPO para atender às diversas necessidades de aplicações do mundo real.
Comparação de Desempenho: ERNIE 4.5 vs. GPT-4o
O ERNIE 4.5 oferece desempenho superior e excepcional eficiência de custos em comparação com o GPT-4o, tornando-se uma escolha altamente competitiva para implantações de IA em larga escala. Este é o preço na Novita AI!
-
- $0.336 por 1M tokens de entrada
- $1 por 1M tokens de saída
-
- $0.224 por 1M tokens de entrada
- $0.88 por 1M tokens de saída
-
ERNIE 4.5 21B A3B / ERNIE-4.5-21B-A3B-Thinking
- $0.056 por 1M tokens de entrada
- $0.224 por 1M tokens de saída
-
- $0.112 por 1M tokens de entrada
- $0.448 por 1M tokens de saída
-
- $0.39 por 1M tokens de entrada
- $0.39 por 1M tokens de saída

Fonte: Internet
Acesse o ERNIE 4.5 Através da Plataforma Baidu (Teste Gratuito)
Você pode experimentá-lo diretamente através da interface web da plataforma Baidu, sem necessidade de instalação. Basta visitar o site e iniciar seu teste gratuito instantaneamente.

Alternativamente, você pode usar o Novita API Playground para experimentar o ERNIE 4.5 em um ambiente amigável para desenvolvedores.

Acesse o ERNIE 4.5 Localmente
Quais são os requisitos de sistema para usar o Ernie 4.5?
Precisão FP16
| Modelo | Parâmetros (Ativos) | VRAM Necessária | GPU(s) Ideal(is) |
|---|---|---|---|
| ERNIE 4.5 VL 424B | 424B (47B ativos) | ~945 GB | NVIDIA H100 (80GB) × 12 |
| ERNIE 4.5 300B | 300B (47B ativos) | ~668 GB | NVIDIA H100 (80GB) × 9 |
| ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking | 28B (3B ativos) | ~80 GB | NVIDIA A100/H100 (80GB) |
| ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking | 21B (3B ativos) | ~48GB | NVIDIA RTX 4090 (24GB)X2 |
| ERNIE 4.5 0.3B | 300M | ~2.5 GB | NVIDIA RTX 4090 (8GB) / RTX 3060 (12GB) |
Precisão INT4
| Modelo | Parâmetros (Ativos) | VRAM Necessária | GPU(s) Ideal(is) |
|---|---|---|---|
| ERNIE 4.5 VL 424B | 424B (47B ativos) | ~237 GB | NVIDIA H100 (80GB) × 3 |
| ERNIE 4.5 300B | 300B (47B ativos) | ~168 GB | NVIDIA H100 (80GB) × 3 |
| ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking | 28B (3B ativos) | ~17 GB | NVIDIA RTX 4090 (24GB) / A10G (24GB) |
| ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking | 21B (3B ativos) | ~13 GB | NVIDIA RTX 4080 (16GB) / A10G (24GB) |
| ERNIE 4.5 0.3B | 300M | ~1.8 GB | Maioria das GPUs com >4GB VRAM |
Com base no ERNIEToolkit oficial e no lançamento de código aberto:
- SO: Linux é fortemente recomendado (Ubuntu ou similar).
- Framework: PaddlePaddle (versão mais recente) necessário.
- Para inferência/treinamento: use ERNIEKit (baseado no PaddlePaddle).
- A implantação pode ser acelerada com FastDeploy.
- Dependências:
- Python 3.8+
- CUDA e cuDNN compatíveis com sua configuração de GPU.
- Para ambiente PyTorch: os modelos também estão disponíveis via
transformerscomtrust_remote_code=True
Se adquirir uma GPU parece muito caro, você pode aproveitar os serviços de GPU em nuvem econômicos e confiáveis da Novita AI. Por exemplo, você pode acessar uma instância 1x H100 SXM 80GB com 80 GB de VRAM por apenas $2.56 por hora, ou escalar para 8 GPUs por $20.48 por hora.
Acesse o ERNIE 4.5 a partir de uma Aplicação Python
-
Hugging Face: Use o ERNIE 4.5 em Spaces, pipelines ou com a biblioteca Transformers via endpoints da Novita AI.
-
Frameworks de Agente e Orquestração: Conecte facilmente a Novita AI a plataformas parceiras como Continue, AnythingLLM, LangChain, Dify e Langflow através de conectores oficiais e guias de integração passo a passo.
-
API Compatível com OpenAI: Desfrute de migração e integração sem complicações com ferramentas como Cline e Cursor, projetadas para o padrão da API OpenAI.

Você pode obter mais detalhes em Docs
Acesse o ERNIE 4.5 via API
Passo 1: Faça Login e Acesse a Biblioteca de Modelos
Faça login na sua conta e clique no botão Model Library (Biblioteca de Modelos).

Experimente o ERNIE 4.5 Agora!
Passo 2: Escolha Seu Modelo
Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito
Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API
Para autenticar com a API, forneceremos uma nova chave de API. Entrando na página “Settings” (Configurações), você pode copiar a chave de API conforme indicado na imagem.

Passo 5: Instale a API
Instale a API usando o gerenciador de pacotes específico para sua linguagem de programação.
Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de conclusão de chat para usuários Python.
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
api_key="",
)
model = "baidu/ernie-4.5-300b-a47b-paddle"
stream = True # ou False
max_tokens = 6000
system_content = "Seja um assistente útil"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": system_content,
},
{
"role": "user",
"content": "Olá!",
}
],
stream=stream,
max_tokens=max_tokens,
temperature=temperature,
top_p=top_p,
presence_penalty=presence_penalty,
frequency_penalty=frequency_penalty,
response_format=response_format,
extra_body={
"top_k": top_k,
"repetition_penalty": repetition_penalty,
"min_p": min_p
}
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
Acessar o ERNIE 4.5 é flexível e direto — escolha a abordagem que se encaixa no seu fluxo de trabalho, desde testes web instantâneos até integração robusta de API e implantação local. Com desempenho superior e preços eficientes, o ERNIE 4.5 é uma escolha prática para aplicações de IA de próxima geração.
Perguntas Frequentes
O ERNIE 4.5 é realmente melhor do que outros grandes modelos de IA?
Sim, o ERNIE 4.5 obtém pontuações mais altas que o DeepSeek V3 671B na maioria dos benchmarks e é muito competitivo com outros modelos de ponta.
Quais são os requisitos de sistema para executar o ERNIE 4.5 localmente?
Os requisitos variam conforme o tamanho do modelo, mas você precisará de um sistema Linux, Python 3.8+, PaddlePaddle e uma GPU NVIDIA compatível. Opções de GPU em nuvem estão disponíveis se você não tiver hardware local.
Quanta VRAM preciso para executar o ERNIE 4.5?
Executar as maiores versões do ERNIE 4.5 (como 424B ou 300B) requer VRAM muito alta — centenas de GBs e várias GPUs de ponta. Versões menores ou quantizadas precisam de muito menos VRAM.
Novita AI é a plataforma all-in-one em nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece de graça e torne sua visão de IA realidade.
