Como Acessar o ERNIE 4.5: Formas Simples via Web, API e Código

Índice

Introdução Simples ao ERNIE 4.5
Acesse o ERNIE 4.5 Através da Plataforma Baidu (Teste Gratuito)
Acesse o ERNIE 4.5 Localmente
Acesse o ERNIE 4.5 a partir de uma Aplicação Python
Perguntas Frequentes

O ERNIE 4.5 é a família de modelos avançados de IA da Baidu para processamento multimodal e de texto poderoso. Com opções tanto para implantação em larga escala quanto leve, o ERNIE 4.5 oferece desempenho eficiente e acesso econômico para desenvolvedores e empresas. Seja trabalhando com texto, imagens ou ambos, o ERNIE 4.5 pode ser acessado facilmente por meio de interfaces web, APIs e plataformas em nuvem — sem necessidade de configuração complexa.

Introdução Simples ao ERNIE 4.5

O ERNIE 4.5 é uma família de modelos avançados de IA desenvolvidos pela Baidu, focada em processamento multimodal e baseado em texto eficiente. Esses modelos utilizam arquiteturas Mixture of Experts (MoE) para variantes maiores e arquiteturas densas para as menores. Eles suportam modalidades de texto e visão, com opções para versões pré-treinadas (PT) e base. Abaixo está uma tabela das principais variantes do modelo e um diagrama destacando as inovações do ERNIE no fluxo de treinamento de IA.

Modelo	Base	Ativos	Tipo	Modalidade	Treino
ERNIE 4.5 VL 424B A47B	424B	47B	MoE	T+V	PT
ERNIE 4.5 VL 424B A47B Base	424B	47B	MoE	T+V	Base
ERNIE 4.5 VL 28B A3B	28B	3B	MoE	T+V	PT
ERNIE 4.5 VL 28B A3B Base	28B	3B	MoE	T+V	Base
ERNIE 4.5 VL 28B A3B Thinking	28B	3B	MoE	T+V	PT
ERNIE 4.5 300B A47B	300B	47B	MoE	Texto	PT
ERNIE 4.5 300B A47B Base	300B	47B	MoE	Texto	Base
ERNIE 4.5 21B A3B	21B	3B	MoE	Texto	PT
ERNIE 4.5 21B A3B Base	21B	3B	MoE	Texto	Base
ERNIE 4.5 21B A3B Thinking	21B	3B	MoE	Texto	PT
ERNIE 4.5 0.3B	0.3B	–	Denso	Texto	PT
ERNIE 4.5 0.3B Base	0.3B	–	Denso	Texto	Base

Fluxo de Treinamento de IA: Inovações do ERNIE em Destaque

1. Pré-treinamento MoE Heterogêneo Multimodal

Pré-treinamento conjunto de texto e visão com estrutura MoE heterogênea, roteamento isolado por modalidade e perda multimodal balanceada.

2. Infraestrutura de Escalabilidade Eficiente

Paralelismo híbrido, balanceamento de carga hierárquico, paralelismo de especialistas, escalonamento otimizado de memória e quantização sem perdas para alta taxa de transferência e inferência eficiente.

3. Pós-treinamento Específico por Modalidade

Ajuste fino para tarefas de texto ou visão, suportando SFT, DPO e UPO para atender às diversas necessidades de aplicações do mundo real.

Comparação de Desempenho: ERNIE 4.5 vs. GPT-4o

O ERNIE 4.5 oferece desempenho superior e excepcional eficiência de custos em comparação com o GPT-4o, tornando-se uma escolha altamente competitiva para implantações de IA em larga escala. Este é o preço na Novita AI!

ERNIE 4.5 VL 424B A47B
- $0.336 por 1M tokens de entrada
- $1 por 1M tokens de saída
ERNIE 4.5 300B A47
- $0.224 por 1M tokens de entrada
- $0.88 por 1M tokens de saída
ERNIE 4.5 21B A3B / ERNIE-4.5-21B-A3B-Thinking
- $0.056 por 1M tokens de entrada
- $0.224 por 1M tokens de saída
ERNIE 4.5 VL 28B A3B
- $0.112 por 1M tokens de entrada
- $0.448 por 1M tokens de saída
ERNIE-4.5-VL-28B-A3B-Thinking
- $0.39 por 1M tokens de entrada
- $0.39 por 1M tokens de saída

Fonte: Internet

Acesse o ERNIE 4.5 Através da Plataforma Baidu (Teste Gratuito)

Você pode experimentá-lo diretamente através da interface web da plataforma Baidu, sem necessidade de instalação. Basta visitar o site e iniciar seu teste gratuito instantaneamente.

Alternativamente, você pode usar o Novita API Playground para experimentar o ERNIE 4.5 em um ambiente amigável para desenvolvedores.

Experimente a Novita AI Hoje!

Acesse o ERNIE 4.5 Localmente

Quais são os requisitos de sistema para usar o Ernie 4.5?

Precisão FP16

Modelo	Parâmetros (Ativos)	VRAM Necessária	GPU(s) Ideal(is)
ERNIE 4.5 VL 424B	424B (47B ativos)	~945 GB	NVIDIA H100 (80GB) × 12
ERNIE 4.5 300B	300B (47B ativos)	~668 GB	NVIDIA H100 (80GB) × 9
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking	28B (3B ativos)	~80 GB	NVIDIA A100/H100 (80GB)
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking	21B (3B ativos)	~48GB	NVIDIA RTX 4090 (24GB)X2
ERNIE 4.5 0.3B	300M	~2.5 GB	NVIDIA RTX 4090 (8GB) / RTX 3060 (12GB)

Precisão INT4

Modelo	Parâmetros (Ativos)	VRAM Necessária	GPU(s) Ideal(is)
ERNIE 4.5 VL 424B	424B (47B ativos)	~237 GB	NVIDIA H100 (80GB) × 3
ERNIE 4.5 300B	300B (47B ativos)	~168 GB	NVIDIA H100 (80GB) × 3
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking	28B (3B ativos)	~17 GB	NVIDIA RTX 4090 (24GB) / A10G (24GB)
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking	21B (3B ativos)	~13 GB	NVIDIA RTX 4080 (16GB) / A10G (24GB)
ERNIE 4.5 0.3B	300M	~1.8 GB	Maioria das GPUs com >4GB VRAM

Com base no ERNIEToolkit oficial e no lançamento de código aberto:

SO: Linux é fortemente recomendado (Ubuntu ou similar).
Framework: PaddlePaddle (versão mais recente) necessário.
- Para inferência/treinamento: use ERNIEKit (baseado no PaddlePaddle).
- A implantação pode ser acelerada com FastDeploy.
Dependências:
- Python 3.8+
- CUDA e cuDNN compatíveis com sua configuração de GPU.
- Para ambiente PyTorch: os modelos também estão disponíveis via transformers com trust_remote_code=True

Se adquirir uma GPU parece muito caro, você pode aproveitar os serviços de GPU em nuvem econômicos e confiáveis da Novita AI. Por exemplo, você pode acessar uma instância 1x H100 SXM 80GB com 80 GB de VRAM por apenas $2.56 por hora, ou escalar para 8 GPUs por $20.48 por hora.

Experimente a Novita AI Hoje!

Acesse o ERNIE 4.5 a partir de uma Aplicação Python

Hugging Face: Use o ERNIE 4.5 em Spaces, pipelines ou com a biblioteca Transformers via endpoints da Novita AI.
Frameworks de Agente e Orquestração: Conecte facilmente a Novita AI a plataformas parceiras como Continue, AnythingLLM, LangChain, Dify e Langflow através de conectores oficiais e guias de integração passo a passo.
API Compatível com OpenAI: Desfrute de migração e integração sem complicações com ferramentas como Cline e Cursor, projetadas para o padrão da API OpenAI.

Você pode obter mais detalhes em Docs

Acesse o ERNIE 4.5 via API

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Model Library (Biblioteca de Modelos).

Experimente o ERNIE 4.5 Agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Passo 3: Inicie Seu Teste Gratuito

Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API. Entrando na página “Settings” (Configurações), você pode copiar a chave de API conforme indicado na imagem.

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico para sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de conclusão de chat para usuários Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "baidu/ernie-4.5-300b-a47b-paddle"
stream = True # ou False
max_tokens = 6000
system_content = "Seja um assistente útil"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Olá!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Acessar o ERNIE 4.5 é flexível e direto — escolha a abordagem que se encaixa no seu fluxo de trabalho, desde testes web instantâneos até integração robusta de API e implantação local. Com desempenho superior e preços eficientes, o ERNIE 4.5 é uma escolha prática para aplicações de IA de próxima geração.

Perguntas Frequentes

O ERNIE 4.5 é realmente melhor do que outros grandes modelos de IA?

Sim, o ERNIE 4.5 obtém pontuações mais altas que o DeepSeek V3 671B na maioria dos benchmarks e é muito competitivo com outros modelos de ponta.

Quais são os requisitos de sistema para executar o ERNIE 4.5 localmente?

Os requisitos variam conforme o tamanho do modelo, mas você precisará de um sistema Linux, Python 3.8+, PaddlePaddle e uma GPU NVIDIA compatível. Opções de GPU em nuvem estão disponíveis se você não tiver hardware local.

Quanta VRAM preciso para executar o ERNIE 4.5?

Executar as maiores versões do ERNIE 4.5 (como 424B ou 300B) requer VRAM muito alta — centenas de GBs e várias GPUs de ponta. Versões menores ou quantizadas precisam de muito menos VRAM.

Novita AI é a plataforma all-in-one em nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece de graça e torne sua visão de IA realidade.