Como Acessar o ERNIE 4.5: Formas Simples via Web, API e Código

Como Acessar o ERNIE 4.5: Formas Simples via Web, API e Código

O ERNIE 4.5 é a família de modelos avançados de IA da Baidu para processamento multimodal e de texto poderoso. Com opções tanto para implantação em larga escala quanto leve, o ERNIE 4.5 oferece desempenho eficiente e acesso econômico para desenvolvedores e empresas. Seja trabalhando com texto, imagens ou ambos, o ERNIE 4.5 pode ser acessado facilmente por meio de interfaces web, APIs e plataformas em nuvem — sem necessidade de configuração complexa.

Introdução Simples ao ERNIE 4.5

O ERNIE 4.5 é uma família de modelos avançados de IA desenvolvidos pela Baidu, focada em processamento multimodal e baseado em texto eficiente. Esses modelos utilizam arquiteturas Mixture of Experts (MoE) para variantes maiores e arquiteturas densas para as menores. Eles suportam modalidades de texto e visão, com opções para versões pré-treinadas (PT) e base. Abaixo está uma tabela das principais variantes do modelo e um diagrama destacando as inovações do ERNIE no fluxo de treinamento de IA.

Modelo Base Ativos Tipo Modalidade Treino
ERNIE 4.5 VL 424B A47B 424B 47B MoE T+V PT
ERNIE 4.5 VL 424B A47B Base 424B 47B MoE T+V Base
ERNIE 4.5 VL 28B A3B 28B 3B MoE T+V PT
ERNIE 4.5 VL 28B A3B Base 28B 3B MoE T+V Base
ERNIE 4.5 VL 28B A3B Thinking 28B 3B MoE T+V PT
ERNIE 4.5 300B A47B 300B 47B MoE Texto PT
ERNIE 4.5 300B A47B Base 300B 47B MoE Texto Base
ERNIE 4.5 21B A3B 21B 3B MoE Texto PT
ERNIE 4.5 21B A3B Base 21B 3B MoE Texto Base
ERNIE 4.5 21B A3B Thinking 21B 3B MoE Texto PT
ERNIE 4.5 0.3B 0.3B Denso Texto PT
ERNIE 4.5 0.3B Base 0.3B Denso Texto Base

Fluxo de Treinamento de IA: Inovações do ERNIE em Destaque

1. Pré-treinamento MoE Heterogêneo Multimodal

Pré-treinamento conjunto de texto e visão com estrutura MoE heterogênea, roteamento isolado por modalidade e perda multimodal balanceada.

2. Infraestrutura de Escalabilidade Eficiente

Paralelismo híbrido, balanceamento de carga hierárquico, paralelismo de especialistas, escalonamento otimizado de memória e quantização sem perdas para alta taxa de transferência e inferência eficiente.

3. Pós-treinamento Específico por Modalidade

Ajuste fino para tarefas de texto ou visão, suportando SFT, DPO e UPO para atender às diversas necessidades de aplicações do mundo real.

Comparação de Desempenho: ERNIE 4.5 vs. GPT-4o

O ERNIE 4.5 oferece desempenho superior e excepcional eficiência de custos em comparação com o GPT-4o, tornando-se uma escolha altamente competitiva para implantações de IA em larga escala. Este é o preço na Novita AI!

Comparação de Desempenho: ERNIE 4.5 vs. GPT-4o

Fonte: Internet

Acesse o ERNIE 4.5 Através da Plataforma Baidu (Teste Gratuito)

Você pode experimentá-lo diretamente através da interface web da plataforma Baidu, sem necessidade de instalação. Basta visitar o site e iniciar seu teste gratuito instantaneamente.

Acesse Através da Plataforma Baidu (Teste Gratuito)

Alternativamente, você pode usar o Novita API Playground para experimentar o ERNIE 4.5 em um ambiente amigável para desenvolvedores.

inicie um teste gratuito no ernie 4.5

Experimente a Novita AI Hoje!

Acesse o ERNIE 4.5 Localmente

Quais são os requisitos de sistema para usar o Ernie 4.5?

Precisão FP16

Modelo Parâmetros (Ativos) VRAM Necessária GPU(s) Ideal(is)
ERNIE 4.5 VL 424B 424B (47B ativos) ~945 GB NVIDIA H100 (80GB) × 12
ERNIE 4.5 300B 300B (47B ativos) ~668 GB NVIDIA H100 (80GB) × 9
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking 28B (3B ativos) ~80 GB NVIDIA A100/H100 (80GB)
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking 21B (3B ativos) ~48GB NVIDIA RTX 4090 (24GB)X2
ERNIE 4.5 0.3B 300M ~2.5 GB NVIDIA RTX 4090 (8GB) / RTX 3060 (12GB)

Precisão INT4

Modelo Parâmetros (Ativos) VRAM Necessária GPU(s) Ideal(is)
ERNIE 4.5 VL 424B 424B (47B ativos) ~237 GB NVIDIA H100 (80GB) × 3
ERNIE 4.5 300B 300B (47B ativos) ~168 GB NVIDIA H100 (80GB) × 3
ERNIE 4.5 VL 28B / ERNIE 4.5 VL 28B A3B Thinking 28B (3B ativos) ~17 GB NVIDIA RTX 4090 (24GB) / A10G (24GB)
ERNIE 4.5 21B / ERNIE 4.5 21B A3B Thinking 21B (3B ativos) ~13 GB NVIDIA RTX 4080 (16GB) / A10G (24GB)
ERNIE 4.5 0.3B 300M ~1.8 GB Maioria das GPUs com >4GB VRAM

Com base no ERNIEToolkit oficial e no lançamento de código aberto:

  • SO: Linux é fortemente recomendado (Ubuntu ou similar).
  • Framework: PaddlePaddle (versão mais recente) necessário.
    • Para inferência/treinamento: use ERNIEKit (baseado no PaddlePaddle).
    • A implantação pode ser acelerada com FastDeploy.
  • Dependências:
    • Python 3.8+
    • CUDA e cuDNN compatíveis com sua configuração de GPU.
    • Para ambiente PyTorch: os modelos também estão disponíveis via transformers com trust_remote_code=True

Se adquirir uma GPU parece muito caro, você pode aproveitar os serviços de GPU em nuvem econômicos e confiáveis da Novita AI. Por exemplo, você pode acessar uma instância 1x H100 SXM 80GB com 80 GB de VRAM por apenas $2.56 por hora, ou escalar para 8 GPUs por $20.48 por hora.

Experimente a Novita AI Hoje!

Acesse o ERNIE 4.5 a partir de uma Aplicação Python

  • Hugging Face: Use o ERNIE 4.5 em Spaces, pipelines ou com a biblioteca Transformers via endpoints da Novita AI.

  • Frameworks de Agente e Orquestração: Conecte facilmente a Novita AI a plataformas parceiras como Continue, AnythingLLM, LangChain, Dify e Langflow através de conectores oficiais e guias de integração passo a passo.

  • API Compatível com OpenAI: Desfrute de migração e integração sem complicações com ferramentas como Cline e Cursor, projetadas para o padrão da API OpenAI.

Acesse o ERNIE 4.5 a partir de uma Aplicação Python

Você pode obter mais detalhes em Docs

Acesse o ERNIE 4.5 via API

Passo 1: Faça Login e Acesse a Biblioteca de Modelos

Faça login na sua conta e clique no botão Model Library (Biblioteca de Modelos).

Faça Login e Acesse a Biblioteca de Modelos

Experimente o ERNIE 4.5 Agora!

Passo 2: Escolha Seu Modelo

Navegue pelas opções disponíveis e selecione o modelo que atende às suas necessidades.

Escolha Seu Modelo

Passo 3: Inicie Seu Teste Gratuito

Comece seu teste gratuito para explorar as capacidades do modelo selecionado.

inicie um teste gratuito no ernie 4.5

Passo 4: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos uma nova chave de API. Entrando na página “Settings” (Configurações), você pode copiar a chave de API conforme indicado na imagem.

obter chave de api

Passo 5: Instale a API

Instale a API usando o gerenciador de pacotes específico para sua linguagem de programação.

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o Novita AI LLM. Este é um exemplo de uso da API de conclusão de chat para usuários Python.

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "baidu/ernie-4.5-300b-a47b-paddle"
stream = True # ou False
max_tokens = 6000
system_content = "Seja um assistente útil"
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Olá!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Acessar o ERNIE 4.5 é flexível e direto — escolha a abordagem que se encaixa no seu fluxo de trabalho, desde testes web instantâneos até integração robusta de API e implantação local. Com desempenho superior e preços eficientes, o ERNIE 4.5 é uma escolha prática para aplicações de IA de próxima geração.

Perguntas Frequentes

O ERNIE 4.5 é realmente melhor do que outros grandes modelos de IA?

Sim, o ERNIE 4.5 obtém pontuações mais altas que o DeepSeek V3 671B na maioria dos benchmarks e é muito competitivo com outros modelos de ponta.

Quais são os requisitos de sistema para executar o ERNIE 4.5 localmente?

Os requisitos variam conforme o tamanho do modelo, mas você precisará de um sistema Linux, Python 3.8+, PaddlePaddle e uma GPU NVIDIA compatível. Opções de GPU em nuvem estão disponíveis se você não tiver hardware local.

Quanta VRAM preciso para executar o ERNIE 4.5?

Executar as maiores versões do ERNIE 4.5 (como 424B ou 300B) requer VRAM muito alta — centenas de GBs e várias GPUs de ponta. Versões menores ou quantizadas precisam de muito menos VRAM.

Novita AI é a plataforma all-in-one em nuvem que impulsiona suas ambições de IA. APIs integradas, serverless, instância GPU — as ferramentas econômicas que você precisa. Elimine a infraestrutura, comece de graça e torne sua visão de IA realidade.

Leitura Recomendada