bge-reranker-v2-m3 Agora Disponível na Novita AI

bge-reranker-v2-m3 Agora Disponível na Novita AI

Destaques Principais

Modelos de Reordenação (Reranking): Modelos de reordenação são essenciais para otimizar a qualidade dos resultados de busca, reordenando inteligentemente os documentos candidatos com base em uma pontuação precisa de relevância, garantindo que os usuários vejam as informações mais pertinentes primeiro.

BAAI/bge-reranker-v2-m3: O modelo bge-reranker-v2-m3 oferece capacidades excepcionais de reordenação entre idiomas, suporta mais de 18 idiomas e se destaca no processamento de pares consulta-documento para uma avaliação precisa da relevância. Sua precisão e suporte multilíngue o tornam indispensável para experiências de busca de alta qualidade.

O poderoso modelo bge-reranker-v2-m3 está disponível na Novita AI, oferecendo soluções de reordenação com boa relação custo-benefício. Comece seu teste gratuito na Novita AI!

A reordenação é um pilar dos sistemas de busca modernos, capacitando aplicações a fornecer resultados altamente relevantes por meio de uma análise sofisticada de relevância. Este guia explora o que são rerankers (modelos de reordenação), por que são cruciais para a qualidade da busca e como o BAAI/bge-reranker-v2-m3 se destaca em elevar as capacidades de busca para proporcionar experiências superiores aos usuários.

Entendendo os Rerankers

Um reranker é um modelo de IA especializado projetado para refinar e reordenar os resultados da busca, avaliando a relevância semântica entre consultas e documentos candidatos. Diferente dos sistemas tradicionais de recuperação que focam em velocidade e abrangência, os rerankers priorizam a precisão ao calcular pontuações detalhadas de relevância para pares consulta-documento.

Em aplicações modernas de IA, os rerankers desempenham um papel particularmente crucial nos sistemas de RAG (Geração Aumentada por Recuperação), onde a qualidade dos documentos recuperados impacta diretamente a resposta final gerada. O estágio de reordenação atua como um filtro de precisão, garantindo que apenas os documentos mais relevantes prossigam para a fase de geração de conteúdo.

Pipeline RAG com Reordenação

Os sistemas modernos de recuperação de informação geralmente empregam uma arquitetura de dois estágios, conforme mostrado acima. O primeiro estágio usa métodos iniciais de recuperação rápida, como modelos de torre dupla, BM25 ou bancos de dados vetoriais, para filtrar rapidamente os documentos candidatos de grandes coleções. O segundo estágio emprega rerankers para realizar uma classificação refinada desses resultados candidatos, focando em um julgamento preciso de relevância.

Os rerankers usam uma arquitetura de codificador cruzado que processa consulta e documento em conjunto, permitindo uma modelagem de interação mais profunda em comparação com métodos tradicionais de recuperação. Essa arquitetura permite que os rerankers identifiquem associações semânticas complexas, sinônimos e relações hierárquicas que a correspondência baseada em palavras-chave pode perder.

Aplicações dos Rerankers

Os rerankers se destacam em vários cenários de aplicação onde a compreensão semântica e a classificação precisa são cruciais:

Aplicações em Domínios Críticos

Sistemas de informação médica: Recuperação de literatura médica relevante onde a precisão é vital
Recuperação de documentos jurídicos: Encontrar jurisprudência e estatutos precisos para profissionais do direito
Pesquisa científica: Destacar os estudos mais relevantes entre milhares de artigos

Sistemas Baseados em IA

Sistemas de Perguntas e Respostas: Em sistemas RAG, os rerankers garantem que os documentos mais relevantes semanticamente sejam selecionados como contexto para a geração de respostas, impactando diretamente a qualidade e a precisão das respostas
Sistemas de Recomendação: Classificar itens candidatos por relevância às preferências do usuário, melhorando o engajamento e a personalização

Soluções Empresariais

Busca Empresarial: Grandes organizações usam rerankers para otimizar a recuperação de documentos em vastas bases de conhecimento, tornando a descoberta de informações mais eficiente e precisa
Mecanismos de Busca: Realizar classificação secundária dos resultados da busca para melhorar a relevância e a satisfação do usuário além da correspondência tradicional por palavras-chave

Aplicações Multiplataforma

Plataformas Multilíngues: Lidar eficazmente com cenários de recuperação entre idiomas, fornecendo qualidade de busca consistente em diferentes idiomas

Entendendo o BAAI/bge-reranker-v2-m3

O BAAI/bge-reranker-v2-m3 é um reranker multilíngue leve desenvolvido pela Academia de Inteligência Artificial de Pequim (BAAI). Como parte da série BGE (Beijing General Embedding), este modelo é especificamente otimizado para tarefas de reordenação em vários idiomas.

Principais Características:

  • Design leve: 568M parâmetros para implantação eficiente
  • Suporte multilíngue: Mais de 18 idiomas com capacidades entre idiomas
  • Inferência rápida: Tempos de resposta em nível de milissegundos
  • Fácil integração: Múltiplas APIs e bibliotecas disponíveis

Especificações Técnicas:

  • Arquitetura: Classificação de sequência com codificador cruzado
  • Formato de entrada: [texto da consulta, texto do documento]
  • Comprimento máximo: 512 tokens
  • Saída: Pontuações de relevância diretas com normalização opcional
  • Aceleração: Suporte a fp16/bf16 para inferência em GPU

Idiomas Suportados: Inglês, Chinês, Japonês, Coreano, Espanhol, Francês, Alemão, Russo, Árabe, Hindi, Bengali, Persa, Finlandês, Indonésio, Tailandês, Télugo, Suaíli, Iorubá

O modelo é treinado em diversos conjuntos de dados, incluindo bge-m3-data (recuperação multilíngue), dados de treino do Quora (pares pergunta-resposta) e dados de treino do FEVER (verificação de fatos), garantindo um desempenho robusto em vários domínios e casos de uso.

llama-index.

llama-index.

BEIR.

BEIR.
reordenar os 100 principais resultados do bge-en-v1.5 large.

reordenar os 100 principais resultados do bge-en-v1.5 large.

BEIR.
reordenar os 100 principais resultados do e5 mistral 7b instruct.

reordenar os 100 principais resultados do e5 mistral 7b instruct.

CMTEB-retrieval.

CMTEB-retrieval.

reordenar os 100 principais resultados do bge-zh-v1.5 large.

miracl (multi-idioma).

miracl (multi-idioma).

reordenar os 100 principais resultados do bge-m3.

Como Acessar o BAAI/bge-reranker-v2-m3 na Novita AI

A Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construir e escalar.

Passo 1: Faça Login e Acesse o Console de Modelos

Faça login na sua conta e acesse o console de modelos.

Console de Modelos Novita

Passo 2: Escolha Seu Modelo e Inicie um Teste Gratuito

Navegue pelas opções disponíveis e procure pelo modelo que atende às suas necessidades.

escolha seu modelo

Experimente o bge-reranker-v2-m3 gratuitamente!

Passo 3: Obtenha Sua Chave de API

Para autenticar com a API, forneceremos a você uma nova chave de API. Acesse a página “Configurações” e copie a chave de API conforme indicado na imagem.

obtenha sua chave de API

Passo 4: Instale a API

Instale a API usando o gerenciador de pacotes específico para sua linguagem de programação.

instale a API

Após a instalação, importe as bibliotecas necessárias para o seu ambiente de desenvolvimento. Inicialize a API com sua chave de API para começar a interagir com o serviço de reordenação da Novita AI. Este exemplo demonstra como usar a API de reordenação.

curl --request POST \
  --url "https://api.novita.ai/v3/openai/rerank" \
  --header "Authorization: Bearer <Sua Chave de API>" \
  --header "Content-Type: application/json" \
  --data @- << 'EOF'
{
  "model": "baai/bge-reranker-v2-m3",
  "query": "Quem é a Novita",
  "documents": [
    "A Novita AI é uma solução completa de nuvem de IA que capacita empresas com APIs de modelos de código aberto, GPUs sem servidor e instâncias GPU sob demanda. Impulsione a inovação e ganhe vantagem competitiva com o poder da Novita AI.",
    "Acesse a Biblioteca de Modelos da Novita AI com mais de 200 APIs para linguagem, imagem, áudio e vídeo. Simplifique a implantação de IA com soluções poderosas e escaláveis.",
    "Otimize sua IA com instâncias GPU e nuvem GPU sem servidor da Novita. Economize até 50%, escale automaticamente e acesse armazenamento de alta capacidade para implantação global."
  ],
  "top_n": 3
}
EOF
 

Ao se registrar, a Novita AI fornece um crédito de $0,5 para você começar!

Se os créditos gratuitos acabarem, você pode pagar para continuar usando.

Os rerankers desempenham um papel crítico na recuperação de informações e aplicações de IA, permitindo que os sistemas entendam efetivamente a relevância semântica e melhorem a precisão da busca. Modelos avançados como o BAAI/bge-reranker-v2-m3 elevam essas capacidades por meio de desempenho superior e amplo suporte a idiomas, tornando-os ferramentas indispensáveis para impulsionar aplicações modernas de IA.

Perguntas Frequentes

Qual é a diferença entre o BGE Reranker Large e o BGE Reranker v2 m3?

O BGE Reranker Large é baseado no xlm-roberta-large e suporta chinês e inglês, enquanto o BGE Reranker v2 m3 é baseado no bge-m3 e oferece fortes capacidades multilíngues, suportando vários idiomas além do chinês e inglês.

O BGE-m3 é bom?

Sim, o BGE-m3 é considerado um dos modelos de embedding multilíngue com melhor desempenho, apresentando resultados excelentes em vários benchmarks. Ele se destaca na recuperação entre idiomas e fornece um desempenho robusto em vários idiomas.

O que é BGE-m3?

O BGE-m3 (BAAI General Embedding Multilingual-3) é um modelo de embedding multilíngue desenvolvido pela BAAI que suporta mais de 100 idiomas. Ele é projetado para várias tarefas, incluindo recuperação de texto, similaridade semântica e aplicações entre idiomas.

Novita AI é uma plataforma de nuvem de IA que oferece aos desenvolvedores uma maneira fácil de implantar modelos de IA usando nossa API simples, além de fornecer uma nuvem de GPU acessível e confiável para construir e escalar.