bge-reranker-v2-m3 ahora disponible en Novita AI

bge-reranker-v2-m3 ahora disponible en Novita AI

Puntos clave

Modelos de reordenación: Los modelos de reordenación son esenciales para optimizar la calidad de los resultados de búsqueda, reordenando de forma inteligente los documentos candidatos según una puntuación de relevancia precisa, asegurando que los usuarios vean primero la información más pertinente.

BAAI/bge-reranker-v2-m3: El modelo bge-reranker-v2-m3 ofrece capacidades excepcionales de reordenación multilingüe, admite más de 18 idiomas y destaca en el procesamiento de pares consulta-documento para una evaluación precisa de la relevancia. Su precisión y soporte multilingüe lo hacen indispensable para experiencias de búsqueda de alta calidad.

El potente modelo bge-reranker-v2-m3 ya está disponible en Novita AI y ofrece soluciones de reordenación rentables. ¡Comienza tu prueba gratuita en Novita AI!

La reordenación es un pilar de los sistemas de búsqueda modernos, ya que permite que las aplicaciones ofrezcan resultados altamente relevantes mediante un análisis de relevancia sofisticado. Esta guía explora qué son los reordenadores (modelos de reordenación), por qué son cruciales para la calidad de la búsqueda y cómo BAAI/bge-reranker-v2-m3 mejora las capacidades de búsqueda para ofrecer experiencias de usuario superiores.

Comprender los reordenadores

Un reordenador es un modelo de IA especializado diseñado para refinar y reordenar los resultados de búsqueda evaluando la relevancia semántica entre las consultas y los documentos candidatos. A diferencia de los sistemas de recuperación tradicionales que se centran en la velocidad y la exhaustividad, los reordenadores priorizan la precisión calculando puntuaciones de relevancia detalladas para los pares consulta-documento.

En las aplicaciones modernas de IA, los reordenadores desempeñan un papel particularmente crucial en los sistemas RAG (Generación Aumentada por Recuperación), donde la calidad de los documentos recuperados impacta directamente en la respuesta generada final. La etapa de reordenación actúa como un filtro de precisión, asegurando que solo los documentos más relevantes lleguen a la fase de generación de contenido.

Pipeline de RAG con reordenación

Los sistemas modernos de recuperación de información suelen emplear una arquitectura de dos etapas, como se muestra arriba. La primera etapa utiliza métodos de recuperación rápida inicial, como modelos de torre dual, BM25 o bases de datos vectoriales, para filtrar rápidamente los documentos candidatos de grandes colecciones. La segunda etapa emplea reordenadores para realizar un ordenamiento detallado de estos resultados candidatos, centrándose en un juicio preciso de relevancia.

Los reordenadores utilizan una arquitectura de codificador cruzado que procesa la consulta y el documento de forma conjunta, permitiendo una interacción más profunda en comparación con los métodos de recuperación tradicionales. Esta arquitectura permite a los reordenadores identificar asociaciones semánticas complejas, sinónimos y relaciones jerárquicas que la coincidencia basada en palabras clave podría pasar por alto.

Aplicaciones de los reordenadores

Los reordenadores destacan en diversos escenarios de aplicación donde la comprensión semántica y la clasificación precisa son cruciales:

Aplicaciones en dominios críticos

Sistemas de información médica: Recuperación de literatura médica relevante donde la precisión es vital • Recuperación de documentos legales: Búsqueda de jurisprudencia y leyes precisas para profesionales del derecho • Investigación científica: Selección de los estudios más relevantes entre miles de artículos

Sistemas impulsados por IA

Sistemas de preguntas y respuestas: En los sistemas RAG, los reordenadores garantizan que los documentos más relevantes semánticamente se seleccionen como contexto para la generación de respuestas, impactando directamente en la calidad y precisión de la respuesta • Sistemas de recomendación: Ordenación de elementos candidatos según la relevancia para las preferencias del usuario, mejorando la participación y la personalización

Soluciones empresariales

Búsqueda empresarial: Las grandes organizaciones utilizan reordenadores para optimizar la recuperación de documentos en vastas bases de conocimiento, haciendo que el descubrimiento de información sea más eficiente y preciso • Motores de búsqueda: Realizan una clasificación secundaria de los resultados de búsqueda para mejorar la relevancia y la satisfacción del usuario más allá de la coincidencia tradicional de palabras clave

Aplicaciones multiplataforma

Plataformas multilingües: Manejan eficazmente escenarios de recuperación multilenguaje, ofreciendo una calidad de búsqueda consistente en diferentes idiomas

Entendiendo BAAI/bge-reranker-v2-m3

BAAI/bge-reranker-v2-m3 es un reordenador multilingüe ligero desarrollado por la Academia de Inteligencia Artificial de Beijing (BAAI). Como parte de la serie BGE (Beijing General Embedding), este modelo está específicamente optimizado para tareas de reordenación en múltiples idiomas.

Características principales:

  • Diseño ligero: 568 millones de parámetros para una implementación eficiente
  • Soporte multilingüe: Más de 18 idiomas con capacidades multilingües
  • Inferencia rápida: Tiempos de respuesta de milisegundos
  • Integración sencilla: Múltiples API y bibliotecas disponibles

Especificaciones técnicas:

  • Arquitectura: Clasificación de secuencias con codificador cruzado
  • Formato de entrada: [texto de consulta, texto de documento]
  • Longitud máxima: 512 tokens
  • Salida: Puntuaciones de relevancia directa con normalización opcional
  • Aceleración: Soporte fp16/bf16 para inferencia en GPU

Idiomas admitidos: Inglés, chino, japonés, coreano, español, francés, alemán, ruso, árabe, hindi, bengalí, persa, finlandés, indonesio, tailandés, telugu, suajili, yoruba

El modelo se entrena en diversos conjuntos de datos, incluidos bge-m3-data (recuperación multilingüe), datos de Quora (pares pregunta-respuesta) y datos de FEVER (verificación de hechos), lo que garantiza un rendimiento robusto en diversos dominios y casos de uso.

llama-index.

llama-index.

BEIR.

BEIR.
Reordenar los 100 mejores resultados de bge-en-v1.5 large.

Reordenar los 100 mejores resultados de bge-en-v1.5 large.

BEIR.
Reordenar los 100 mejores resultados de e5 mistral 7b instruct.

Reordenar los 100 mejores resultados de e5 mistral 7b instruct.

CMTEB-retrieval.

CMTEB-retrieval.

Reordenar los 100 mejores resultados de bge-zh-v1.5 large.

miracl (multilenguaje).

miracl (multilenguaje).

Reordenar los 100 mejores resultados de bge-m3.

Cómo acceder a BAAI/bge-reranker-v2-m3 en Novita AI

Novita AI es una plataforma cloud de IA que ofrece a los desarrolladores una forma fácil de implementar modelos de IA mediante nuestra API simple, además de proporcionar una nube de GPU asequible y confiable para construir y escalar.

Paso 1: Inicia sesión y accede a la consola de modelos

Inicia sesión en tu cuenta y accede a la consola de modelos.

Consola de modelos de Novita

Paso 2: Elige tu modelo y comienza una prueba gratuita

Explora las opciones disponibles y busca el modelo que se adapte a tus necesidades.

Elige tu modelo

¡Prueba bge-reranker-v2-m3 gratis!

Paso 3: Obtén tu clave API

Para autenticarte con la API, te proporcionaremos una nueva clave API. Entrando a la página de “Configuración”, puedes copiar la clave API como se indica en la imagen.

Obtén tu clave API

Paso 4: Instala la API

Instala la API usando el gestor de paquetes específico para tu lenguaje de programación.

Instala la API

Después de la instalación, importa las bibliotecas necesarias en tu entorno de desarrollo. Inicializa la API con tu clave API para comenzar a interactuar con el servicio de reordenación de Novita AI. Este ejemplo muestra cómo usar la API de reordenación.

curl --request POST \
  --url "https://api.novita.ai/v3/openai/rerank" \
  --header "Authorization: Bearer <Tu Clave API>" \
  --header "Content-Type: application/json" \
  --data @- << 'EOF'
{
  "model": "baai/bge-reranker-v2-m3",
  "query": "¿Quién es Novita?",
  "documents": [
    "Novita AI es una solución todo en uno de cloud de IA que permite a las empresas acceder a APIs de modelos de código abierto, GPUs sin servidor e instancias de GPU bajo demanda. Impulsa la innovación y obtén una ventaja competitiva con el poder de Novita AI.",
    "Accede a la biblioteca de modelos de Novita AI con más de 200 APIs para lenguaje, imagen, audio y video. Simplifica la implementación de IA con soluciones potentes y escalables.",
    "Optimiza tu IA con las instancias de GPU y la nube de GPU sin servidor de Novita. Ahorra hasta un 50%, escala automáticamente y accede a almacenamiento de alta capacidad para implementación global."
  ],
  "top_n": 3
}
EOF
 

Al registrarte, Novita AI te proporciona un crédito de $0.5 para empezar.

Si el crédito gratuito se agota, puedes pagar para seguir usándolo.

Los reordenadores juegan un papel crítico en la recuperación de información y las aplicaciones de IA, permitiendo a los sistemas comprender eficazmente la relevancia semántica y mejorar la precisión de la búsqueda. Modelos avanzados como BAAI/bge-reranker-v2-m3 elevan estas capacidades mediante un rendimiento superior y un amplio soporte de idiomas, convirtiéndolos en herramientas indispensables para impulsar las aplicaciones modernas de IA.

Preguntas frecuentes

¿Cuál es la diferencia entre BGE Reranker Large y BGE Reranker v2 m3?

BGE Reranker Large se basa en xlm-roberta-large y admite chino e inglés, mientras que BGE Reranker v2 m3 se basa en bge-m3 y ofrece potentes capacidades multilingües que admiten múltiples idiomas, más allá del chino y el inglés.

¿BGE-m3 es bueno?

Sí, BGE-m3 se considera uno de los modelos de incrustación multilingüe con mejor rendimiento, con excelentes resultados en varios puntos de referencia. Destaca en la recuperación multilingüe y ofrece un rendimiento sólido en múltiples idiomas.

¿Qué es BGE-m3?

BGE-m3 (BAAI General Embedding Multilingual-3) es un modelo de incrustación multilingüe desarrollado por BAAI que admite más de 100 idiomas. Está diseñado para diversas tareas, incluida la recuperación de texto, la similitud semántica y aplicaciones multilingües.

Novita AI es una plataforma cloud de IA que ofrece a los desarrolladores una forma fácil de implementar modelos de IA mediante nuestra API simple, además de proporcionar una nube de GPU asequible y confiable para construir y escalar.