Qwen3 Reranker 8B теперь доступен на Novita AI: повышение точности AI-поиска

Содержание

Что такое модель реранкера?
Что такое модели Qwen 3 Reranker?
Как получить доступ к моделям Qwen 3 Reranker?

Порекомендуйте нас друзьям сегодня, и вы оба получите по $10 на LLM API — вас ждёт до $500 суммарного вознаграждения!

Llama 3.2 1B, Qwen2.5 7B, Qwen 3 (0.6B, 1.7B, 4B), GLM 4 — всё это уже доступно на Novita AI, чтобы ускорить ваши проекты без лишних затрат!

Модели реранкера играют ключевую роль в повышении точности систем AI-поиска, уточняя порядок первоначально извлечённых документов.

Qwen 3 Reranker 8B демонстрирует выдающиеся результаты на бенчмарках для многоязычных задач и задач с кодом. Благодаря простому доступу через API-платформу Novita AI разработчики могут легко интегрировать мощные возможности реранкинга в свои приложения.

Начните работу с Novita AI уже сегодня!

Что такое модель реранкера?

Модель реранкера — это специализированная AI-модель, которая переупорядочивает набор первоначально извлечённых документов или элементов на основе их релевантности конкретному запросу. Обычно после этапа начального поиска (с использованием методов вроде BM25 или эмбеддингового поиска) реранкер более точно оценивает top-k результатов, чтобы наиболее релевантные элементы оказались в приоритете.

Из mongodb

Реранкеры — это модели, которые присваивают оценки релевантности запросу и извлечённым документам. Оценивая документы по релевантности, реранкеры повышают точность поиска, выбирая наиболее релевантное подмножество из первоначально найденных документов.

Какие проблемы решают модели реранкера

Повышение релевантности: они уточняют результаты начального поиска, чтобы лучше соответствовать намерениям пользователя.
Снижение шума: отфильтровывая менее релевантные элементы, они улучшают качество предоставляемой информации.
Улучшение RAG-систем: в пайплайнах RAG реранкеры гарантируют, что для генерации ответов используются самые подходящие документы.

Как оценивать модели реранкеров

MTEB-R: задачи поиска на английском языке из MTEB (Massive Text Embedding Benchmark).
CMTEB-R: задачи поиска на китайском языке из MTEB (фокус на производительность в китайском языке).
MMTEB-R: многоязычные задачи поиска (оценка на нескольких языках).
MLDR: многоязычный поиск длинных документов (тестирует поиск длинных текстов на разных языках).
MTEB-Code: бенчмарки для задач поиска, связанных с кодом (например, поиск кода, его понимание).
FollowIR: оценка того, насколько хорошо модели следуют сложным инструкциям пользователя в поисковых запросах.

Модели реранкеров против эмбеддинговых моделей

Аспект	Эмбеддинговые модели	Модели реранкеров
Функция	Поиск документов на основе векторной схожести	Переупорядочивание найденных документов по релевантности
Эффективность	Высокая (подходит для крупномасштабного поиска)	Более низкая (используется для переупорядочивания меньшего набора)
Точность	Умеренная	Высокая
Сценарий использования	Первичный поиск	Уточнение после поиска

https://youtu.be/1QCwtyQ7Ctc

Что такое модели Qwen 3 Reranker?


Модель	Размер	Слои	Длина последовательности	Учёт инструкций
Qwen3-Reranker-0.6B	28	32K	32K	Да
Qwen3-Reranker-4B	4B	36	32K	Да
Qwen3-Reranker-8B	8B	36	32K	Да

Как работают модели Qwen 3 Reranker?

Из Qwen

Эмбеддинг

Цель: преобразовать текст в вектор, чтобы можно было эффективно искать и сравнивать.

Вход: {Инструкция} + {Запрос} / {Документ} [EOS]
- Модель видит запрос и документ в объединённом формате ввода.
Он проходит через модель Qwen3, и в конце (где находится [EOS]) берётся скрытое состояние (как «вектор-сводка»).
Этот вектор становится эмбеддингом — способом представить текст в числовом виде, чтобы мы могли сравнивать его с другими.

Реранкер

Цель: выдать интеллектуальную оценку, показывающую, насколько документ соответствует запросу.

Вход: {Инструкция} + {Запрос} + {Документ} Ассистент:
- Это более детальный вход — Qwen3 видит и запрос, и документ вместе, как будто читает их рядом.
Модель использует кросс-энкодерную архитектуру, где глубоко сравнивает два текста.
Затем LM-голова (Language Model head) выдаёт оценку (например, вероятность «да»).
- Эта оценка говорит нам: «Насколько этот документ релевантен запросу?»

Бенчмарк моделей Qwen 3 Reranker

Модель	Парам.	MTEB-R	CMTEB-R	MMTEB-R	MLDR	MTEB-Code	FollowIR
Jina-multilingual-reranker-v2-base	0.3B	58.22	63.37	63.73	39.66	58.98	-0.68
gte-multilingual-reranker-base	0.3B	59.51	74.08	59.44	66.33	54.18	-1.64
BGE-reranker-v2-m3	0.6B	57.03	72.16	58.36	59.51	41.38	-0.01
Qwen3-Reranker-0.6B	0.6B	65.80	71.31	66.36	67.28	73.42	5.41
Qwen3-Reranker-4B	4B	69.76	75.94	72.74	69.97	81.20	14.84
Qwen3-Reranker-8B	8B	69.02	77.45	72.94	70.19	81.22	8.05

Вы можете ознакомиться с оценкой эмбеддинговых моделей на этой таблице лидеров!

Как получить доступ к моделям Qwen 3 Reranker?

Novita AI — это облачная AI-платформа, которая предоставляет разработчикам простой способ развёртывания AI-моделей через наш простой API, а также доступный и надёжный GPU-облако для создания и масштабирования приложений.

Помимо Qwen 3 Reranker 8B и Embedding 8B, Novita AI также предоставляет бесплатный bge-m3 для поддержки развития сообщества с открытым исходным кодом!

Шаг 1: Войдите в систему и откройте Библиотеку моделей

Войдите в свою учётную запись и нажмите кнопку Библиотека моделей.

Попробуйте Qwen 3 Reranker 8B сейчас!

Шаг 2: Выберите модель и начните бесплатный пробный период

Просмотрите доступные варианты и выберите модель, которая подходит вашим задачам.

Шаг 3: Получите свой API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдя на страницу «Настройки», вы можете скопировать API-ключ, как показано на изображении.

Шаг 4: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с моделями Novita AI. Это пример использования API для чат-дополнений для пользователей Python.

from openai import OpenAI

base_url = "https://api.novita.ai/v3/openai"
api_key = "<Your API Key>"
model = "qwen/qwen3-reranker-8b"

client = OpenAI(
    base_url=base_url,
    api_key=api_key,
)

stream = True # or False
max_tokens = 1000

response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    extra_body={
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)

Поскольку AI-приложения требуют всё более точного понимания намерений пользователя, модели реранкера становятся незаменимыми инструментами для обеспечения более интеллектуальных результатов поиска. Выступая в качестве второго слоя интеллекта после первоначального поиска, реранкеры уточняют ранжирование документов с помощью более глубокого контекстного анализа. Серия Qwen 3 Reranker устанавливает новый стандарт в этой области, предлагая впечатляющую производительность в различных языках, длинных документах и даже задачах поиска кода. Благодаря простому развёртыванию через Novita AI разработчики могут использовать эти передовые модели без тяжёлой инфраструктуры — что делает высокоточный поиск более доступным, чем когда-либо.

Часто задаваемые вопросы

Что такое модель реранкера?

Реранкер переупорядочивает список извлечённых документов, оценивая их релевантность запросу, тем самым повышая точность в системах AI-поиска.

Чем реранкер отличается от эмбеддинговой модели?

Эмбеддинговая модель: преобразует каждый текст в вектор и сравнивает их с помощью меры схожести.
Модель реранкера: читает запрос и документ вместе и выдаёт интеллектуальную оценку релевантности.

Какова производительность Qwen 3 Reranker?

Qwen3-Reranker-8B достигает лучших показателей:
MTEB-R: 69.02,
CMTEB-R: 77.45,
MTEB-Code: 81.22
Он превосходит популярные модели, такие как BGE и GTE, во многих категориях.

Novita AI — это универсальная облачная платформа, которая расширяет ваши AI-амбиции. Интегрированные API, бессерверные решения, GPU-инстансы — экономичные инструменты, которые вам нужны. Устраните инфраструктуру, начните бесплатно и воплотите своё AI-видение в реальность.

Qwen3 Reranker 8B теперь доступен на Novita AI: повышение точности AI-поиска