Qwen3 Embedding 8B теперь доступен на Novita AI: поиск нового уровня

Qwen3 Embedding 8B теперь доступен на Novita AI: поиск нового уровня

Традиционные поисковые системы полагаются в основном на сопоставление ключевых слов, часто упуская истинные намерения или контекст пользовательских запросов. Модели эмбеддингов (embedding) меняют этот процесс, преобразуя запросы и документы в плотные векторы, которые захватывают глубокий семантический смысл. Это обеспечивает высокую релевантность и контекстно-зависимый поиск — даже при отсутствии точного совпадения ключевых слов.

Теперь на Novita AI доступна мощная модель Qwen3 Embedding 8B, которая поддерживает длинные входные данные, многоязычное понимание и настройку с учетом инструкций, устанавливая новый стандарт для приложений поиска, рекомендаций и управления знаниями.

Начать работу с Novita AI сегодня!

Что такое модель эмбеддинга?

Модель эмбеддинга — это метод машинного обучения, который преобразует сложные многомерные данные (слова, изображения, аудио) в низкоразмерные числовые векторы. Эти векторы отражают семантические связи между точками данных, позволяя моделям более эффективно обрабатывать и анализировать данные.

векторный эмбеддинг

Источник: Qdrant

Какие проблемы решают модели эмбеддингов?

Эмбеддинги обеспечивают эффективный семантический поиск, представляя запросы и документы в виде векторов, решая задачу извлечения наиболее релевантных данных для улучшения генерации в системах RAG.

rag

Источник: Блог

1. Поиск и рекомендации в электронной коммерции
Платформы Instacart и Taobao используют поисковые системы на основе эмбеддингов для улучшения поиска товаров и рекомендаций. Понимая семантические отношения между товарами и пользовательскими запросами, эти системы могут предлагать позиции, соответствующие предпочтениям пользователя, даже без использования конкретных ключевых слов.

2. Поиск контента
Медиаплатформы применяют эмбеддинги для рекомендации статей, видео или музыки на основе поведения и предпочтений пользователя. Например, если пользователь читает статью об исследовании космоса, система может предложить связанный контент по астрономии или ракетным технологиям.

3. Корпоративное управление знаниями
Организации используют модели эмбеддингов для семантического поиска во внутренних документах и базах знаний. Это позволяет сотрудникам эффективно находить нужную информацию, даже если их поисковые запросы не совпадают с содержанием документа.

4. Чат-боты поддержки клиентов
Модели эмбеддингов улучшают чат-ботов, позволяя им лучше понимать и отвечать на запросы пользователей. Сопоставляя вопросы пользователей с семантически похожими ответами из базы знаний, чат-боты могут давать точные и контекстно-релевантные ответы.

Оценка моделей эмбеддингов

Эти метрики и категории задач используются для оценки и сравнения производительности моделей эмбеддингов в различных приложениях. Анализируя работу модели в этих областях, исследователи и разработчики могут выбирать наиболее подходящие модели для своих задач.

  • Mean (Task): Средняя производительность модели по всем оцененным задачам, показывающая общую универсальность.
  • Mean (Type): Средняя производительность по различным типам задач или форматам данных (например, предложение-предложение, абзац-абзац).
  • Bitext Mining: Поиск пар предложений на разных языках, являющихся переводами; важно для многоязычных корпусов.
  • Class. (Classification): Присвоение предопределенных меток текстам, например, классификация тональности или темы.
  • Clust. (Clustering): Группировка похожих текстов без меток для обнаружения тем или структур.
  • Inst. Retri. (Instance Retrieval): Извлечение конкретных релевантных документов по запросу, используется в поиске или рекомендациях.
  • Multi. Class. (Multiclass Classification): Классификация входных данных по 3+ категориям, например, темы новостей.
  • Pair. Class. (Pair Classification): Определение отношений между парами текстов, например, дубликаты или перефразирования.
  • Rerank: Переупорядочивание списков кандидатов (например, результатов поиска) для повышения релевантности.
  • Retri. (Retrieval): Извлечение релевантных документов/отрывков из больших корпусов на основе запросов.

Что такое модель эмбеддинга Qwen3?

Модель Размер Слои Длина последовательности Размерность эмбеддинга Поддержка MRL Учёт инструкций
Qwen3 Embedding 0.6B 0.6B 28 32K 1024 Да Да
Qwen3 Embedding 4B 4B 36 32K 2560 Да Да
Qwen3 Embedding 8B 8B 36 32K 4096 Да Да
  • Модели Qwen3 Embedding представлены в трёх размерах: малый (0.6B), средний (4B) и большой (8B).
  • Все модели поддерживают длинные входные последовательности до 32 000 токенов, подходят для обработки длинных документов или кода.
  • Большие модели имеют больше слоёв (36 против 28), бо́льшую размерность эмбеддингов (до 4096), что потенциально позволяет захватывать более богатую семантическую информацию.
  • Все они поддерживают многоязычное обучение представлений (MRL), обеспечивая эффективное создание эмбеддингов для многих языков.
  • Все модели учитывают инструкции, то есть могут реагировать на конкретные инструкции или подсказки, улучшая настройку и производительность на downstream-задачах.

Кроме того, Qwen3 предлагает модель реранжирования (reranking), которая помогает переупорядочивать результаты запроса для предоставления наиболее релевантных ответов.

Ключевые особенности Qwen3 Embedding 8B

ключевые особенности qwen3-8b

Возможности Qwen3 Embedding 8B

бенчмарк моделей эмбеддингов

Вы можете ознакомиться с оценкой моделей эмбеддингов на этой таблице лидеров!

Как получить доступ к Qwen3 Embedding 8B?

Novita AI — это облачная платформа ИИ, которая предоставляет разработчикам простой способ развёртывания моделей ИИ через наш простой API, а также предлагает доступные и надёжные GPU-облака для создания и масштабирования.

Помимо Qwen3 Embedding 8B, Novita AI также предоставляет бесплатный bge-m3 для поддержки развития сообщества с открытым исходным кодом!

Шаг 1: Войдите в систему и откройте Библиотеку моделей

Войдите в свою учётную запись и нажмите кнопку Model Library.

Вход и открытие Библиотеки моделей

Попробовать Qwen3 Embedding 8B сейчас!

Шаг 2: Выберите модель и начните бесплатную пробную версию

Просмотрите доступные опции и выберите модель, подходящую для ваших задач.

список моделей qwen3-embedding-8b

Шаг 3: Получите ваш API-ключ

Для аутентификации в API мы предоставим вам новый API-ключ. Перейдите на страницу “Settings“, где вы можете скопировать API-ключ, как показано на изображении.

получить api-ключ

Шаг 4: Установите API

Установите API с помощью менеджера пакетов, соответствующего вашему языку программирования.

После установки импортируйте необходимые библиотеки в вашу среду разработки. Инициализируйте API с вашим API-ключом, чтобы начать взаимодействие с моделями Novita AI. Это пример использования API завершений чата для пользователей Python.

from openai import OpenAI
import json
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="<Your API Key>",
)
model = "qwen/qwen3-embedding-8b"
def get_embeddings(text, model="qwen/qwen3-embedding-8b", encoding_format="float"):
    response = client.embeddings.create(
        model=model,
        input=text,
        encoding_format=encoding_format
    )
    return response
# Пример использования
text = "The quick brown fox jumped over the lazy dog"
result = get_embeddings(text)
print(json.dumps(result.model_dump(), indent=2))

Серия Qwen3 Embedding предлагает масштабируемые, учитывающие инструкции и многоязычные модели (0.6B, 4B и 8B параметров), которые поддерживают длинные последовательности и демонстрируют лидирующую производительность. Благодаря гибкой настройке и специализированной модели реранжирования, серия Qwen3 Embedding отлично подходит для разнообразных реальных сценариев, требующих эффективного и точного семантического понимания.

Часто задаваемые вопросы

Что такое эмбеддинг?

Эмбеддинг — это метод преобразования входных данных в вектор числовых значений в пространстве меньшей размерности.

Какие проблемы решают модели эмбеддингов?

Они обеспечивают семантический поиск и извлечение информации, повышая релевантность в поисковых системах, рекомендациях, поддержке клиентов и других областях, понимая смысл запросов и документов.

Что такое Qwen3 Embedding Model?

Qwen3-Embedding — это семейство из трёх моделей (0.6B, 4B и 8B параметров), поддерживающих длинные входные данные (до 32K токенов), многоязычное обучение представлений и учёт инструкций для настройки под задачи. Модель 8B возглавляет таблицу лидеров MTEB с результатом 70.58! Вы можете использовать её на Novita AI!

Novita AI — это универсальная облачная платформа, которая поддерживает ваши ИИ-амбиции. Интегрированные API, бессерверные вычисления, GPU-инстансы — экономически эффективные инструменты, которые вам нужны. Устраните инфраструктурные проблемы, начните бесплатно и воплотите ваше ИИ-видение в реальность.

Рекомендуемое чтение