Знакомство с Openhermes 2.5: Понимание силы посланника богов

Знакомство с Openhermes 2.5: Понимание силы посланника богов

Введение

Добро пожаловать в наше исследование OpenHermes 2.5 — новаторского набора данных, разработанного Teknium. В этом блоге мы рассмотрим особенности, применения и достижения этого передового расширения модели.

Что такое Openhermes 2.5?

Основные сведения об Openhermes 2.5

Разработанный Teknium, Openhermes 2.5 является расширением и улучшением набора данных Open Hermes 1. Он отличается гораздо большим масштабом, большим разнообразием и более высоким качеством, включая более 1 миллиона синтетически сгенерированных образцов инструкций и чатов.

Ключевые особенности Openhermes 2.5

  • Это компиляция различных открытых наборов данных и пользовательских синтетических датасетов.
  • Набор данных интегрирован с Lilac — платформой для курирования и исследования данных, и доступен на HuggingFace для изучения, курирования и поиска по текстовым эмбеддингам.
  • Openhermes 2.5 включает вклады из множества источников, таких как Airoboros 2.2, CamelAI Domain Expert Datasets, ChatBot Arena, Collective Cognition и другие, каждый из которых предоставляет уникальный набор данных, обогащающих общий датасет.
  • Структура Openhermes 2.5 следует формату sharegpt, представляющему собой список словарей. Каждая запись содержит список «conversations» со словарями для каждого раунда, указывающими роль (например, «system», «human», «gpt») и текстовое значение беседы.

Источники данных OpenHermes 2.5

OpenHermes 2.5 включает данные из широкого круга источников, каждый из которых вносит вклад в полноту и полезность набора данных для обучения LLM. Некоторые заметные источники:

  • Airoboros 2.2: датасет от Джона Дурбина.
  • CamelAI Domain Expert Datasets: охватывает физику, математику, химию и биологию.
  • ChatBot Arena: датасет, специфичный для GPT-4.
  • Collective Cognition: датасет от Teknium.
  • Glaive Code Assistant: датасет, направленный на улучшение навыков программирования.
  • GPTeacher: коллекция модульных датасетов для обучения LLM.
  • SlimOrca 550K: датасет, способствующий усилиям по репликации Orca.

Что такое OpenHermes-2.5-Mistral-7B?

Пояснение

  • Продолжение OpenHermes 2: OpenHermes 2.5 Mistral 7B — это самая современная доработка Mistral. Она основана на предыдущей модели OpenHermes 2, что указывает на прогресс в её разработке и возможностях.
  • Обучение на кодовых датасетах: Значительная часть обучающих данных (по оценкам, 7–14% от общего набора) состоит из инструкций по коду. Это обучение на коде положительно сказалось на производительности модели.
  • Обучающие данные: OpenHermes 2.5 обучалась на 1 миллионе записей, в основном сгенерированных GPT-4, а также на других высококачественных данных из различных открытых датасетов в области ИИ. Такое разнообразие обучающих данных, вероятно, способствует широким возможностям модели.
  • Фильтрация данных и преобразование формата: К публичным датасетам, использованным для обучения, была применена обширная фильтрация. Все форматы данных были преобразованы в ShareGPT, который затем был дополнительно преобразован axolotl для использования ChatML. Этот процесс стандартизации и преобразования обеспечивает согласованность обучающих данных и может способствовать улучшению производительности модели.

Результаты бенчмарков OpenHermes-2.5-Mistral-7B

  • TruthfulQA, AGIEval и GPT4All Suite: Модель показала рост производительности на этих не-кодовых бенчмарках, что позволяет предположить, что обучение на кодовых датасетах хорошо обобщилось на другие области.
  • BigBench: Интересно, что хотя результат модели на бенчмарке BigBench снизился, общий чистый прирост производительности на других бенчмарках все ещё значителен, что указывает на улучшение возможностей модели.

  • Улучшение показателя Humaneval: Производительность модели на бенчмарке humaneval, который измеряет способность модели выполнять человекоподобные оценки, улучшилась с 43% на Pass 1 у Open Hermes 2 до 50,7% на Pass 1 у OpenHermes 2.5. Это существенное увеличение и отражает повышенную способность модели генерировать более человекоподобные ответы.

Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?

Как разработчики, вы находитесь на переднем крае инноваций, постоянно ищя инструменты, которые могут повысить производительность и создать увлекательный пользовательский опыт. OpenHermes 2.5 Mistral 7B с его расширенными возможностями открывает целый ряд возможностей в различных областях. Давайте рассмотрим некоторые практические применения, которые могут извлечь выгоду из этой современной модели.

ИИ-компаньон чат

Улучшенное взаимодействие с пользователем: Способность OpenHermes 2.5 Mistral 7B к пониманию и генерации естественного языка делает её идеальным кандидатом для разработки чатов с ИИ-компаньонами. Будь то боты службы поддержки, виртуальные ассистенты или интерактивные персонажи в играх, эта модель может обеспечить более нюансированные и человекоподобные разговоры.

Персонализация: Используя способность модели понимать контекст и генерировать релевантные ответы, разработчики могут создавать персонализированные чат-опыты, которые адаптируются к индивидуальным предпочтениям и потребностям пользователя.

Многоязычная поддержка: При дополнительном обучении и адаптации OpenHermes 2.5 Mistral 7B может быть расширена для поддержки нескольких языков, открывая глобальные рынки для приложений с ИИ-компаньонами.

Генерация романов с помощью ИИ

Креативное письмо: Способность модели генерировать человекоподобный текст делает её мощным инструментом для генерации романов с помощью ИИ. Разработчики могут использовать эту возможность для создания уникальных сюжетных линий, персонажей и диалогов для книг, сценариев или интерактивных повествований.

Автоматизированное создание контента: Для создателей контента и цифровых маркетологов OpenHermes 2.5 Mistral 7B может автоматизировать генерацию увлекательных блог-постов, статей или контента для социальных сетей, экономя время и ресурсы, сохраняя при этом высокий уровень качества.

Интерактивное повествование: В игровой индустрии эта модель может стать основой интерактивных повествовательных опытов, где сюжет адаптируется в реальном времени к выбору игрока, создавая глубокую иммерсивную среду.

Суммаризация с помощью ИИ

Эффективная обработка информации: Возможности суммаризации OpenHermes 2.5 Mistral 7B неоценимы для обработки больших объёмов текста и извлечения ключевых моментов. Это может применяться в агрегации новостей, исследованиях или бизнес-аналитике для получения кратких резюме длинных документов.

Анализ данных: В области анализа данных и отчётности эта модель может синтезировать инсайты из сложных наборов данных и представлять их в легко усваиваемом формате, помогая процессам принятия решений.

Образовательные инструменты: Для образовательных приложений суммаризация на основе ИИ может помочь студентам и исследователям, предоставляя резюме академических статей, книг или конспектов лекций, способствуя более быстрому и эффективному обучению.

Как разработчики, вы, вероятно, заинтересуетесь, как интегрировать OpenHermes 2.5 Mistral 7B в свои проекты. Следующий раздел предлагает вам два способа получить доступ к OpenHermes 2.5 Mistral 7B.

Как получить доступ к OpenHermes-2.5-Mistral-7B?

Как загрузить и использовать эту модель в text-generation-webui?

  1. Обновитесь до последней версии: Убедитесь, что вы используете самую актуальную версию text-generation-webui.
  2. Используйте установщики в один клик: Настоятельно рекомендуется использовать установщики в один клик для text-generation-webui, если вы не уверены в ручной установке.
  3. Перейдите на вкладку Model: Нажмите на вкладку «Model» в интерфейсе.
  4. Введите детали модели: В разделе загрузки пользовательской модели или LoRA введите TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ. Если вы хотите загрузить с определённой ветки, например TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ:gptq-4bit-32g-actorder_True, обратитесь к списку веток выше для каждой опции.
  5. Начните загрузку: Нажмите кнопку «Download», чтобы начать процесс загрузки модели. После завершения вы увидите статус «Done».
  6. Обновите список моделей: Нажмите на значок обновления в верхнем левом углу, чтобы обновить список доступных моделей.
  7. Выберите загруженную модель: Из выпадающего меню Model выберите только что загруженную модель: OpenHermes-2.5-Mistral-7B-GPTQ.
  8. Загрузите модель: Модель загрузится автоматически и будет готова к использованию.
  9. Пользовательские настройки (если необходимо): Если у вас есть собственные настройки, примените их, затем нажмите «Save settings for this model», а затем «Reload the Model» в правом верхнем углу.
  10. Примечание по параметрам GPTQ: Вам больше не нужно вручную устанавливать параметры GPTQ. Теперь они автоматически настраиваются из файла quantize_config.json.
  11. Начните генерацию текста: Когда всё настроено, нажмите на вкладку «Text Generation», введите ваш запрос и начинайте генерировать текст!

Все необходимые файлы можно найти у TheBloke на Hugging Face. Следуя этим шагам, вы сможете легко загрузить и использовать модель OpenHermes-2.5-Mistral-7B-GPTQ в text-generation-webui.

Как использовать OpenHermes-2.5-Mistral-7B на Novita AI?

Если вы считаете хлопотным загружать и использовать OpenHermes-2.5-Mistral-7B в text-generation-webui, вы можете получить доступ к ней через LLM API Novita AI, который оборудован OpenHermes-2.5-Mistral-7B и другими новейшими мощными моделями, такими как Llama 3 8B instruct, Llama 3 70B instruct и MythoMax-L2–13B:

Всего несколькими строками кода вы можете совершить API-вызов и использовать возможности OpenHermes-2.5-Mistral-7B и других мощных моделей:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    # Получите ключ API Novita AI, обратившись к: https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
    api_key="<ВАШ Ключ API Novita AI>",
)
model = "teknium/openhermes-2.5-mistral-7b"
completion_res = client.completions.create(
    model=model,
    prompt="A chat between a curious user and an artificial intelligence assistant".
    stream = True, # или False
    max_tokens = 512,
)

Заключение

В заключение, OpenHermes 2.5 становится ключевым достижением в технологии ИИ, сочетая обширное курирование данных с современным обучением модели. От своего создания Teknium до интеграции с такими платформами, как Lilac, и доступности на HuggingFace, этот набор данных представляет собой скачок вперёд в обработке естественного языка.

В этом блоге мы исследовали многогранные применения OpenHermes 2.5. Будь то улучшение взаимодействия с пользователями через чаты с ИИ-компаньонами, стимулирование креативности в генерации романов с помощью ИИ или обеспечение эффективной суммаризации данных, эта модель даёт разработчикам возможность инновировать в различных областях.

Novita AI — это облачная платформа «всё в одном», которая реализует ваши амбиции в области ИИ. Благодаря бесшовно интегрированным API, бессерверным вычислениям и ускорению GPU, мы предоставляем экономически эффективные инструменты, необходимые для быстрого создания и масштабирования вашего бизнеса на основе ИИ. Устраните проблемы с инфраструктурой и начните бесплатно — Novita AI воплощает ваши мечты об ИИ в реальность.