Введение
Добро пожаловать в наше исследование OpenHermes 2.5 — новаторского набора данных, разработанного Teknium. В этом блоге мы рассмотрим особенности, применения и достижения этого передового расширения модели.
Что такое Openhermes 2.5?
Основные сведения об Openhermes 2.5
Разработанный Teknium, Openhermes 2.5 является расширением и улучшением набора данных Open Hermes 1. Он отличается гораздо большим масштабом, большим разнообразием и более высоким качеством, включая более 1 миллиона синтетически сгенерированных образцов инструкций и чатов.

Ключевые особенности Openhermes 2.5
- Это компиляция различных открытых наборов данных и пользовательских синтетических датасетов.
- Набор данных интегрирован с Lilac — платформой для курирования и исследования данных, и доступен на HuggingFace для изучения, курирования и поиска по текстовым эмбеддингам.
- Openhermes 2.5 включает вклады из множества источников, таких как Airoboros 2.2, CamelAI Domain Expert Datasets, ChatBot Arena, Collective Cognition и другие, каждый из которых предоставляет уникальный набор данных, обогащающих общий датасет.
- Структура Openhermes 2.5 следует формату sharegpt, представляющему собой список словарей. Каждая запись содержит список «conversations» со словарями для каждого раунда, указывающими роль (например, «system», «human», «gpt») и текстовое значение беседы.

Источники данных OpenHermes 2.5
OpenHermes 2.5 включает данные из широкого круга источников, каждый из которых вносит вклад в полноту и полезность набора данных для обучения LLM. Некоторые заметные источники:
- Airoboros 2.2: датасет от Джона Дурбина.
- CamelAI Domain Expert Datasets: охватывает физику, математику, химию и биологию.
- ChatBot Arena: датасет, специфичный для GPT-4.
- Collective Cognition: датасет от Teknium.
- Glaive Code Assistant: датасет, направленный на улучшение навыков программирования.
- GPTeacher: коллекция модульных датасетов для обучения LLM.
- SlimOrca 550K: датасет, способствующий усилиям по репликации Orca.
Что такое OpenHermes-2.5-Mistral-7B?
Пояснение
- Продолжение OpenHermes 2: OpenHermes 2.5 Mistral 7B — это самая современная доработка Mistral. Она основана на предыдущей модели OpenHermes 2, что указывает на прогресс в её разработке и возможностях.
- Обучение на кодовых датасетах: Значительная часть обучающих данных (по оценкам, 7–14% от общего набора) состоит из инструкций по коду. Это обучение на коде положительно сказалось на производительности модели.
- Обучающие данные: OpenHermes 2.5 обучалась на 1 миллионе записей, в основном сгенерированных GPT-4, а также на других высококачественных данных из различных открытых датасетов в области ИИ. Такое разнообразие обучающих данных, вероятно, способствует широким возможностям модели.
- Фильтрация данных и преобразование формата: К публичным датасетам, использованным для обучения, была применена обширная фильтрация. Все форматы данных были преобразованы в ShareGPT, который затем был дополнительно преобразован axolotl для использования ChatML. Этот процесс стандартизации и преобразования обеспечивает согласованность обучающих данных и может способствовать улучшению производительности модели.
Результаты бенчмарков OpenHermes-2.5-Mistral-7B
- TruthfulQA, AGIEval и GPT4All Suite: Модель показала рост производительности на этих не-кодовых бенчмарках, что позволяет предположить, что обучение на кодовых датасетах хорошо обобщилось на другие области.
- BigBench: Интересно, что хотя результат модели на бенчмарке BigBench снизился, общий чистый прирост производительности на других бенчмарках все ещё значителен, что указывает на улучшение возможностей модели.

- Улучшение показателя Humaneval: Производительность модели на бенчмарке humaneval, который измеряет способность модели выполнять человекоподобные оценки, улучшилась с 43% на Pass 1 у Open Hermes 2 до 50,7% на Pass 1 у OpenHermes 2.5. Это существенное увеличение и отражает повышенную способность модели генерировать более человекоподобные ответы.

Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?
Как разработчики, вы находитесь на переднем крае инноваций, постоянно ищя инструменты, которые могут повысить производительность и создать увлекательный пользовательский опыт. OpenHermes 2.5 Mistral 7B с его расширенными возможностями открывает целый ряд возможностей в различных областях. Давайте рассмотрим некоторые практические применения, которые могут извлечь выгоду из этой современной модели.
ИИ-компаньон чат
Улучшенное взаимодействие с пользователем: Способность OpenHermes 2.5 Mistral 7B к пониманию и генерации естественного языка делает её идеальным кандидатом для разработки чатов с ИИ-компаньонами. Будь то боты службы поддержки, виртуальные ассистенты или интерактивные персонажи в играх, эта модель может обеспечить более нюансированные и человекоподобные разговоры.
Персонализация: Используя способность модели понимать контекст и генерировать релевантные ответы, разработчики могут создавать персонализированные чат-опыты, которые адаптируются к индивидуальным предпочтениям и потребностям пользователя.
Многоязычная поддержка: При дополнительном обучении и адаптации OpenHermes 2.5 Mistral 7B может быть расширена для поддержки нескольких языков, открывая глобальные рынки для приложений с ИИ-компаньонами.
Генерация романов с помощью ИИ
Креативное письмо: Способность модели генерировать человекоподобный текст делает её мощным инструментом для генерации романов с помощью ИИ. Разработчики могут использовать эту возможность для создания уникальных сюжетных линий, персонажей и диалогов для книг, сценариев или интерактивных повествований.
Автоматизированное создание контента: Для создателей контента и цифровых маркетологов OpenHermes 2.5 Mistral 7B может автоматизировать генерацию увлекательных блог-постов, статей или контента для социальных сетей, экономя время и ресурсы, сохраняя при этом высокий уровень качества.
Интерактивное повествование: В игровой индустрии эта модель может стать основой интерактивных повествовательных опытов, где сюжет адаптируется в реальном времени к выбору игрока, создавая глубокую иммерсивную среду.
Суммаризация с помощью ИИ
Эффективная обработка информации: Возможности суммаризации OpenHermes 2.5 Mistral 7B неоценимы для обработки больших объёмов текста и извлечения ключевых моментов. Это может применяться в агрегации новостей, исследованиях или бизнес-аналитике для получения кратких резюме длинных документов.
Анализ данных: В области анализа данных и отчётности эта модель может синтезировать инсайты из сложных наборов данных и представлять их в легко усваиваемом формате, помогая процессам принятия решений.
Образовательные инструменты: Для образовательных приложений суммаризация на основе ИИ может помочь студентам и исследователям, предоставляя резюме академических статей, книг или конспектов лекций, способствуя более быстрому и эффективному обучению.
Как разработчики, вы, вероятно, заинтересуетесь, как интегрировать OpenHermes 2.5 Mistral 7B в свои проекты. Следующий раздел предлагает вам два способа получить доступ к OpenHermes 2.5 Mistral 7B.
Как получить доступ к OpenHermes-2.5-Mistral-7B?
Как загрузить и использовать эту модель в text-generation-webui?
- Обновитесь до последней версии: Убедитесь, что вы используете самую актуальную версию text-generation-webui.
- Используйте установщики в один клик: Настоятельно рекомендуется использовать установщики в один клик для text-generation-webui, если вы не уверены в ручной установке.
- Перейдите на вкладку Model: Нажмите на вкладку «Model» в интерфейсе.
- Введите детали модели: В разделе загрузки пользовательской модели или LoRA введите
TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ. Если вы хотите загрузить с определённой ветки, напримерTheBloke/OpenHermes-2.5-Mistral-7B-GPTQ:gptq-4bit-32g-actorder_True, обратитесь к списку веток выше для каждой опции. - Начните загрузку: Нажмите кнопку «Download», чтобы начать процесс загрузки модели. После завершения вы увидите статус «Done».
- Обновите список моделей: Нажмите на значок обновления в верхнем левом углу, чтобы обновить список доступных моделей.
- Выберите загруженную модель: Из выпадающего меню Model выберите только что загруженную модель:
OpenHermes-2.5-Mistral-7B-GPTQ. - Загрузите модель: Модель загрузится автоматически и будет готова к использованию.
- Пользовательские настройки (если необходимо): Если у вас есть собственные настройки, примените их, затем нажмите «Save settings for this model», а затем «Reload the Model» в правом верхнем углу.
- Примечание по параметрам GPTQ: Вам больше не нужно вручную устанавливать параметры GPTQ. Теперь они автоматически настраиваются из файла
quantize_config.json. - Начните генерацию текста: Когда всё настроено, нажмите на вкладку «Text Generation», введите ваш запрос и начинайте генерировать текст!
Все необходимые файлы можно найти у TheBloke на Hugging Face. Следуя этим шагам, вы сможете легко загрузить и использовать модель OpenHermes-2.5-Mistral-7B-GPTQ в text-generation-webui.
Как использовать OpenHermes-2.5-Mistral-7B на Novita AI?
Если вы считаете хлопотным загружать и использовать OpenHermes-2.5-Mistral-7B в text-generation-webui, вы можете получить доступ к ней через LLM API Novita AI, который оборудован OpenHermes-2.5-Mistral-7B и другими новейшими мощными моделями, такими как Llama 3 8B instruct, Llama 3 70B instruct и MythoMax-L2–13B:

Всего несколькими строками кода вы можете совершить API-вызов и использовать возможности OpenHermes-2.5-Mistral-7B и других мощных моделей:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Получите ключ API Novita AI, обратившись к: https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
api_key="<ВАШ Ключ API Novita AI>",
)
model = "teknium/openhermes-2.5-mistral-7b"
completion_res = client.completions.create(
model=model,
prompt="A chat between a curious user and an artificial intelligence assistant".
stream = True, # или False
max_tokens = 512,
)
Заключение
В заключение, OpenHermes 2.5 становится ключевым достижением в технологии ИИ, сочетая обширное курирование данных с современным обучением модели. От своего создания Teknium до интеграции с такими платформами, как Lilac, и доступности на HuggingFace, этот набор данных представляет собой скачок вперёд в обработке естественного языка.
В этом блоге мы исследовали многогранные применения OpenHermes 2.5. Будь то улучшение взаимодействия с пользователями через чаты с ИИ-компаньонами, стимулирование креативности в генерации романов с помощью ИИ или обеспечение эффективной суммаризации данных, эта модель даёт разработчикам возможность инновировать в различных областях.
Novita AI — это облачная платформа «всё в одном», которая реализует ваши амбиции в области ИИ. Благодаря бесшовно интегрированным API, бессерверным вычислениям и ускорению GPU, мы предоставляем экономически эффективные инструменты, необходимые для быстрого создания и масштабирования вашего бизнеса на основе ИИ. Устраните проблемы с инфраструктурой и начните бесплатно — Novita AI воплощает ваши мечты об ИИ в реальность.
