Знакомство с Openhermes 2.5: Понимание силы посланника богов

Содержание

Введение
Что такое Openhermes 2.5?
Что такое OpenHermes-2.5-Mistral-7B?
Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?
Как получить доступ к OpenHermes-2.5-Mistral-7B?
Заключение

Введение

Добро пожаловать в наше исследование OpenHermes 2.5 — новаторского набора данных, разработанного Teknium. В этом блоге мы рассмотрим особенности, применения и достижения этого передового расширения модели.

Что такое Openhermes 2.5?

Основные сведения об Openhermes 2.5

Разработанный Teknium, Openhermes 2.5 является расширением и улучшением набора данных Open Hermes 1. Он отличается гораздо большим масштабом, большим разнообразием и более высоким качеством, включая более 1 миллиона синтетически сгенерированных образцов инструкций и чатов.

Ключевые особенности Openhermes 2.5

Это компиляция различных открытых наборов данных и пользовательских синтетических датасетов.
Набор данных интегрирован с Lilac — платформой для курирования и исследования данных, и доступен на HuggingFace для изучения, курирования и поиска по текстовым эмбеддингам.
Openhermes 2.5 включает вклады из множества источников, таких как Airoboros 2.2, CamelAI Domain Expert Datasets, ChatBot Arena, Collective Cognition и другие, каждый из которых предоставляет уникальный набор данных, обогащающих общий датасет.
Структура Openhermes 2.5 следует формату sharegpt, представляющему собой список словарей. Каждая запись содержит список «conversations» со словарями для каждого раунда, указывающими роль (например, «system», «human», «gpt») и текстовое значение беседы.

Источники данных OpenHermes 2.5

OpenHermes 2.5 включает данные из широкого круга источников, каждый из которых вносит вклад в полноту и полезность набора данных для обучения LLM. Некоторые заметные источники:

Airoboros 2.2: датасет от Джона Дурбина.
CamelAI Domain Expert Datasets: охватывает физику, математику, химию и биологию.
ChatBot Arena: датасет, специфичный для GPT-4.
Collective Cognition: датасет от Teknium.
Glaive Code Assistant: датасет, направленный на улучшение навыков программирования.
GPTeacher: коллекция модульных датасетов для обучения LLM.
SlimOrca 550K: датасет, способствующий усилиям по репликации Orca.

Что такое OpenHermes-2.5-Mistral-7B?

Пояснение

Продолжение OpenHermes 2: OpenHermes 2.5 Mistral 7B — это самая современная доработка Mistral. Она основана на предыдущей модели OpenHermes 2, что указывает на прогресс в её разработке и возможностях.
Обучение на кодовых датасетах: Значительная часть обучающих данных (по оценкам, 7–14% от общего набора) состоит из инструкций по коду. Это обучение на коде положительно сказалось на производительности модели.
Обучающие данные: OpenHermes 2.5 обучалась на 1 миллионе записей, в основном сгенерированных GPT-4, а также на других высококачественных данных из различных открытых датасетов в области ИИ. Такое разнообразие обучающих данных, вероятно, способствует широким возможностям модели.
Фильтрация данных и преобразование формата: К публичным датасетам, использованным для обучения, была применена обширная фильтрация. Все форматы данных были преобразованы в ShareGPT, который затем был дополнительно преобразован axolotl для использования ChatML. Этот процесс стандартизации и преобразования обеспечивает согласованность обучающих данных и может способствовать улучшению производительности модели.

Результаты бенчмарков OpenHermes-2.5-Mistral-7B

TruthfulQA, AGIEval и GPT4All Suite: Модель показала рост производительности на этих не-кодовых бенчмарках, что позволяет предположить, что обучение на кодовых датасетах хорошо обобщилось на другие области.
BigBench: Интересно, что хотя результат модели на бенчмарке BigBench снизился, общий чистый прирост производительности на других бенчмарках все ещё значителен, что указывает на улучшение возможностей модели.

Улучшение показателя Humaneval: Производительность модели на бенчмарке humaneval, который измеряет способность модели выполнять человекоподобные оценки, улучшилась с 43% на Pass 1 у Open Hermes 2 до 50,7% на Pass 1 у OpenHermes 2.5. Это существенное увеличение и отражает повышенную способность модели генерировать более человекоподобные ответы.

Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?

Как разработчики, вы находитесь на переднем крае инноваций, постоянно ищя инструменты, которые могут повысить производительность и создать увлекательный пользовательский опыт. OpenHermes 2.5 Mistral 7B с его расширенными возможностями открывает целый ряд возможностей в различных областях. Давайте рассмотрим некоторые практические применения, которые могут извлечь выгоду из этой современной модели.

ИИ-компаньон чат

Улучшенное взаимодействие с пользователем: Способность OpenHermes 2.5 Mistral 7B к пониманию и генерации естественного языка делает её идеальным кандидатом для разработки чатов с ИИ-компаньонами. Будь то боты службы поддержки, виртуальные ассистенты или интерактивные персонажи в играх, эта модель может обеспечить более нюансированные и человекоподобные разговоры.

Персонализация: Используя способность модели понимать контекст и генерировать релевантные ответы, разработчики могут создавать персонализированные чат-опыты, которые адаптируются к индивидуальным предпочтениям и потребностям пользователя.

Многоязычная поддержка: При дополнительном обучении и адаптации OpenHermes 2.5 Mistral 7B может быть расширена для поддержки нескольких языков, открывая глобальные рынки для приложений с ИИ-компаньонами.

Генерация романов с помощью ИИ

Креативное письмо: Способность модели генерировать человекоподобный текст делает её мощным инструментом для генерации романов с помощью ИИ. Разработчики могут использовать эту возможность для создания уникальных сюжетных линий, персонажей и диалогов для книг, сценариев или интерактивных повествований.

Автоматизированное создание контента: Для создателей контента и цифровых маркетологов OpenHermes 2.5 Mistral 7B может автоматизировать генерацию увлекательных блог-постов, статей или контента для социальных сетей, экономя время и ресурсы, сохраняя при этом высокий уровень качества.

Интерактивное повествование: В игровой индустрии эта модель может стать основой интерактивных повествовательных опытов, где сюжет адаптируется в реальном времени к выбору игрока, создавая глубокую иммерсивную среду.

Суммаризация с помощью ИИ

Эффективная обработка информации: Возможности суммаризации OpenHermes 2.5 Mistral 7B неоценимы для обработки больших объёмов текста и извлечения ключевых моментов. Это может применяться в агрегации новостей, исследованиях или бизнес-аналитике для получения кратких резюме длинных документов.

Анализ данных: В области анализа данных и отчётности эта модель может синтезировать инсайты из сложных наборов данных и представлять их в легко усваиваемом формате, помогая процессам принятия решений.

Образовательные инструменты: Для образовательных приложений суммаризация на основе ИИ может помочь студентам и исследователям, предоставляя резюме академических статей, книг или конспектов лекций, способствуя более быстрому и эффективному обучению.

Как разработчики, вы, вероятно, заинтересуетесь, как интегрировать OpenHermes 2.5 Mistral 7B в свои проекты. Следующий раздел предлагает вам два способа получить доступ к OpenHermes 2.5 Mistral 7B.

Как получить доступ к OpenHermes-2.5-Mistral-7B?

Как загрузить и использовать эту модель в text-generation-webui?

Обновитесь до последней версии: Убедитесь, что вы используете самую актуальную версию text-generation-webui.
Используйте установщики в один клик: Настоятельно рекомендуется использовать установщики в один клик для text-generation-webui, если вы не уверены в ручной установке.
Перейдите на вкладку Model: Нажмите на вкладку «Model» в интерфейсе.
Введите детали модели: В разделе загрузки пользовательской модели или LoRA введите TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ. Если вы хотите загрузить с определённой ветки, например TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ:gptq-4bit-32g-actorder_True, обратитесь к списку веток выше для каждой опции.
Начните загрузку: Нажмите кнопку «Download», чтобы начать процесс загрузки модели. После завершения вы увидите статус «Done».
Обновите список моделей: Нажмите на значок обновления в верхнем левом углу, чтобы обновить список доступных моделей.
Выберите загруженную модель: Из выпадающего меню Model выберите только что загруженную модель: OpenHermes-2.5-Mistral-7B-GPTQ.
Загрузите модель: Модель загрузится автоматически и будет готова к использованию.
Пользовательские настройки (если необходимо): Если у вас есть собственные настройки, примените их, затем нажмите «Save settings for this model», а затем «Reload the Model» в правом верхнем углу.
Примечание по параметрам GPTQ: Вам больше не нужно вручную устанавливать параметры GPTQ. Теперь они автоматически настраиваются из файла quantize_config.json.
Начните генерацию текста: Когда всё настроено, нажмите на вкладку «Text Generation», введите ваш запрос и начинайте генерировать текст!

Все необходимые файлы можно найти у TheBloke на Hugging Face. Следуя этим шагам, вы сможете легко загрузить и использовать модель OpenHermes-2.5-Mistral-7B-GPTQ в text-generation-webui.

Как использовать OpenHermes-2.5-Mistral-7B на Novita AI?

Если вы считаете хлопотным загружать и использовать OpenHermes-2.5-Mistral-7B в text-generation-webui, вы можете получить доступ к ней через LLM API Novita AI, который оборудован OpenHermes-2.5-Mistral-7B и другими новейшими мощными моделями, такими как Llama 3 8B instruct, Llama 3 70B instruct и MythoMax-L2–13B:

Всего несколькими строками кода вы можете совершить API-вызов и использовать возможности OpenHermes-2.5-Mistral-7B и других мощных моделей:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    # Получите ключ API Novita AI, обратившись к: https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
    api_key="<ВАШ Ключ API Novita AI>",
)
model = "teknium/openhermes-2.5-mistral-7b"
completion_res = client.completions.create(
    model=model,
    prompt="A chat between a curious user and an artificial intelligence assistant".
    stream = True, # или False
    max_tokens = 512,
)

Заключение

В заключение, OpenHermes 2.5 становится ключевым достижением в технологии ИИ, сочетая обширное курирование данных с современным обучением модели. От своего создания Teknium до интеграции с такими платформами, как Lilac, и доступности на HuggingFace, этот набор данных представляет собой скачок вперёд в обработке естественного языка.

В этом блоге мы исследовали многогранные применения OpenHermes 2.5. Будь то улучшение взаимодействия с пользователями через чаты с ИИ-компаньонами, стимулирование креативности в генерации романов с помощью ИИ или обеспечение эффективной суммаризации данных, эта модель даёт разработчикам возможность инновировать в различных областях.

Novita AI — это облачная платформа «всё в одном», которая реализует ваши амбиции в области ИИ. Благодаря бесшовно интегрированным API, бессерверным вычислениям и ускорению GPU, мы предоставляем экономически эффективные инструменты, необходимые для быстрого создания и масштабирования вашего бизнеса на основе ИИ. Устраните проблемы с инфраструктурой и начните бесплатно — Novita AI воплощает ваши мечты об ИИ в реальность.

Знакомство с Openhermes 2.5: Понимание силы посланника богов

Введение

Что такое Openhermes 2.5?

Основные сведения об Openhermes 2.5

Ключевые особенности Openhermes 2.5

Источники данных OpenHermes 2.5

Что такое OpenHermes-2.5-Mistral-7B?

Пояснение

Результаты бенчмарков OpenHermes-2.5-Mistral-7B

Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?

ИИ-компаньон чат

Генерация романов с помощью ИИ

Суммаризация с помощью ИИ

Как получить доступ к OpenHermes-2.5-Mistral-7B?

Как загрузить и использовать эту модель в text-generation-webui?

Как использовать OpenHermes-2.5-Mistral-7B на Novita AI?

Заключение

Product

RESOURCES

Partners

Company

Введение

Что такое Openhermes 2.5?

Основные сведения об Openhermes 2.5

Ключевые особенности Openhermes 2.5

Источники данных OpenHermes 2.5

Что такое OpenHermes-2.5-Mistral-7B?

Пояснение

Результаты бенчмарков OpenHermes-2.5-Mistral-7B

Каковы практические применения OpenHermes-2.5-Mistral-7B в индустрии?

ИИ-компаньон чат

Генерация романов с помощью ИИ

Суммаризация с помощью ИИ

Как получить доступ к OpenHermes-2.5-Mistral-7B?

Как загрузить и использовать эту модель в text-generation-webui?

Как использовать OpenHermes-2.5-Mistral-7B на Novita AI?

Заключение

Похожие статьи

Product

RESOURCES

Partners

Company