简介
欢迎来到我们对 OpenHermes 2.5 的探索,这是一个由 Teknium 开发的突破性数据集。本博客深入探讨了这一最先进模型扩展的特性、应用和进步。
什么是 Openhermes 2.5?
Openhermes 2.5 的基本背景
由 Teknium 开发,Openhermes 2.5 是 Open Hermes 1 数据集的扩展和改进版本。其特点是规模更大、多样性更强、质量更高,汇集了超过 100 万条综合生成的指令和聊天样本。

Openhermes 2.5 的主要特性
- 它汇合了各种开源数据集和自定义创建的合成数据集。
- 该数据集已与数据策展与探索平台 Lilac 集成,并可在 HuggingFace 上进行探索、策展和文本嵌入搜索。
- Openhermes 2.5 包含来自多个来源的贡献,例如 Airoboros 2.2、CamelAI 领域专家数据集、ChatBot Arena、Collective Cognition 等,每个来源都提供了独特的数据集,丰富了整体数据。
- Openhermes 2.5 的结构遵循 sharegpt 格式,即一个字典列表。每个条目包含一个 “conversations” 列表,其中每个回合为一个字典,指示角色(例如 “system”、“human”、“gpt”)和对话的文本值。

OpenHermes 2.5 的数据集来源
OpenHermes 2.5 整合了来自广泛来源的数据,每个来源都为数据集的全面性和在训练 LLM 中的实用性做出了贡献。一些值得注意的来源包括:
- Airoboros 2.2:由 Jon Durbin 创建的数据集。
- CamelAI 领域专家数据集:涵盖物理、数学、化学和生物学。
- ChatBot Arena:一个 GPT-4 专用数据集。
- Collective Cognition:由 Teknium 创建的数据集。
- Glaive Code Assistant:旨在提升编程技能的数据集。
- GPTeacher:用于训练 LLM 的模块化数据集集合。
- SlimOrca 550K:为 Orca 复制工作做出贡献的数据集。
什么是 OpenHermes-2.5-Mistral-7B?
说明
- OpenHermes 2 的延续: OpenHermes 2.5 Mistral 7B 是一个最先进的 Mistral 微调模型。它建立在之前的 OpenHermes 2 模型之上,表明其开发和能力在持续进步。
- 代码数据集训练: 训练数据中很大一部分(估计占整个数据集的 7–14%)由代码指令组成。这种代码训练对模型性能产生了积极影响。
- 训练数据: OpenHermes 2.5 在 100 万条数据上进行训练,这些数据主要由 GPT-4 生成,同时还包括来自人工智能领域各个开放数据集的其他高质量数据。这种多样化的训练数据可能有助于提升模型的广泛能力。
- 数据过滤与格式转换: 对用于训练的公共数据集进行了广泛的过滤。所有数据格式都被转换为 ShareGPT,然后由 axolotl 进一步转换为 ChatML。这种标准化和转换过程确保了训练数据的一致性,并可能有助于提升模型性能。
OpenHermes-2.5-Mistral-7B 的基准性能
- TruthfulQA、AGIEval 和 GPT4All 套件: 该模型在非代码基准测试上性能有所提升,表明代码数据集训练已很好地泛化到其他领域。
- BigBench: 有趣的是,虽然模型在 BigBench 基准测试上的分数有所下降,但其他基准测试上的总体净增益仍然显著,表明模型能力有所提升。

- Humaneval 分数提升: 模型在 humaneval 基准测试(衡量模型进行类人评估的能力)上的性能从 Open Hermes 2 的 Pass 1 43% 提升到了 OpenHermes 2.5 的 Pass 1 50.7%。这是一个显著的增长,反映了模型生成更类人化回复的能力增强。

OpenHermes-2.5-Mistral-7B 在行业中有哪些实际应用?
作为开发者,你们处于创新的前沿,不断寻求能够提升生产力并创造引人入胜用户体验的工具。OpenHermes 2.5 Mistral 7B 凭借其先进的能力,在各个领域开启了无限可能。让我们探索一些可以从这一最先进模型中受益的实际应用。
AI 伴侣聊天
增强用户交互: OpenHermes 2.5 Mistral 7B 在自然语言理解和生成方面的熟练度使其成为开发 AI 伴侣聊天的理想选择。无论是用于客服机器人、虚拟助手还是游戏中的交互角色,该模型都能提供更细腻、更人性化的对话。
个性化: 通过利用模型理解上下文并生成相关回复的能力,开发者可以创建适应个人用户偏好和需求的个性化聊天体验。
多语言支持: 通过进一步的训练和适配,OpenHermes 2.5 Mistral 7B 可以扩展以支持多种语言,为 AI 伴侣应用打开全球市场。
AI 小说生成
创意写作: 该模型在生成类人文本方面的优势使其成为 AI 小说生成的有力工具。开发者可以利用这一能力为书籍、剧本或交互式叙事创建独特的情节、角色和对话。
自动内容创作: 对于内容创作者和数字营销人员,OpenHermes 2.5 Mistral 7B 可以自动生成引人入胜的博客文章、文章或社交媒体内容,节省时间和资源,同时保持高质量水平。
交互式叙事: 在游戏行业,该模型可以成为交互式叙事体验的支柱,其中叙事根据玩家的选择实时调整,创造深度沉浸的环境。
AI 摘要
高效信息处理: OpenHermes 2.5 Mistral 7B 的摘要能力在处理大量文本并提取关键点方面非常宝贵。这可以应用于新闻聚合、研究或商业智能,提供冗长文档的简洁摘要。
数据分析: 在数据分析与报告领域,该模型可以从复杂数据集中综合洞察,并以易于理解的形式呈现,辅助决策过程。
教育工具: 对于教育应用,AI 驱动的摘要可以帮助学生和研究人员提供学术论文、书籍或讲课笔记的摘要,促进更快、更有效的学习。
作为开发者,你们可能对如何将 OpenHermes 2.5 Mistral 7B 集成到项目中的具体方法感兴趣。以下部分提供了两种获取 OpenHermes 2.5 Mistral 7B 的方法。
如何获取 OpenHermes-2.5-Mistral-7B?
如何在 text-generation-webui 中下载并使用该模型?
- 更新到最新版本: 确保你使用的是 text-generation-webui 的最新版本。
- 使用一键安装程序: 强烈建议使用 text-generation-webui 的一键安装程序,除非你有信心进行手动安装。
- 导航到模型标签: 在界面中点击 “Model” 标签。
- 输入模型详情: 在下载自定义模型或 LoRA 的部分,输入
TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ。如果你想从特定分支下载,例如TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ:gptq-4bit-32g-actorder_True,请参考上方列出的分支选项。 - 开始下载: 点击 “Download” 按钮开始模型下载过程。完成后,状态将变为 “Done”。
- 刷新模型列表: 点击左上角的刷新图标以更新可用模型列表。
- 选择下载的模型: 从模型下拉菜单中选择你刚刚下载的模型:
OpenHermes-2.5-Mistral-7B-GPTQ。 - 加载模型: 模型将自动加载并准备使用。
- 自定义设置(如果需要): 如果有任何自定义设置要应用,进行配置,然后点击 “Save settings for this model”,接着点击右上角的 “Reload the Model”。
- 关于 GPTQ 参数的说明: 你不再需要手动设置 GPTQ 参数。它们现在已从
quantize_config.json文件自动配置。 - 开始文本生成: 一切设置完成后,点击 “Text Generation” 标签,输入你的提示,即可开始生成文本!
你可以在 Hugging Face 上的 TheBloke 处找到所有所需文件。按照这些步骤,你可以轻松地在 text-generation-webui 中下载并使用 OpenHermes-2.5-Mistral-7B-GPTQ 模型。
如何在 Novita AI 上使用 OpenHermes-2.5-Mistral-7B?
如果你觉得在 text-generation-webui 中下载和使用 OpenHermes-2.5-Mistral-7B 比较麻烦,你可以通过申请 Novita AI LLM API 来获取访问权限。Novita AI LLM API 配备了 OpenHermes-2.5-Mistral-7B 以及其他最新的强大模型,例如 Llama 3 8B instruct、Llama 3 70B instruct 和 MythoMax-L2–13B:

只需几行代码,你就可以进行 API 调用,并利用 OpenHermes-2.5-Mistral-7B 和其他强大模型的能力:
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# 获取 Novita AI API Key 请参考:https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
api_key="<YOUR Novita AI API Key>",
)
model = "teknium/openhermes-2.5-mistral-7b"
completion_res = client.completions.create(
model=model,
prompt="A chat between a curious user and an artificial intelligence assistant".
stream = True, # or False
max_tokens = 512,
)
结论
总之,OpenHermes 2.5 作为 AI 技术的关键进步,融合了广泛的数据策展和最先进的模型训练。从其由 Teknium 创立,到与 Lilac 等平台的集成以及在 HuggingFace 上的可用性,该数据集代表了自然语言处理领域的一次飞跃。
在本博客中,我们探讨了 OpenHermes 2.5 的多方面应用。无论是通过 AI 伴侣聊天增强用户互动、在 AI 小说生成中激发创造力,还是实现高效的数据摘要,该模型都为开发者赋能,使其能够在不同领域进行创新。
Novita AI 是一个一体化的云平台,助力实现您的 AI 抱负。通过无缝集成的 API、无服务器计算和 GPU 加速,我们提供成本效益高的工具,帮助您快速构建和扩展 AI 驱动的业务。消除基础设施难题,免费开始使用 — Novita AI 让您的 AI 梦想成为现实。
