Databricks Dolly:一个免费、强大、开源的大型语言模型,专为企业打造

Databricks Dolly:一个免费、强大、开源的大型语言模型,专为企业打造

引言

人工智能领域正经历着快速扩张和多元化发展,各行业需求不断增长。Databricks Dolly 已成为大型语言模型(LLM)领域的重要参与者,为 ChatGPT 和 Google Bard 等成熟模型提供了替代方案。在评估企业的 LLM 选项时,了解 Dolly 这类模型在市场中的定位至关重要。这将帮助你做出符合基础设施、业务目标和运营需求的明智决策。

AI 技术已发展到更高水平且更易获取,随着技术迅速成熟,其应用和认可度也随之提升。市场正在涌现大量 AI 驱动的产品和服务,从复杂的分析和自动化工具,到 AI 驱动的客户服务和营销解决方案,不一而足。

什么是 Databricks Dolly?

Databricks Dolly 是一款开源大型语言模型,专为自然语言指令遵循而设计,可生成文本回复用于摘要、问答和头脑风暴等任务。与 ChatGPT 等封闭选项不同,Databricks Dolly(正式名称为 Databricks Dolly 2.0)使用来自 Databricks 员工众包的数据集进行了微调。这个 120 亿参数的模型基于超过 5000 名 Databricks 员工在 2023 年 3 月至 4 月间提供的 13000 多个指令遵循行为示例进行训练。

您可以观看下方视频:

Databricks Dolly 2.0 对比 1.0

在宣布 Databricks Dolly 2.0 的博客中,该公司阐述了选择使用开源模型和自定义数据集的原因,并强调组织将能自由构建或定制自己的大型语言模型,“而无需支付 API 访问费用或与外部方共享数据”。

Databricks 强调其微调指令数据集 databricks-dolly-15k 是“首个开源、人工生成的指令数据集,专门用于赋予大型语言模型 ChatGPT 式的互动魅力”。与 2023 年 3 月发布的 Dolly 1.0 不同,Dolly 1.0 包含来自 ChatGPT 的输出,训练模型参数减半,在有限的 50k 响应/配对数据集上微调,且没有商业使用许可;而 2023 年 4 月发布的 Dolly 2.0 基于一个 120 亿参数的开源模型(由 EleutherAI 提供)训练,并且重要的是,由于其众包/人工生成的问答对,它可以用于商业部署。

考虑采用 Databricks Dolly 2.0 的企业可以对其数据集的可靠性放心。Databricks 为其数据和答案集的创建制定了明确指南,确保所有答案都是人工生成的独特回复。

谁应该使用 Databricks Dolly?

Dolly 的独特卖点在于其开源数据集,为希望开发针对特定用例的 AI 解决方案的企业提供了独特优势。以下是 Databricks Dolly 可能特别适用的一些场景:

  1. 受严格数据合规法规约束的企业:Dolly 的开源特性不依赖 API,使高度监管行业的组织能够创建 AI 解决方案,而不会引发通常与 API 依赖工具相关的数据安全或合规问题。
  2. AI 研究人员和开发者:Dolly 提供了一个强大且高度可适应的平台,使研究人员和开发者能够根据需要快速调整模型。这种灵活性为创新和实验带来了更大潜力。
  3. 增强现有问答解决方案:利用 Databricks Dolly 的结构集成现有解决方案中的问答对是一个理想的应用场景。例如,将基于问答的技术支持数据库转换为交互式体验,借助 Dolly 的能力是可行的。

真正开放的大型语言模型

客户一直表示希望拥有自己的模型,以便能开发更高质量、针对其领域特定应用的模型,同时不将敏感数据泄露给第三方。

据信,解决偏见、问责制和 AI 安全等关键问题需要多元化利益相关者社区的参与,而非仅依赖少数大公司。开源数据集和模型能促进评论、研究和创新,营造一个每个人都能从人工智能技术进展中受益的环境。

作为一个技术和研究产物,Dolly 在效果上预计不会处于前沿。然而,Dolly 和开源数据集有望成为许多后续工作的基础,可能催化更强大语言模型的开发。

Databricks Dolly 的使用场景

在他们的官方博客中,介绍了 Databricks Dolly 的一些应用和使用场景:

  1. 开放问答:例如“人们为什么喜欢喜剧电影?”或“法国的首都是什么?”等问题。有些问题没有明确答案,有些则需要借助对世界的广泛理解。
  2. 封闭问答:这类问题只能根据给定的参考文本中的信息来回答。例如,给定一段关于原子的维基百科段落,可以问“原子核中质子与中子的比例是多少?”
  3. 从维基百科提取信息:在此任务中,标注者从维基百科文章中选择一段文字,并识别段落中包含的实体或事实细节,如重量或测量值。
  4. 从维基百科摘要信息:标注者需将维基百科段落压缩成简短摘要。
  5. 头脑风暴:这涉及生成开放式的想法,并提供潜在选项列表。例如“这周末和朋友一起做哪些有趣的事?”
  6. 分类:标注者对类别归属做出判断,例如将列表中的项目分类为动物、矿物或蔬菜,或评估一段短文字的特征,如电影评论的情感倾向。
  7. 创意写作:此类任务包括创作诗歌或撰写情书。

databricks-dolly-15k 中开放 QA 的示例

如何安装 Databricks Dolly

要下载 Dolly 2.0 模型权重,只需访问 Databricks Hugging Face 页面,并访问 databricks-labs 上的 Dolly 仓库以下载 databricks-dolly-15k 数据集

Databricks Dolly LLM 的局限性

虽然 Databricks Dolly LLM 的开源模型具有诸多优势,尤其适用于高度针对性的商业应用,但它并非万能解决方案。与 ChatGPT 等更大、更封闭的模型相比,Dolly 较小的训练集可能导致输出不够精细。语言限制也普遍存在;目前 Dolly 2.0 仅限于用英语提供回复。

部署开源 LLM 还会引发对知识要求方面的担忧。它通常需要深入理解训练和使用 AI 解决方案,以及企业内部环境中大量的计算资源。相比之下,封闭的生成式 AI 模型通常开箱即用,并且能立即与自定义解决方案集成。在商业可行性和资源约束之间权衡,往往决定了模型的选择。

另一方面,使用开源 LLM 时无法保证私人信息的安全。如果你正在寻找安全、可靠且经济高效的封闭式 LLM,你可以选择我们的 LLM:

我们已经发布了 LLM API,可以无缝集成到你的 LLM 中。凭借最具竞争力的价格和可扩展的模型,Novita AI LLM 推理 API 为你的 LLM 提供了令人难以置信的稳定性和低于 2 秒的超低延迟。

我们的 LLM API 还具有角色扮演功能,通过导入你喜欢的角色卡,你可以与他/她畅所欲言。

哪款大型语言模型适合你?

Databricks Dolly LLM 的推出标志着企业级可商用的开源大型语言模型取得了重大飞跃。虽然它可能不适合所有场景,但在企业层面的潜力是巨大的。无论是自定义解决方案开发、增强现有工具,还是开创 AI 新应用,如果你的组织需要开源模型,Databricks Dolly 都值得考虑。

如果你对 Databricks Dolly 2.0 是否适合你的具体情况有疑问,或者需要帮助有效利用 Dolly LLM,请随时联系 Graphable。我们的自定义开发服务旨在帮助你构思并实现符合你独特企业目标的解决方案。

Databricks Dolly 提供了一个多功能、强大且用户友好的平台,满足数据分析、预测建模和自动化需求。它的适用性跨越不同行业和职能,使其在企业环境中工作的专业人士来说价值非凡。随着 AI 的持续进步,Dolly 在简化和丰富数据驱动决策方面的作用将进一步扩大。

结论

总之,Databricks Dolly LLM 为企业级开源大型语言模型带来了重大进步。虽然它可能不适合所有场景,但在特定用例中的定制和创新潜力是巨大的。寻求更高质量模型同时保留数据所有权的组织可能会发现 Databricks Dolly 是一个有吸引力的选项。

然而,权衡取舍至关重要。Databricks Dolly 等开源模型提供了灵活性和社区驱动的创新,但在精细度和语言覆盖方面可能不如封闭模型。对于那些在可靠性、安全性和成本效益之间权衡的组织,封闭式 LLM 提供了一个可行的替代方案。

最终,选择开源还是闭源 LLM 取决于你组织的具体需求、目标和资源。无论你选择 Databricks Dolly 还是其他模型,都必须根据你独特的企业需求做出决策,以有效增强数据驱动的决策。

novita.ai 是一个一站式平台,提供无限创意,让你访问 100 多个 API。从图像生成和语言处理到音频增强和视频操作,按使用量付费,价格实惠,让你从 GPU 维护中解放出来,专注于构建自己的产品。立即免费试用。

推荐阅读

LLM 和 GPT 有什么区别

2024 年 LLM 排行榜预测揭晓

Novita AI LLM 推理引擎:提供最大吞吐量和最便宜的推理