介紹 Openhermes 2.5:理解神使的力量

介紹 Openhermes 2.5:理解神使的力量

介紹

歡迎來到我們對 OpenHermes 2.5 的探索,這是由 Teknium 開發的開創性資料集。這篇部落格深入探討了這個先進模型擴充的功能、應用與進展。

什麼是 Openhermes 2.5?

Openhermes 2.5 的基本背景

Openhermes 2.5 由 Teknium 開發,是 Open Hermes 1 資料集的擴充與改良。其特點在於規模更大、多樣性更高、品質更優,共彙編了超過 100 萬個合成生成的指令與聊天樣本。

Openhermes 2.5 的主要特色

  • 它彙編了多個開源資料集與自訂建立的合成資料集。
  • 該資料集已整合 Lilac(一個資料策展與探索平台),並可在 HuggingFace 上進行探索、策展與文字嵌入搜尋。
  • Openhermes 2.5 包含來自多個來源的貢獻,例如 Airoboros 2.2、CamelAI Domain Expert Datasets、ChatBot Arena、Collective Cognition 等,每個來源都提供了獨特的資料集,豐富了整體資料集。
  • Openhermes 2.5 的結構遵循 sharegpt 格式,即字典清單。每個條目都包含一個“conversations”列表,其中每個對話輪次都是一個字典,標示角色(例如“system”、“human”、“gpt”)以及對話的文字值。

OpenHermes 2.5 的資料集來源

OpenHermes 2.5 整合了來自廣泛來源的資料,每個來源都為資料集的全面性與在訓練 LLM 中的實用性做出了貢獻。一些值得注意的來源包括:

  • Airoboros 2.2:由 Jon Durbin 創建的資料集。
  • CamelAI Domain Expert Datasets:涵蓋物理、數學、化學與生物學。
  • ChatBot Arena:專屬於 GPT-4 的資料集。
  • Collective Cognition:由 Teknium 創建的資料集。
  • Glaive Code Assistant:旨在提升編碼技能的資料集。
  • GPTeacher:用於訓練 LLM 的模組化資料集集合。
  • SlimOrca 550K:有助於 Orca 複製工作的資料集。

什麼是 OpenHermes-2.5-Mistral-7B?

解釋

  • OpenHermes 2 的延續: OpenHermes 2.5 Mistral 7B 是一種先進的 Mistral 微調模型。它建立在先前的 OpenHermes 2 模型之上,顯示了其開發與能力的進步。
  • 在程式碼資料集上訓練: 訓練資料中很大一部分(約佔總資料集的 7–14%)是程式碼指令。這種程式碼訓練對模型的效能產生了正面影響。
  • 訓練資料: OpenHermes 2.5 在 100 萬筆條目上進行訓練,這些條目主要由 GPT-4 生成,以及來自 AI 領域各種開放資料集的其他高品質資料。這種多樣化的訓練資料可能有助於模型的廣泛能力。
  • 資料過濾與格式轉換: 對用於訓練的公開資料集進行了廣泛的過濾。所有資料格式都轉換為 ShareGPT,然後由 axolotl 進一步轉換為 ChatML。這種標準化與轉換過程確保了訓練資料的一致性,並可能有助於模型效能的提升。

OpenHermes-2.5-Mistral-7B 的基準測試表現

  • TruthfulQA、AGIEval 與 GPT4All Suite: 模型在這些非程式碼基準測試上的表現有所提升,表明程式碼資料集的訓練已良好地泛化到其他領域。
  • BigBench: 有趣的是,雖然模型在 BigBench 基準測試上的分數有所下降,但其他基準測試的整體淨增益仍然顯著,顯示模型能力有所提升。

  • Humaneval 分數提升: 模型在 humaneval 基準測試(衡量模型執行類人評估的能力)上的表現,從 Open Hermes 2 的 Pass 1 為 43% 提升到 OpenHermes 2.5 的 Pass 1 為 50.7%。這是一個顯著的增長,反映了模型生成更類人回應能力的增強。

OpenHermes-2.5-Mistral-7B 在業界有哪些實際應用?

作為開發者,您處於創新前沿,不斷尋找能夠提升生產力並創造引人入勝用戶體驗的工具。OpenHermes 2.5 Mistral 7B 憑藉其先進能力,在各個領域開啟了無限可能。讓我們探討一些可以受益於這個先進模型的實際應用。

AI 伴侶聊天

增強的用戶互動: OpenHermes 2.5 Mistral 7B 在自然語言理解與生成方面的熟練度,使其成為開發 AI 伴侶聊天的理想選擇。無論是客服機器人、虛擬助手,還是遊戲中的互動角色,該模型都能提供更細膩、更類人的對話。

個人化: 透過利用模型理解上下文並生成相關回應的能力,開發者可以創建適應個人用戶偏好與需求的個人化聊天體驗。

多語言支援: 透過進一步訓練與適應,OpenHermes 2.5 Mistral 7B 可以擴展支援多種語言,為 AI 伴侶應用開啟全球市場。

AI 小說生成

創意寫作: 該模型在生成類人文字方面的優勢,使其成為 AI 小說生成的強大工具。開發者可以利用此功能為書籍、劇本或互動敘事創建獨特的情節、角色和對話。

自動化內容創作: 對於內容創作者和數位行銷人員,OpenHermes 2.5 Mistral 7B 可以自動生成引人入勝的部落格文章、社交媒體內容,節省時間與資源,同時保持高品質。

互動式敘事: 在遊戲產業中,該模型可以成為互動式敘事體驗的基礎,敘事會根據玩家的選擇即時調整,創造深度沉浸的環境。

AI 摘要

高效資訊處理: OpenHermes 2.5 Mistral 7B 的摘要能力對於處理大量文字並提取要點至關重要。這可應用於新聞彙總、研究或商業智慧,提供長篇文件的簡潔摘要。

資料分析: 在資料分析與報告領域,該模型可以綜合複雜資料集的洞見,並以易於理解的形式呈現,協助決策過程。

教育工具: 對於教育應用,AI 驅動的摘要可以幫助學生和研究人員,提供學術論文、書籍或課堂筆記的摘要,促進更快速、更有效的學習。

作為開發者,您可能對如何將 OpenHermes 2.5 Mistral 7B 整合到您的專案中感興趣。下一節將為您提供兩種存取 OpenHermes 2.5 Mistral 7B 的方式。

如何取得 OpenHermes-2.5-Mistral-7B?

如何在 text-generation-webui 中下載並使用此模型?

  1. 更新至最新版本: 確保您使用最新版本的 text-generation-webui
  2. 使用一鍵安裝程式: 強烈建議使用 text-generation-webui 的一鍵安裝程式,除非您有信心進行手動安裝。
  3. 導航至模型標籤頁: 點擊介面中的“Model”標籤。
  4. 輸入模型詳細資訊: 在下載自訂模型或 LoRA 的部分,輸入 TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ。如果您想從特定分支下載,例如 TheBloke/OpenHermes-2.5-Mistral-7B-GPTQ:gptq-4bit-32g-actorder_True,請參閱上方每個選項的分支列表。
  5. 開始下載: 點擊“Download”按鈕開始模型下載程序。完成後,您會看到狀態變更為“Done”。
  6. 重新整理模型列表: 點擊左上角的重新整理圖示,更新可用模型列表。
  7. 選擇已下載的模型: 從模型下拉選單中,選擇您剛剛下載的模型:OpenHermes-2.5-Mistral-7B-GPTQ
  8. 載入模型: 模型會自動載入並準備使用。
  9. 自訂設定(如有必要): 如果您有要套用的自訂設定,請進行配置,然後點擊“Save settings for this model”,接著點擊右上角的“Reload the Model”。
  10. 關於 GPTQ 參數的注意事項: 您不再需要手動設定 GPTQ 參數。它們現在會自動從 quantize_config.json 檔案中配置。
  11. 開始生成文字: 設定完成後,點擊“Text Generation”標籤,輸入提示詞,然後開始生成文字!

您可以從 Hugging Face 上的 TheBloke 找到所有需要的檔案。遵循這些步驟,您可以輕鬆地在 text-generation-webui 中下載並使用 OpenHermes-2.5-Mistral-7B-GPTQ 模型。

如何在 Novita AI 上使用 OpenHermes-2.5-Mistral-7B?

如果您覺得在 text-generation-webui 中下載和使用 OpenHermes-2.5-Mistral-7B 很麻煩,您可以透過申請 Novita AI LLM API 來存取它,該 API 配備了 OpenHermes-2.5-Mistral-7B 以及其他最新的強大模型,例如 Llama 3 8B instruct、Llama 3 70B instruct 和 MythoMax-L2–13B:

只需幾行程式碼,您就可以進行 API 呼叫,並利用 OpenHermes-2.5-Mistral-7B 及其他強大模型的力量:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    # Get the Novita AI API Key by referring: https://novita.ai/get-started/Quick_Start.html#_3-create-an-api-key
    api_key="<YOUR Novita AI API Key>",
)
model = "teknium/openhermes-2.5-mistral-7b"
completion_res = client.completions.create(
    model=model,
    prompt="A chat between a curious user and an artificial intelligence assistant".
    stream = True, # or False
    max_tokens = 512,
)

結論

總而言之,OpenHermes 2.5 成為 AI 技術的一項關鍵進展,結合了廣泛的資料策展與先進的模型訓練。從 Teknium 的創立到與 Lilac 等平台的整合,以及在 HuggingFace 上的可用性,該資料集代表了自然語言處理領域的一次飛躍。

在本部落格中,我們探討了 OpenHermes 2.5 的多面向應用。無論是透過 AI 伴侶聊天增強用戶互動、在 AI 小說生成中培養創造力,還是實現高效的資料摘要,該模型都賦予開發者在不同領域創新的能力。

Novita AI 是一個全能的雲端平台,能實現您的 AI 願景。透過無縫整合的 API、無伺服器運算和 GPU 加速,我們提供經濟實惠的工具,讓您快速建置和擴展 AI 驅動的業務。無需擔心基礎設施,立即免費開始 — Novita AI 讓您的 AI 夢想成真。