Mixtral of Experts とは、SMoE を使用した Mixtral 8x7B と Mixtral 8x22B を指します。Mixtral of Experts の機能とアプリケーションについて、ブログで詳しく解説します。
主なハイライト
- Mixtral 8x7B と Mixtral 8x22B は、Mistral AI が開発した代表的なオープンソース言語モデルです。
- これらのモデルは Sparse Mixture of Experts(SMoE)アーキテクチャを採用しており、Mixtral 8x22B は 141B のパラメータのうち、アクティブなパラメータはわずか 39B です。
- Mixtral は、コード生成、多言語理解、長いコンテキスト処理など、さまざまなタスクで優れた性能を発揮し、より大規模な言語モデルを凌駕します。
- その卓越したパフォーマンスとオープンソースであることから、Mixtral は高度な AI 機能をアプリケーションに統合したい開発者にとって強力なツールとなっています。
はじめに
自然言語処理(NLP)の分野は常に進化しており、新たな進歩が私たちの能力を向上させ続けています。Mixtral モデルはその代表的な例です。トランスフォーマーフレームワーク内でエキスパートの混合アプローチを採用する Mixtral について、このガイドで詳しく解説します。このブログでは、その特徴、機能、および言語処理に依存する分野での可能性のあるアプリケーションについて取り上げます。
Mixtral of Experts とは?
Mixtral 7B と Mixtral 8x22B とは?
Mistral AI によって開発された Mixtral 8x7B と Mixtral 8x22B は、高度な大規模言語モデルです。Mixtral 8x7B と Mixtral 8x22B は、高い効率性で知られるオープンソースのウェイトモデルです。これらのモデルは Apache 2.0 ライセンスの下で利用可能であり、アクセシビリティが向上しています。カスタマイズやファインチューニングが必要なタスクに特に有用で、より高速なパフォーマンス、高い移植性、そして優れた制御性を提供します。
Sparse Mixture of Experts(疎なエキスパート混合)とは?
Mixtral は効率性を実現するために、Sparse Mixture of Experts(SMoE)アプローチを採用しています。すべてのパラメータを同時に使用する代わりに、ルーターネットワークを用いて各入力トークンに対して少数のエキスパートを選択します。この選択的な選択により、関連するモデルコンポーネントに集中することで性能が向上し、MoE 層のゲーティングネットワークによって行われます。必要なパラメータのみを活性化することで、Mixtral は高いスループットを達成し、情報処理を高速化するため、大規模データセットを扱う複雑な NLP タスクに最適です。

Mixtral の能力
Grouped-Query Attention(GQA)や Sliding Window Attention(SWA)などの革新技術を活用し、Mixtral はモデル並列化を駆使して複雑なタスクを迅速に処理します。Mixtral は高度な学習戦略により、複雑な問題をより単純な問題に分割できます。MoE 層における多様なエキスパートの出力の加重和は、単一構造のモデルでは捉えきれない複雑さを捉えることで、その性能を高めています。
Mixtral of Experts の技術的特徴
Mixtral 8x7B
- 英語、フランス語、イタリア語、ドイツ語、スペイン語の多言語対応
- 強力なコーディング性能
- 指示追従モデルへのファインチューニングが可能
- 32k トークンのコンテキストウィンドウ
Mixtral 8x22B
- 64K トークンのコンテキストウィンドウ
- 英語、フランス語、イタリア語、ドイツ語、スペイン語に堪能
- 強力な数学およびコーディング能力
- 関数呼び出しをネイティブサポート
Mixtral の性能ベンチマーク
以下は Mixtral 8x22B と Mixtral 8x7B の性能を示すグラフです。これはコミュニティから提供されたモデルに基づいています。Mixtral 8x22B は、Mistral のオープンモデルファミリーの最新モデルです。スパース活性化パターンにより、70B モデルよりもはるかに強力な代替手段であり、他のオープンウェイトモデルを凌駕します。ベースモデルとして利用できるため、さまざまなユースケースにファインチューニングするのに理想的です。

推論能力においても、Mixtral 8x7B と Mixtral 8x22B は Llama 2 70B を上回っています。Llama 2 70B は、大規模言語モデルを、広く話されているものの学習データにはあまり含まれていない言語に拡張するための現在の基盤モデルです。

これらの Mixtral エキスパートモデルは、優れたコーディング能力と数学能力を示しています。Mixtral は、トークンあたりわずか 130 億のアクティブパラメータ(700 億から大幅に削減)を使用して、先行モデルの Llama 2 70B を凌駕し、計算コストを節約します。

Novita AI はこれらの 2 つのモデルを提供しており、詳細は LLM モデル API でご確認いただけます。


Mixtral の実用的なアプリケーション
Mixtral の技術的な能力はその機能を超えて広がっています。人間らしいテキストを生成する能力は、コーディング、言語翻訳、コンテンツ作成に最適です。オープンソースであるため、Mixtral は幅広い業界で利用可能です。開発者はモデルを特定の要件に合わせて調整でき、新しい方法やアプリケーションの開発を促進します。
コンテンツ生成
Mistral of Experts およびその他の LLM の主要な用途の 1 つは、初期プロンプトに基づいてテキストを生成することです。この機能の核となるのは、さまざまなドメインからの膨大なテキストを含む多様なデータセットでの広範なトレーニングです。この広範なトレーニングを通じて、モデルはさまざまな文体、トピック、言語構造を習得し、特定のトーンやコンテンツ要件を満たすテキストを生成するのに優れています。

感情分析
Mistral の感情分析は、ディープラーニングを活用して、チャット中のテキストのポジティブ、ネガティブ、ニュートラルな感情を正確に検出します。多様なデータセットでの広範なトレーニングを活用し、感情のトーンを推測し、さまざまなコンテンツタイプの感情を識別します。特定のテキストの感情を分析するよう Mistral に依頼できます。

Mixtral 8x22B サンプルコード
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Get the Novita AI API Key by referring: /docs/get-started/quickstart.htmll#_3-create-an-api-key
api_key="<YOUR Novita AI API Key>",
)
model = "cognitivecomputations/dolphin-mixtral-8x22b"
stream = True # or False
max_tokens = 512
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
テキスト翻訳と多言語タスク
Mistral は、多言語タスクの処理にも優れた能力を発揮します。特にトレーニングされた Mistral は、さまざまな言語、特にフランス語、ドイツ語、スペイン語、イタリア語のテキストを理解し生成できます。Mistral は、複数の言語でコミュニケーションする必要がある企業やユーザーにとって特に価値があります。

コード生成
与えられた入力に対して、Mistral of Experts モデルはコード生成に優れており、高レベルの記述を複数のプログラミング言語の効率的なコードに変換します。コードリポジトリ、技術文書、開発者フォーラムからのトレーニングを活用し、要件を満たし、機能性と最適化を確保します。

Mixtral 8x7B サンプルコード
from openai import OpenAI
client = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Get the Novita AI API Key by referring: /docs/get-started/quickstart.htmll#_3-create-an-api-key
api_key="<YOUR Novita AI API Key>",
)
model = "Nous-Hermes-2-Mixtral-8x7B-DPO"
stream = True # or False
max_tokens = 512
chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)
if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
開発者のための Mixtral 活用ガイド:LLM API
Mixtral モデルをアプリケーションに追加することは、開発者にとってエキサイティングな機会です。オープンソースであり、特定のニーズに合わせてカスタマイズ可能です。Mixtral を効果的に活用するには、開発者はその機能と API を理解する必要があります。コスト効率の高い LLM API 統合には、Novita AI をお勧めします。この AI API プラットフォームは、特徴的なモデルと手頃な LLM ソリューションを備えています。
Novita AI API の始め方
- ステップ 1: Novita AI にアクセスし、アカウントを作成します。Google または GitHub でログインできます。初回ログイン時に新しいアカウントが作成されます。メールアドレスを使用してサインアップしても問題ありません。

- ステップ 2: API キーを管理します。 Novita AI は、リクエストヘッダーに API キーを使用する Bearer 認証で API アクセスを認証します。“Key Management” にアクセスしてキーを管理してください。初回ログイン時にデフォルトのキーが自動的に作成されます。また、[“+ Add new key”] をクリックして新しいキーを追加することもできます。

- ステップ 3: API 呼び出しを行います。 ** モデル API リファレンス** にアクセスし、API キーを入力して以下のタスクを続行します。

以下は、Novita AI Chat Completions API を使用した Python クライアントの例です。
pip install 'openai>=1.0.0'
from openai import OpenAIclient = OpenAI(
base_url="https://api.novita.ai/v3/openai",
# Get the Novita AI API Key by referring: https://novita.ai/docs/get-started/quickstart.html#_2-manage-api-key.
api_key="<YOUR Novita AI API Key>",
)model = "Nous-Hermes-2-Mixtral-8x7B-DPO"
stream = True # or False
max_tokens = 512chat_completion_res = client.chat.completions.create(
model=model,
messages=[
{
"role": "system",
"content": "Act like you are a helpful assistant.",
},
{
"role": "user",
"content": "Hi there!",
}
],
stream=stream,
max_tokens=max_tokens,
)if stream:
for chunk in chat_completion_res:
print(chunk.choices[0].delta.content or "", end="")
else:
print(chat_completion_res.choices[0].message.content)
- ステップ 4: クレジットをチャージします。 最初のステップで述べたように、製品を試すためのクレジット付きのバウチャーがありますが、それには制限があります。クレジットを追加するには、** 請求と支払い ** にアクセスし、** 支払い方法** のガイドに従ってください。
結論
結論として、中核アーキテクチャに MoE を採用した Mixtral of Experts は、スマートな AI 機能とさまざまな業界での実用的な使用を組み合わせた新しいテクノロジーです。コード生成、ストーリー作成、翻訳などの特定のタスクで優れた性能を発揮します。これにより、機械学習の現代のデジタル世界において特別なツールとなっています。企業は、Mixtral を現在のシステムと統合し、ベストプラクティスに従うことでそのフルパワーを活用でき、創造性を高め、競争力を維持するのに役立ちます。急速に進化する AI の世界で成功するために、Mixtral の強みを活用しましょう。
よくある質問
Mistral と Mixtral の違いは何ですか?
Sparse Mixture of Experts アーキテクチャを採用した Mixtral は、Mistral と比較して機能が強化されています。少ない計算リソースで、複雑な言語タスクを高速かつ効率的に処理することに優れています。
Mixtral は何でトレーニングされていますか?
Mixtral は、32,000 トークンの大規模なコンテキストサイズでトレーニングされ、さまざまなベンチマークで Llama 2 70B や GPT-3.5 と同等のパフォーマンスを示しています。
Mixtral には GPU が必要ですか?
Mixtral 8X22B を使用して推論を行うには、最低 300GB のメモリを搭載した GPU が必要です。Mixtral 8x7B の場合、標準的なガイドラインに基づき、約 94GB の VRAM が必要です。
Mixtral は商用利用できますか?
Mixtral 8x7B と Mixtral 8x7B — Instruct はどちらも Apache 2.0 ライセンスで利用可能であり、学術目的および商用目的での利用が許可されています。
Novita AI は、AI の野望を実現するオールインワンのクラウドプラットフォームです。統合 API、サーバーレス、GPU インスタンス — 必要なコスト効率の高いツールを提供します。インフラストラクチャを排除し、無料で始めて、AI のビジョンを現実にしましょう。
おすすめの読み物
1.Mixtral-8x22B の紹介:最新かつ最大のエキスパート混合大規模言語モデル
