TRAEでGPT‑OSSを使う:AIコーディング向けHarmonyフォーマットの活用

TRAEでGPT‑OSSを使う:AIコーディング向けHarmonyフォーマットの活用

AIを活用したソフトウェア開発は、強力なオープンソースモデルと完全に統合されたAI開発環境という2つの大きなトレンドに牽引され、急速に進化しています。**GPT‑OSS**はOpenAIのオープンウェイトモデルシリーズで、優れた推論能力、エージェントのような機能、深いカスタマイズ性で知られています。TRAEはByteDanceが開発したAI IDEで、単独でソフトウェアを構築できる完全な「AIエンジニア」として機能するように設計されています。

では、GPT‑OSSの制御可能な推論能力とTRAEのツールが豊富な自動開発フレームワークを組み合わせるとどうなるでしょうか?2つを組み合わせることで、自動化されつつもあなたのニーズに完全に合わせたワークフローが実現します。このガイドでは、これらを連携させて潜在能力を最大限に引き出す方法を解説します。

TRAEとは?

TRAEはByteDanceが開発したAI搭載統合開発環境(IDE)の名称でもあります。複雑なタスクを理解して実行することで、単独でソフトウェアソリューションを構築できる「AIエンジニア」として機能するように設計されており、ユーザーがAIにタスクを委譲することで開発ワークフローを効率化することを目的としています。

trae

TRAEの主要機能

強化されたツール統合と機能(Model Context Protocol - MCP)

  • 外部ツール統合: TRAEは多様な外部ツールと統合されており、AIエージェントがこれらのツールを活用してより効果的にタスクを実行できるようにします。
  • MCP対応: AIアプリケーションと外部データソース・ツールを接続するためのオープンスタンダードであるModel Context Protocol(MCP)に対応しています。これはAI向けの汎用的な「USB-Cポート」のようなもので、サイロ化されたデータにAIモデルを接続するという課題を解決します。
  • 拡張されたAI機能: MCPを通じて、エージェントはGoogle Drive、Slack、GitHub、データベースなどの外部リソースにアクセスし、複雑なタスクをより深く理解して完了できるようになります。

より深いコンテキスト理解と精密な制御

  • 開発コンテキストの深い理解: TRAEはコードリポジトリ、オンライン検索結果、共有ドキュメントを含む開発コンテキストを深く理解します。
  • 動作の精密なカスタマイズ: ルールをカスタマイズしてAIの動作をワークフローに合わせることができ、意図した通りにタスクが実行されることを保証します。
  • マルチモーダル対話: 画像(デザインモックアップ、エラーのスクリーンショットなど)のアップロードに対応しており、要件を説明する際に活用することで、AIがより正確なコードを生成できるようにします。

CUE:スマート予測とワンキー編集

  • 次の編集を予測: CUE(Context Understanding Engine)機能はユーザーの意図を理解し、編集行動を分析して次の操作を予測します。
  • ワンキーでのナビゲーションと適用: Tabキーを押すだけで、次の提案された変更に移動したり、複数行にわたるスマートな提案を一度に適用したりできます。
  • 継続的な最適化: この機能はパフォーマンスと応答性の向上のために継続的に最適化されており、コードの修正、生成、バグ修正の際によりスムーズな体験を提供します。

充実したIDE機能とAIアシスタンス

  • 2つの開発モード: 従来のユーザー主導のワークフロー向けのIDEモードと、AIが要件から納品まで開発を主導して完全な自動化を実現するSOLOモードを提供します。
  • 本格的なIDE: コード編集、プロジェクト管理、バージョン管理などの標準的なIDE機能を提供します。
  • AIプログラミングアシスタンス: スマートなコード補完、リファクタリング、チャットベースのQ&A、自然言語からのプロジェクト生成など、多彩なAIアシスト機能を搭載しています。
  • 組み込みWebプレビュー: IDE内でWebページを直接プレビューできるため、フロントエンド開発やデバッグが容易になります。

TRAE SOLOとは?

What is Trae Solo?

  • 統合ワークスペースとAIツールハブ
    SOLOモードは、IDE、ブラウザ、ターミナル、ドキュメントなど、開発に必要なすべてのツールをAIに直接統合します。これにより、AIは各タスクの特定のニーズに基づいて精密に推論・行動し、アイデアから実行までのギャップをシームレスに埋めることができます。
  • AI主導のエンドツーエンド開発
    要件を提供するだけで、SOLOが自律的に開発ライフサイクル全体を処理します。含まれる工程は以下の通りです:
    • 要件分析
    • プロトタイプ作成
    • フロントエンド開発
    • バックエンド開発
    • デバッグと最適化
    • ビルドとデプロイ
  • 統合モニタリングビュー
    ユーザーはAIとチャットでき、単一の統合ビューですべての開発アクティビティを監視できます。「拡張ビュー」では、すべてのリアルタイム実行詳細を詳しく確認できます。
  • マルチモーダル対話:音声で要件を伝達
    SOLOモードは音声入力をサポートしており、人間のチームメイトと同様に自然にTRAEと対話できます。AIの出力はコードに限られず、右側に表示される拡張可能な動的ビューで視覚的かつ直感的なフィードバックを提供します。
  • コンテキストエンジニア
    SOLOモードは究極の「コンテキストエンジニア」になるように設計されており、あなたの作業の全範囲を理解して、その行動と出力が利用可能な最も包括的で正確な情報に基づくようにします。

まとめると、TRAE SOLOモードの目標は「完全なソフトウェアを出荷できるAI」を実現することです。開発者が「話す、考える、出荷する」というシンプルなプロセスを通じて、実際のソフトウェアをより速く構築・リリースできるようにします。

GPT OSSとは?

GPT-OSS(Open-Source Series)はOpenAIがリリースした強力なオープンウェイト言語モデルファミリーで、商用利用を無料で可能にするように設計されており、民生用ハードウェア上でローカル実行できます。このシリーズには200億パラメータ版と1200億パラメータ版の2つの主要モデルが含まれ、優れた推論、ツール利用、効率性に最適化されており、OpenAIがAIコミュニティに向けてより高い透明性を追求する大きな転換点となっています。これらのモデルにより、開発者や研究者はデータとインフラを完全に制御しながら、カスタム目的に合わせてファインチューニングすることができ、クローズドなプロプライエタリシステムとオープンソースAIのギャップを埋めます。

モデル レイヤー数 総パラメータ数 トークンごとのアクティブパラメータ数 総エキスパート数 トークンごとのアクティブエキスパート数 コンテキスト長 単一GPUのVRAM要件
gpt-oss-120b 36 117B 5.1B 128 4 128k 80GB
gpt-oss-20b 24 21B 3.6B 32 4 128k 16GB

gpt oss benchmark

AIコーディングにGPT OSSを選ぶ理由は?

フォーマットのカスタマイズ:Harmony

GPT‑OSSモデルはHarmonyという特殊な会話フォーマットを使用しています。このフォーマットはメッセージをsystemuserassistantの明確なロールに整理し、モデルの思考と応答の方法を制御できます。Harmonyを使用することで、推論の深さ(低、中、高)を調整したり、思考プロセスを表示するか非表示にするかを決定したり、モデルが安定した構造化された方法で関数を呼び出すように設定したりできます。他の多くのオープンソースモデルにはこれらの制御機能が組み込まれていませんが、GPT‑OSSはHarmonyの指示に従うようにトレーニングされているため、ネイティブでこれらの制御を理解します。これにより、一貫性があり信頼性が高く、ツールと親和性の高い出力を得やすくなります。

Harmonyで制御できる項目

Harmonyフォーマットを使用すると、GPT‑OSSモデルの主要な動作パラメータをいくつか調整できます:

パラメータ 説明
推論の深さ モデルが段階的に思考する量を制御します。 "Reasoning: low", "Reasoning: medium", "Reasoning: high"
関数呼び出し OpenAIスタイルのfunction_call/tool_callsのJSON出力をネイティブでサポートします。 "Always call function weather_api when asked about weather"
推論の表示 <think>タグ内の思考の全過程を表示または非表示にします。 "Show reasoning" / "Hide reasoning"
出力フォーマットルール JSON、Markdownなどの構造化された出力を強制します。 "Output in JSON format"

Harmonyリクエストの例

{
  "messages": [
    {
      "role": "system",
      "content": "Reasoning: medium; Hide reasoning; Output in JSON format"
    },
    {
      "role": "user",
      "content": "Explain how quicksort works."
    }
  ]
}

TraeなどのツールとHarmonyを組み合わせるメリット

Traeなどのコード生成、デバッグ、実行プラットフォームと統合することで、Harmonyフォーマットはいくつかの実用的なメリットを提供します:

  1. 安定した構造化出力
    • Harmonyはモデルの出力が予測可能なJSONやコードブロック形式に従うことを保証します。
    • Traeは脆弱な正規表現や後処理なしで、この出力を直接解析できます。
  2. 推論の深さの制御
    • 迅速なプロトタイピングやシンプルなコードには推論を使用します。
    • 正確性が最も重要な複雑なアルゴリズムには推論を使用します。
    • 推論コストをタスクの複雑さに合わせることで、GPU/CPUリソースを節約できます。
  3. 推論の表示の切り替え
    • デバッグや学習のために<think>の推論を表示します。
    • 本番環境では推論を非表示にしてトークンを削減し、内部ロジックの漏洩を防ぎます。
  4. 明確なマルチターンコンテキスト管理
    • systemルールはターン間で持続し、一貫したコードスタイルと実行ルールを保証します。
    • 反復が容易:グローバル設定を失うことなくユーザー指示を変更できます。
  5. シームレスなAPI統合
    • HarmonyはOpenAI Responses APIを模倣しているため、OpenAIに対応したツールチェーンやIDEプラグインは最小限の変更でGPT‑OSSと連携できます。

GPT OSSのツール利用

GPT‑OSSモデルは、推論プロセスの一部として外部ツールをネイティブで使用するようにトレーニングされており、ブラウジングPython実行ファイルパッチ適用を組み込みでサポートしています。これらのツールは、Harmony形式のプロンプトsystemメッセージで定義することで有効化されます。

1. ブラウザツール

  • 目的: Webを検索したり、ページを開いたり、ページ上のテキストを検索したりします。
  • メソッド:
    • search — キーフレーズを検索します。
    • open — 特定のページを開きます。
    • find — ページ上のコンテンツを特定します。
  • 特徴:
    • コンテキストサイズを管理するためのスクロール可能なテキストウィンドウ。
    • 同じページを再訪問する際の高速化のためのキャッシュ機能。
    • 回答で出典を引用するようにトレーニングされています。
  • 使用方法: systemプロンプト内で.with_browser()または.with_tools()を使用してブラウザツールの定義を追加します。
  • 注意: リファレンス実装は教育目的のみです。本番環境では独自のバックエンドを使用してください。

2. Pythonツール

  • 目的: 思考の連鎖の一部として計算を実行したり、小さなプログラムを実行したりします。
  • 特徴:
    • マルチステップ推論用のステートフルなPythonツールでトレーニングされています。
    • リファレンス実装はステートレスモードを使用しています。
    • openai‑harmonyのデフォルトのツール説明を上書きできます。
  • 使用方法: systemプロンプト内で.with_python()または.with_tools()を使用して追加します。
  • セキュリティ警告: リファレンスコードは緩い設定のDockerコンテナで実行されます。本番環境では独自の制限を追加してください。

3. パッチ適用ツール

  • 目的: ローカルファイルの作成、更新、削除を行います。
  • 使用例: 自動開発ループの一部としてコードやプロジェクトファイルを修正します。

TRAEでGPT OSSを使用する方法

前提条件:APIキーの取得

Novita AIはGPT-OSS 120B APIを提供しており、131Kのコンテキスト$0.1/入力$0.5/出力の料金で利用できます。またNovita AIはGPT-OSS 20Bも提供しており、131のコンテキスト、$0.05/入力$0.2/出力の料金で、GPT OSSのコードエージェントの潜在能力を最大限に引き出すための強力なサポートを提供します。

Novita AI

ステップ1:ログインしてモデルライブラリにアクセス

アカウントにログインし、モデルライブラリボタンをクリックします。

Log In and Access the Model Library

今すぐGPT OSSを試す!

ステップ2:モデルを選択

利用可能なオプションを閲覧し、ニーズに合ったモデルを選択します。

Step 2: Choose Your Model

ステップ3:無料トライアルを開始

選択したモデルの機能を探索するために、無料トライアルを開始します。

Step 3: Start Your Free Trial

ステップ4:APIキーを取得

APIでの認証のために、新しいAPIキーを提供します。「設定」ページに移動すると、画像の指示に従ってAPIキーをコピーできます。

get api key

ステップ5:APIをインストール

使用しているプログラミング言語に固有のパッケージマネージャーを使用してAPIをインストールします。

インストール後、必要なライブラリを開発環境にインポートします。APIキーでAPIを初期化し、Novita AI LLMとの対話を開始します。以下はPythonユーザー向けのチャット補完APIの使用例です。

from openai import OpenAI
  
client = OpenAI(
    base_url="https://api.novita.ai/v3/openai",
    api_key="",
)

model = "openai/gpt-oss-120b"
stream = True # or False
max_tokens = 65536
system_content = ""Be a helpful assistant""
temperature = 1
top_p = 1
min_p = 0
top_k = 50
presence_penalty = 0
frequency_penalty = 0
repetition_penalty = 1
response_format = { "type": "text" }

chat_completion_res = client.chat.completions.create(
    model=model,
    messages=[
        {
            "role": "system",
            "content": system_content,
        },
        {
            "role": "user",
            "content": "Hi there!",
        }
    ],
    stream=stream,
    max_tokens=max_tokens,
    temperature=temperature,
    top_p=top_p,
    presence_penalty=presence_penalty,
    frequency_penalty=frequency_penalty,
    response_format=response_format,
    extra_body={
      "top_k": top_k,
      "repetition_penalty": repetition_penalty,
      "min_p": min_p
    }
  )

if stream:
    for chunk in chat_completion_res:
        print(chunk.choices[0].delta.content or "", end="")
else:
    print(chat_completion_res.choices[0].message.content)
  
  

TRAEでGPT‑OSSを使用する

ステップ1:Traeを開いてモデルにアクセス

Traeアプリを起動します。右上の「AIサイドバーを切り替え」ボタンをクリックしてAIサイドバーを開きます。次にAI管理に移動し、モデルを選択します。

Toggle AI Side Bar

go to AI Management and select Models

ステップ2:カスタムモデルを追加し、プロバイダーとしてNovitaを選択してモデルを選ぶ

モデルを追加ボタンをクリックして、カスタムモデルのエントリを作成します。モデル追加ダイアログで、ドロップダウンメニューからプロバイダー = Novitaを選択します。

モデルのドロップダウンから、希望のモデル(DeepSeek-R1-0528、Kimi K2、GLM 4.5、DeepSeek-V3-0324、MiniMax-M1-80k)を選択します。目的のモデルがリストにない場合は、Novitaライブラリで確認したモデルIDを直接入力してください。使用したいモデルの正しいバリアントを選択していることを確認してください。

Add a Custom Model

Choose Novita as Prov

ステップ3:APIキーを入力

NovitaコンソールからNovita AIのAPIキーをコピーし、TraeのAPIキーフィールドに貼り付けます。

get api key

Novita AI APIキーを取得!

GPT OSSの制限事項

機能 GPT-OSS(セルフホスト型モデル) GPT-5 API(マネージドプラットフォーム)
コア提供内容 生のモデル(「エンジン」) 完全に統合されたプラットフォーム(「車」)
モデル能力 強力だが、1世代前の性能 最先進のフラッグシップ推論
組み込みツール なし。 大規模なDIY作業が必要です。 完全マネージド: Web検索、ファイル検索、コードインタープリタ。
コンテキストウィンドウ ハードウェア(例:8k~32k)によって実質的に制限されます。 大容量(400k)、完全マネージド。
エージェントフレームワーク オープンソースライブラリ用于のDIY。可視性なし。 組み込みの可視性機能を備えた統合SDK。
エンタープライズ機能 なし。 コンプライアンス、SSO、管理コントロールなし。 フルスイート: SOC 2、HIPAA、RBAC、SSOなど。
サポート コミュニティベースのセルフサービス。 専任のアカウントチームと優先サポート。
メンテナンス あなたの完全な責任です。 セットアップ、スケーリング、稼働時間の管理。 不要。 OpenAIが完全に管理します。

GPT‑OSSとTRAEを統合することで、両者のメリットを最大限に活用できます:

  • GPT‑OSSは「脳」として、Harmonyフォーマットを通じて推論の深さを調整し、出力を構造化し、思考プロセスを表示または非表示にします。
  • TRAEは「身体」として、統合ワークスペース、ツール接続、自律的なソフトウェアライフサイクル管理を提供します。特にSOLOモードでその真価を発揮します。
  • Novita AIがギャップを埋め、GPT‑OSSをホスティングしてAPI経由で利用できるようにするため、高価なハードウェアを用意する必要がありません。

この組み合わせにより、開発者は要件を理解し、意図した通りに実行するカスタムの「AIエンジニア」を構築でき、真の自律的なソフトウェアデリバリーを実現可能にします。

よくある質問

クローズドソースのAPIモデルではなく、GPT‑OSSをTRAEと併用する理由は何ですか?

完全な制御が可能になるためです。Harmonyフォーマットにより、TRAEが推論の深さ、出力フォーマット、思考プロセスの表示の有無を制御できます。また、独自のコードでGPT‑OSSをファインチューニングして、完璧に適合させることも可能です。

GPT‑OSSを自分でホスティングする必要がありますか?

いいえ。Novita AIのようなサービスがホスティングを行い、APIキーを提供するため、高価なGPUや複雑なセットアップは必要ありません。

Harmonyフォーマットとは何ですか?またなぜ重要ですか?

GPT‑OSSが理解する特殊なメッセージフォーマットです。出力を安定させ、構造化し、TRAEが処理しやすいようにするため、脆弱なパース処理は不要です。

Novita AIはAIの野望を実現するオールインワンのクラウドプラットフォームです。統合API、サーバーレス、GPUインスタンス——必要なコスト効率の良いツールを提供します。インフラの管理を不要にし、無料で始めて、あなたのAIビジョンを現実にしましょう。

おすすめの記事

RAGパイプラインにおけるQwen 3:オールインワンのLLM、埋め込み、リランキングモデル

TraeとClaude Code:Kimi K2との併用に適しているのはどちら?

DeepSeek R1 0528のコスト:API、GPU、オンプレミスの比較