2025年に知っておくべき初心者向けAI用語20選

2025年に知っておくべき初心者向けAI用語20選

最近、AI用語があふれています。誰もが別の言語で話しているように感じ、圧倒されることもあります。もし誰かが「Sandbox」「RAG」「MCP」について話しているのを聞いて、会議でうなずきながら、実際の意味を半分も理解できずにいるなら、このガイドはあなたのためのものです。

テクノロジーは急速に進化しますが、基本を理解するのに技術的なバックグラウンドは必要ありません。ここでは、よく目にするAI用語をわかりやすい言葉で説明し、段階的に理解を深められるようにまとめました。

AI用語集

1. コアなAI概念

AI ** モデル**

AIモデルは、人間の思考を模倣するために設計されたスマートなコンピュータプログラムと考えてください。質問や画像などの入力を与えると、その情報を処理して意味のある出力を生成します。モデルは膨大な例を分析し、パターンを認識し、理解して応答する能力を徐々に向上させることで学習します。

AIモデルとその効率的なデプロイ方法について詳しくは、Novita AI Model Deployment Guideをご覧ください。

ニューラルネットワーク

ニューラルネットワークは、脳の働きを簡略化したものと考えてください。相互に接続されたノード(人工ニューロンと呼ばれる)で構成され、情報をやり取りします。これは、私たちの頭の中のニューロンと似ています。これらのネットワークは、ノード間の接続の重みを調整することで、パターンの認識や意思決定の精度を高めていきます。これは、私たちが経験から学ぶ方法と似ています。ニューラルネットワークは層状に構成されています。入力層がデータを受け取り、隠れ層が複雑な数学的関数で処理し、出力層が最終結果を生成します。ディープラーニングの「ディープ」とは、多くの隠れ層を持つネットワークを指し、より複雑なパターンを学習できるようにします。

ニューラルネットワークの説明

Transformer アーキテクチャ

Transformerは、今日のスマートなAIを可能にした画期的なテクノロジーです。2017年以前は、AIはテキストを単語ごとに読む必要がありました(まるで指で単語を追いながら本を読むように)。Transformerは、「アテンション」と呼ばれるメカニズムを通じて、AIが文の中のすべての単語を一度に見て、それらの関係を理解できるようにすることで、これを変えました。これは、一度に一単語ずつ読むのと、瞬時に文全体を把握するのとの違いのようなものです。アテンションメカニズムにより、モデルは出力の各部分を生成するときに入力の関連部分に焦点を当てることができ、言語のコンテキストや関係性をより効果的に理解できるようになります。

大規模言語モデル (LLM)

LLMは、人間の言語を理解し生成するために特別に訓練されたAIモデルです。数十億もの単語を読み、文中で次に来る単語を予測することを学習し、エッセイを書いたり、質問に答えたり、自然にチャットしたりすることができます。訓練中、テキストのパターンを分析して文法、コンテキスト、意味を理解します。現代のLLMはマルチモーダルモデルへと進化し、テキストだけでなく画像、音声なども一つのインターフェースで処理できるようになりました。例えば、GPT-4oはテキスト、音声、画像を同時に受け付け、より豊かで多用途なインタラクションを実現します。「大規模」とは、モデルの学習知識を保存する膨大な数のパラメータ(しばしば数十億)を指します。

汎用人工知能 (AGI)

AGIはAIの聖杯であり、特定のタスクだけでなく、あらゆる領域で人間と同等の知能を持つシステムです。今日のAIは文章作成や画像認識などの特定のことに優れていますが、AGIは創造性、推論、学習、問題解決においてあらゆる分野で人間の知能に匹敵します。科学的には、AGIを達成するには、転移学習(ドメイン間での知識の適用)、少数ショット学習(最小限の例からの学習)、因果推論、より効率的な学習アルゴリズムの開発など、基礎的な課題を解決する必要があります。現在のAIシステムは、特定のタスクには優れているが、人間の認知を特徴づける汎用的な知能と適応性を欠いているため、「狭い」AIと見なされています。

AI アラインメント

AIアラインメントとは、AIシステムが人間と同じものを望み、害ではなく助けとなる行動をするようにすることです。AIがより強力になるにつれて、AIが私たちの価値観や目標を共有するようにすることがますます重要になります。AIが私たちのチームの一員であることを確認するようなものです。これには、価値学習(AIに人間の好みを理解させる)、ロバストネス(新しい状況でも正しく動作することを保証する)、解釈可能性(AIが特定の決定を下す理由を理解する)などの技術的な課題が含まれます。アラインメント研究は、誰の価値観に合わせるのか、矛盾する人間の好みをどう扱うのかという哲学的な問題にも取り組みます。

2. データとトレーニング

トレーニングデータ

トレーニングデータとは、AIモデルを教えるために使用されるすべての情報であり、AIの教科書と考えてください。言語モデルの場合、何百万もの書籍、ウェブサイト、ニュース記事、その他の文書コンテンツが含まれます。この「読み物」が多様で高品質であるほど、AIはさまざまなトピックや状況を扱う能力が向上します。データの品質は重要です。偏ったトレーニングデータや不正確なデータは、偏ったAI出力や不正確なAI出力につながります。トレーニングプロセスでは、モデルに無数の例を示し、データ内の統計的パターンや関係を学習させます。

事前学習

事前学習は、AIが小学校に行くようなものです。モデルが基礎を学ぶ段階です。このフェーズでは、AIは大量のテキストを読み、言語の基本的なパターン、世界に関する事実、推論方法を学びます。これは、特定の分野に特化する前のAIの一般教育です。事前学習では教師なし学習を使用します。つまり、モデルは明示的なラベルや回答なしでパターンを学習します。このフェーズは計算コストが高く、強力なコンピュータクラスタで数週間から数ヶ月かかることがよくありますが、多くの異なるタスクに適用できる一般的な知識の基盤を構築します。

ファインチューニング

ファインチューニングは、卒業後の専門訓練のようなものです。AIが事前学習で一般教育を受けた後、特定の種類のコンテンツやタスクに対してさらに訓練することができます。例えば、一般的なAIを医学ジャーナルでファインチューニングして医療質問に強くしたり、カスタマーサービスの会話で訓練して企業の特定のトーンやスタイルを採用させたりします。このプロセスは、モデルがすでに言語の基礎を理解しているため、事前学習よりもはるかに少ないデータと計算リソースしか必要としません。ファインチューニングは、モデルのパラメータを調整して、一般的な能力を維持しながら、特定の領域やアプリケーションのパフォーマンスを最適化します。

人間のフィードバックからの強化学習 (RLHF)

RLHFは、人間の教師がAIの宿題を採点し、良い答えとは何かを教えるようなものです。人間がさまざまなAIの応答を評価し、モデルは人々が役に立つ、正確で、適切だと感じる出力を生成することを学習します。このプロセスは、思い通りの行動をするAIシステムを作るために重要です。RLHFは通常、3つのステップで構成されます。人間の好みに基づいて報酬モデルを訓練し、強化学習を使用してこの報酬モデルに従ってAIの行動を最適化し、さらに人間のフィードバックを通じて反復的に改善します。この手法は、AIの行動を人間の価値観に合わせ、有害または望ましくない出力を減らすのに役立ちます。

3. 入力と出力のメカニズム

トークン

トークンは、基本的にAIがテキストを「数える」方法です。おおよそ1単語につき1トークンですが、単語の一部や句読点、スペースの場合もあります。AIモデルには一度に処理できるトークン数に制限があり(コンテキストウィンドウと呼ばれます)、そのため非常に長い文書を処理できなかったり、長い会話のすべてを覚えていられなかったりする場合があります。言語や書記体系によって異なるトークン化戦略が必要です。トークンを理解することは重要です。なぜなら、AIモデルはトークンとしてテキストを順次処理し、トークン制限が入力長と会話中の記憶範囲の両方を決定するからです。

推論

推論とは、AIがその仕事をしている瞬間、つまり入力を受け取り出力を生成することです。ChatGPTに質問を入力して回答を得るとき、それが推論です。AIがデータから学習している訓練とは異なります。推論中、モデルは学習したパラメータを使用して新しい入力を処理し、応答を生成します。このプロセスは訓練よりもはるかに高速でリソース消費も少ないですが、大規模モデルには依然としてかなりの計算能力が必要です。推論の品質は、モデルの訓練と、入力がモデルが以前に見たパターンにどの程度一致しているかに依存します。

プロンプトエンジニアリング

プロンプトエンジニアリングは、適切な方法でAIに正しい質問をする技術と科学です。明確で具体的な質問をすれば、曖昧な質問よりも良い回答が得られるのと同じように、適切なプロンプトを作成することでAIから得られる結果を劇的に向上させることができます。効果的なプロンプトには、明確な指示、関連するコンテキスト、望ましい出力形式の例、特定の制約や要件が含まれることがよくあります。高度なテクニックには、チェーン・オブ・ソートプロンプティング(AIに推論を示させる)、少数ショット学習(例を提供する)、プロンプトチェイニング(複雑なタスクをステップに分割する)などがあります。目標は、モデルの能力を最適に活用しながら、意図を明確に伝えることです。

ハルシネーション

AIが「ハルシネーション」を起こすと、もっともらしく聞こえるが真実ではないことを作り出します。これは、AIが知識のギャップを埋めようとしたり、実際には理解していないことについて質問されたときに発生します。それは、行ったことのない場所への道順を自信満々に教えるようなものです。自信があっても、道順が正しいとは限りません。ハルシネーションは、言語モデルが正確な情報ではなく、もっともらしいテキストを生成するように訓練されているために発生します。事実、引用、詳細をでっち上げることがありますが、自信に満ちた口調は維持されます。この制限を理解することは、責任あるAIの使用にとって重要であり、ファクトチェックや情報源の検証などのテクニックは依然として重要です。

AIにおけるハルシネーション

4. AIツールと高度なアプリケーション

アプリケーションプログラミングインターフェース (API)

APIはレストランのウェイターのようなものです。注文(リクエスト)をキッチン(AIシステム)に伝え、料理(レスポンス)を持ってきます。AIの世界では、APIによって異なるソフトウェアプログラムがAIモデルと通信でき、ゼロからAIを構築する必要がなくなります。企業はAPIを通じて既存のAIサービスを利用できます。APIは、最大出力長、創造性のレベル(温度)、応答形式などのパラメータを含む、リクエストとレスポンスの特定の形式を定義します。認証、レート制限、エラー管理を処理するため、開発者は深いAIの専門知識がなくても、アプリケーション、ウェブサイト、サービスにAI機能を簡単に統合できます。

マルチモーダルAI

マルチモーダルAIは、テキスト、画像、音声、ビデオなど、さまざまな種類のコンテンツを同時に処理できます。それは、あなたが見せているものを見たり、言っていることを聞いたり、書いたものを読んだりできる人と会話するようなものです。これにより、AIとのインタラクションがより自然で人間らしくなります。マルチモーダルモデルは、異なる入力タイプ(画像用のビジョントランスフォーマー、音声用のオーディオエンコーダ)に異なるニューラルネットワークアーキテクチャを使用しますが、それらを統一された表現空間で組み合わせます。これにより、AIはビデオで何が起こっているかを説明したり、画像に関する質問に答えたりするなど、異なるモダリティ間の関係を理解できます。

検索拡張生成 (RAG)

RAGは、AIが質問に答えている間、最新の図書館にアクセスできるようにするようなものです。訓練中に学習した情報だけを使用するのではなく、RAGシステムは最新のデータベースやドキュメントを検索して関連情報を見つけてから応答を生成します。これにより、回答が正確で最新であることが保証されます。RAGは2つのステップで動作します。まず、検索システムがクエリに基づいて関連ドキュメントや情報を検索し、次に言語モデルが訓練知識と検索された情報の両方を使用して応答を生成します。このアプローチにより、ハルシネーションが減少し、最新情報へのアクセスが可能になり、AIがプロプライエタリな知識ベースや専門知識ベースで動作できるようになります。

詳しくはこちらの記事をご覧ください:What is RAG: A Comprehensive Introduction to Retrieval Augmented Generation

サンドボックス

サンドボックスは、AIのための安全な遊び場のようなものです。AIがコードを実行したり、ツールにアクセスしたり、実験したりできる安全で隔離された環境であり、主要なシステムにリスクを与えません。子供が重要なものを壊すことのない囲まれた場所で遊ぶようなものです。サンドボックスは、コンテナ化、仮想マシン、またはその他の隔離技術を使用して、システムリソース、ネットワーク接続、機密データへのアクセスが制限された制御環境を作成します。これにより、AIエージェントはコードを実行したり、APIとやり取りしたり、ソリューションをテストしたりしながら、潜在的なセキュリティ侵害、データ破損、システム損傷を防ぐことができます。

これはかなり複雑な概念です。さらに詳しく知りたい場合は、こちらの素晴らしい記事で詳しく説明しています:How Agent Sandboxes Power Secure, Scalable AI Innovation

LLM専用エンドポイント

LLM専用エンドポイントは、特定のAIモデルへの直通電話回線のようなもので、特定のニーズに最適化されています。他のユーザーとリソースを共有する代わりに、特定のユースケースにカスタマイズできる専用の接続を取得します。これには、応答速度、出力スタイル、安全フィルター、パフォーマンス保証などのカスタム構成で、分離されたコンピューティングリソース(GPU、メモリ、帯域幅)を設定することが含まれます。専用エンドポイントは、一貫したレイテンシ、より高いスループット、データプライバシーを確保しエンタープライズセキュリティ要件を満たしながら、アプリケーション専用にモデルをファインチューニングする機能を提供します。

詳しくはこちらの記事をご覧ください:LLM Dedicated Endpoint on Novita AI: Custom Models, Usage-Based Pricing, and DevOps-Free Scaling

モデルコンテキストプロトコル (MCP)

MCPは、AIモデルが外部のツールやサービスと一貫した方法で接続できるようにする新しい標準です。AIは単にテキストを生成するだけでなく、会議のスケジュールを設定したり、カレンダーを更新したり、データベースから情報を取得したりできるようになります。技術的な観点から見ると、MCPは標準化された通信プロトコルを作成し、定義されたインターフェースと権限を通じてAIが異なるソフトウェアシステムと安全にやり取りできるようにします。これにより、AIは受動的な応答者から、制御されたアクセスパターンと監査証跡を通じてセキュリティを維持しながら実際のアクションを実行できる能動的なアシスタントへと変わります。

詳しくはこちらの記事をご覧ください:What is MCP? A Developer’s Guide to Model Context Protocol

人工知能は急速に進化する分野であり、基礎的な概念、高度なツール、倫理的考慮事項を組み合わせて、産業を変革できる強力なシステムを生み出しています。AIが進化し続ける中、その概念と応用について情報を得ることが、その可能性を最大限に引き出す鍵です。実践に移ることも、最新の開発を追跡し実践的な経験を得る素晴らしい方法です。

期間限定で、新規ユーザーは $10 の無料クレジット を請求して、Novita AI の LLM API を探索・構築できます。 この機会を逃さず、AI の世界に飛び込み、あなたのアイデアを実現しましょう!

Novita AI について

Novita AI は、開発者がシンプルなAPIを使用してAIモデルを簡単にデプロイできるAIクラウドプラットフォームであり、同時に手頃で信頼性の高いGPUクラウドを提供して、構築とスケーリングを支援します。