更新日: 2026.04.09

【保存版】プロンプト？言及率？RAG？生成AIに関する用語をわかりやすく解説！

生成AIの話題は、技術部門だけでなく経営会議や業務改善の場にも広がりました。しかし、LLM・RAG・グラウンディング・言及率など似た言葉が多く、人によって使い方がばらばらなまま会話が進むことも少なくありません。この記事では、生成AIの基礎から実務で増えている評価指標まで、混同しやすい用語を整理します。

1 生成AIの基本用語:まず何を知ればよいか
2 プロンプトとは何か、関連用語をまとめて整理する
3 RAGとグラウンディングはどう違うのか
4 AI検索時代に登場した新しい指標を理解する
5 用語を理解することが、生成AI活用の第一歩になる

生成AIの基本用語:まず何を知ればよいか

生成AIの用語は、まだ整理しきれていない部分が多い分野です。同じ概念に複数の呼び方が存在したり、使う人や文脈によって意味の範囲が微妙に違ったりすることがあります。たとえばLLMOはGEO・AEOとほぼ同じ意味で使われることがありますし、「エージェント」という言葉も文脈によって指す範囲が変わります。技術の進化が速く、新しい用語が次々と生まれているため、今の時点での定義が数年後に変わっていることも珍しくありません。

こうした状況への対応として大切なのは、一つひとつの用語を完璧に覚えようとするより、概念の関係性を理解しておくことです。「この言葉は何と対になっているか」「上位概念は何か」を意識するだけで、新しい用語が出てきたときにも対応しやすくなります。LLM・トークン・コンテキストウィンドウといった基礎概念は、導入コストや実運用の設計にも直結するため、まずここを押さえておくと全体の見通しがよくなります。

生成AI:新しいコンテンツをつくるAIの総称

生成AIとは、文章・画像・音声・動画・コードなど、新しいコンテンツを生み出すAIの総称です。従来のAIが分類・予測・検知を主な用途としていたのに対し、生成AIは学習したパターンをもとに新しい出力を作る点が異なります。

「生成AI＝チャットAI」と捉えられがちですが、チャットUIはあくまで使い方の一つです。問い合わせ対応・議事録要約・社内文書検索・コード補助など活用範囲は広く、「予測・分類をしたいのか、文章や画像を生成したいのか」を区別するだけでも、社内の議論が整理しやすくなります。

LLM:文章の生成・要約・質問応答を得意とする言語モデル

LLMはLarge Language Modelの略で、大規模言語モデルと訳されます。大量のテキストデータをもとに学習しており、文章生成・要約・翻訳・質問応答・分類・抽出といった処理が得意領域です。

生成AIとLLMは同義ではありません。生成AIがより広い概念で、その中にテキスト処理を中心とするLLMが含まれます。さらにLLMよりも広い「基盤モデル」という概念もあり、こちらはテキストに加えて画像・音声・動画も扱います。

実務では「ChatGPTやGeminiの裏側にある頭脳」のように使われることが多く、モデルごとに文脈理解・速度・コスト・長文処理能力が異なります。導入検討では「どのサービスを使うか」だけでなく、どのモデルをどの用途に使うかという視点も重要です。

トークン:料金や処理上限に直結するテキストの処理単位

トークンとは、モデルがテキストを処理するときの最小単位で、英語では単語の一部、日本語では文字や語の断片のような単位に分割されます。単純な文字数とは異なり、言語・記号・コードで増え方も変わります。

なぜ重要かというと、料金と処理上限の両方がトークン数で決まるからです。長い資料を丸ごと渡すとコストが上がり、会話履歴が積み重なると処理が重くなるのも、トークン数が増えていることが原因です。コストの感覚をつかむうえで、まず押さえておきたい概念といえます。

コンテキストウィンドウ:モデルが一度に扱えるトークンの上限値

コンテキストウィンドウとは、モデルが1回のやりとりで処理できるトークン数の上限です。AIが一度に机の上に広げて見られる情報量、とイメージすると直感的です。

上限が大きいほど長い資料や会話履歴を扱いやすくなりますが、上限を超えると一部の情報が処理できなくなります。「資料を全部貼り付ければすべて理解してくれる」という思い込みは多いですが、文書が長すぎると重要情報が埋もれたり、コストが増えたりすることがあります。後述するRAGや要約前処理が必要になる背景には、このコンテキストウィンドウの制約があります。

プロンプトとは何か、関連用語をまとめて整理する

プロンプト・システムプロンプト・プロンプトエンジニアリングは、どれも生成AIへの入力設計に関わる言葉ですが、それぞれ役割が異なります。実務では混用されがちなため、区別して理解しておくことが重要です。

プロンプト:モデルへの指示文

プロンプトとは、モデルに対して与える指示文・質問文・文脈情報のことです。役割設定・目的・条件・出力形式・参照情報まで含めた設計要素として扱うのが実務では正確です。

たとえば「この会議録を要約して」よりも「あなたは事業企画担当として、以下の会議録から意思決定事項・未決事項・次回アクションを抽出してください」のように書くと、出力が安定します。生成AIの品質はモデル性能だけでなく、どんな前提でどんな形式で依頼するかに大きく左右されます。

システムプロンプト:AIの役割や制約をあらかじめ定める設定

システムプロンプトは、ユーザーの都度入力とは別に、モデルの役割や制約をあらかじめ定める指示です。「あなたは法務アシスタントとして振る舞う」「不明な事項は断定せず確認を促す」といったルールを、ユーザーの質問とは別の層で設定します。

「同じ質問をしたのにサービスによって答え方が違う」と感じたことがあれば、このシステムプロンプトが影響しています。回答の口調・安全性・出力形式・禁止事項はここで規定されており、企業向けAIアシスタントでは業務ルールやコンプライアンス条件もここで設定します。

プロンプトエンジニアリング:再現性のある指示を設計するプロセス

プロンプトエンジニアリングとは、モデルから望ましい出力を安定して得るために、指示の与え方を設計・改善するプロセスです。一発で完璧な入力を作ることではなく、誰が書いても同じ品質を維持できる指示を設計することが本質です。

AIに仕事を依頼する手順を標準化する取り組みだと捉えると、組織での活用に結びつきやすくなります。明確で具体的な指示・役割設定・Few-shotの活用・構造化・パラメータ調整といった手法が、Google CloudやOpenAIのガイドでも推奨されています。

ゼロショット・Few-shot・CoT:例示の量と思考の誘導による使い分け

ゼロショットは例を見せずに指示だけで答えさせる方法、Few-shotは少数の例を示して出力パターンを学ばせる方法です。出力形式を安定させたいタスクにはFew-shotが有効で、理想的な入出力例を2～3件示すと期待される型をつかみやすくなります。シンプルな質問応答ではゼロショットから試すのが基本です。

CoTはChain of Thoughtの略で、思考手順を段階的にたどらせる考え方です。Few-shotが「例をどれだけ見せるか」の話であるのに対し、CoTは「考え方をどう段階化するか」の話で、両者は別の概念です。複雑なタスクでは、一気に答えさせるより手順を分けて考えさせることで精度が上がる場面があります。

Temperature:出力のランダム性を調整する設定値

Temperatureとは、モデルの出力のランダム性を調整する設定値です。値が高いほど出力が多様になりやすく、低いほど焦点の定まった出力になりやすい特性があります。

「創造性を高める設定」として紹介されることもありますが、より正確には「出力のばらつきを調整する設定」です。企画の案出しには高め、社内FAQ・議事録要約・情報抽出には低めが向いています。モデルの賢さを変えるのではなく、同じモデルの出力の揺れ幅を調整するものだと理解すると、用途に応じた使い分けがしやすくなります。

RAGとグラウンディングはどう違うのか

「RAGとグラウンディングは同じでは？」という疑問は実務でよく出ます。この2つは役割の粒度が異なります。違いを理解しておくと、社内文書を活用した生成AIの設計で判断がしやすくなります。

グラウンディング:回答を根拠ある情報源に結びつける考え方

グラウンディングとは、生成AIの出力を検証可能な情報源に結びつけることです。特定のデータソースへのアクセスにより内容の捏造を減らし、正確性・信頼性を高められます。

グラウンディングは特定の技術名ではなく、根拠づけ全般を表す考え方です。Google Search・社内文書・Vertex AI Searchなど、実現方法は複数あります。企業に必要なのは「それっぽい文章」ではなく、業務文脈に合い根拠をたどれる回答です。社内規程・商品情報・FAQ・法令のどれに結びつけるかを考えることが、AI活用設計の出発点になります。

RAG:グラウンディングの代表的な実装手法

RAGはRetrieval-Augmented Generationの略で、検索拡張生成と訳されます。外部データを検索してからその内容を踏まえて回答を生成させる仕組みで、グラウンディングを実現する代表的な手法の一つです。

社内文書やFAQは日々更新されるため、モデルへの再学習は非効率です。RAGなら必要な文書を都度参照するため、最新情報を反映しやすく導入負荷も抑えやすい利点があります。ただし、検索で取ってくる文書がずれれば回答もずれます。検索の精度と生成の精度、両方に支えられた仕組みだという点を理解しておくことが重要です。

エンベディングとベクトル検索:RAGの検索精度を支える仕組み

エンベディングとは、テキストや画像などのデータを、意味の近さが反映される数値ベクトルに変換したものです。ベクトル検索は、そのエンベディング同士の距離をもとに関連情報を探す検索方法です。

通常のキーワード検索では、表現が異なると関連文書を取りこぼしやすくなります。たとえば「解約率を下げたい」と「チャーンを抑えたい」は意味が近くても文字が一致しないため、キーワード検索では引っかかりにくいことがあります。エンベディングを使うと意味の近さを数値的に扱えるため、こうした取りこぼしを減らせます。RAGの精度はLLMだけでなく、候補文書の関連度を再評価する再ランキングも含めた検索設計全体に依存します。

ファインチューニング:RAGとは目的が異なるモデル調整の手法

ファインチューニングとは、既存のモデルに追加学習を行い、特定用途に合わせて振る舞いを調整する手法です。RAGが「知識を外から持ってくる方法」であるのに対し、ファインチューニングは「モデルの癖そのものを変える方法」です。

頻繁に更新される情報を答えさせたいならRAG、特定の文体に揃えたい・分類基準を安定させたいならファインチューニングが候補になります。どちらが優れているかではなく、課題によって使い分けるものであり、組み合わせて使うこともあります。

AI検索時代に登場した新しい指標を理解する

2024年以降のAI Overviews普及にともない、検索での可視性を測る軸が変化しています。従来の「順位」では見えない評価指標として、言及率・引用率・AIシェア・オブ・ボイスが実務で使われ始めています。

AI Overviews:「上位表示＝流入」の前提を変えたGoogleの新機能

AI Overviewsは、Google検索結果の上部でAIが要約的な回答を提示する機能です。2024年5月に一般提供が始まり、同年10月には100以上の国・地域へ、2025年には200以上の国・地域へ拡大しています。

この変化によって、ユーザーが上位サイトを順番に読む前に、まずAIの要約を見る場面が増えています。Google Search Centralも、ユーザーがより複雑な質問をするようになり、Web上の情報への接続のされ方が変化していると説明しています。「検索上位に出ればアクセスが増える」という従来の前提が揺らぎ、「AIが自社をどう扱うか」が新たな論点になったことで、言及率・引用率・AIシェア・オブ・ボイスといった指標が注目されるようになりました。

言及率:AI回答に自社名が登場する頻度の指標

言及率とは、AIが生成した回答の中で自社名・ブランド名・サービス名がどの程度登場するかを表す指標です。Googleの公式用語ではなく、AI検索・LLMO（Large Language Model Optimization）・GEOの文脈で広がった実務指標です。

「おすすめのMAツールは？」「法人向けチャットボット比較」といったカテゴリクエリに対して、AI回答に自社名が何回出てくるかを追跡するイメージです。AI時代の想起・露出の近似指標として使われますが、好意的な言及なのか、単に名前が出ただけなのか、根拠元として参照されたのかは言及率だけでは判断できません。後述の引用率とあわせて見ることが重要です。

引用率:AI回答で自社サイトが根拠として参照される頻度の指標

引用率とは、AI回答の中で自社サイトや自社コンテンツが根拠ソースとして参照される割合です。言及率が名前の露出を見るのに対し、引用率は根拠として使われたかという信頼性・参照性を見ます。

AI回答に自社名が出ていても、根拠として使われているのが競合メディアばかりであれば、自社コンテンツが情報源として評価されていない可能性があります。逆に自社サイトが繰り返し引用されるなら、AIにとって信頼できる情報源として扱われているとみることができます。

AIシェア・オブ・ボイス:AI回答全体での自社の存在感を競合と比較する指標

AIシェア・オブ・ボイスとは、特定のテーマやカテゴリに関するAI回答全体の中で、自社がどれだけ存在感を持つかを示す指標です。従来のシェア・オブ・ボイスが広告・SNS・検索結果での露出比率を見ていたのに対し、こちらは生成AIやAI検索回答での言及・引用の比率を見ます。

言及率・引用率が個別クエリ単位の評価に向くのに対し、AIシェア・オブ・ボイスは複数クエリを束ねてカテゴリ全体での立ち位置を把握する、より戦略レベルの指標です。計測方法はツールや運用会社によって異なるため、現時点では「業界共通の標準指標」というより、AI検索・LLMO時代の可視性を把握するための実務指標として捉えておくのが適切です。

LLMO:AIに最適化された情報発信の考え方

LLMO（Large Language Model Optimization）とは、生成AIやAI検索に自社の情報を適切に認識・引用してもらうための最適化の取り組みです。GEO（Generative Engine Optimization）、AEO（Answer Engine Optimization）も同様の概念を指す言葉で、使う人や文脈によって呼び方が異なりますが、意味はほぼ重なります。

従来のSEOが検索エンジンのランキングアルゴリズムに対して最適化するものだとすれば、LLMOはAIが回答を生成する際に自社情報を参照・引用しやすい状態をつくることを目的としています。構造化された一次情報を発信する、信頼性の高いコンテンツを整備するといった取り組みが、LLMOの実践として注目されています。

エージェント機能:AIが自律的にタスクを実行する仕組み

エージェント機能とは、ユーザーが一つひとつ指示を出さなくても、AIが目標に向けて自律的に複数のステップを実行する仕組みです。たとえば「競合調査レポートを作って」という指示に対して、情報の検索・整理・要約・出力までを自動でこなすといった動作が、エージェント機能の典型です。

単に質問に答えるだけのチャットAIと異なり、外部ツールやAPIを呼び出しながら複数のタスクを連続して処理できる点が特徴です。生成AIの活用が「文章を作る」段階から「業務を動かす」段階へ広がるなかで、最も注目されている概念の一つです。

構造化データ:AIに情報を正確に伝えるためのデータ形式

構造化データとは、定められた形式やルールに沿って整理されたデータのことです。Webページにおいては、検索エンジンやAIがコンテンツの内容・種類・関係性を正確に読み取れるよう、JSON-LDやスキーマ（Schema.org）の形式でページの情報を記述する手法を指します。

LLMO・AI検索最適化の文脈では、構造化データを適切に実装することで、AIが自社コンテンツを正確に理解しやすくなると考えられています。よく使われるスキーマには、FAQPage・HowTo・Article・Organizationなどがあり、コンテンツの種類に応じて設定します。

API連携:外部サービスと生成AIをつなぐ接続の仕組み

API（Application Programming Interface）連携とは、異なるシステムやサービスをプログラム的に接続するための仕組みです。生成AIの文脈では、OpenAIやGoogleなどが提供するAPIを通じて、社内システムや既存ツールと生成AIを組み合わせることを指します。

たとえば、CRMシステムと生成AIをAPI連携することで、顧客データをもとに自動でメール文章を生成する、社内のデータベースに生成AIからアクセスして情報を引き出すといった活用が可能になります。エージェント機能を実装する際にも、API連携は中心的な技術要素です。

Gem:Geminiのカスタムアシスタント機能

GemはGoogleのGeminiに搭載されている、カスタムアシスタントを作成・保存する機能です。特定の役割・指示・参照情報を設定したAIアシスタントをあらかじめ作っておけるため、毎回同じプロンプトを書く手間を省けます。

たとえば「このプロジェクトの背景を理解した上で資料のフィードバックをする担当者」「特定のトーンで文章を書くライティングアシスタント」のように、用途ごとのGemを設定しておくと作業効率が上がります。OpenAIのカスタムGPTs（GPTsビルダー）に相当する機能です。

Deep Search:AIが深く調査して回答を生成する検索機能

Deep Searchは、Googleが提供するAIによる深掘り検索機能です。通常の検索やAI Overviewsよりも多くの情報源を参照し、複数の角度から調査・整理した上で詳細な回答を生成します。複雑な調査タスクや、複数の観点を比較・統合する必要がある質問に向いています。

同様の深掘り型AI検索機能として、OpenAIのDeep Researchなども登場しており、「情報を調べてまとめる」作業をAIが代行する形のサービスが広がっています。業務での情報収集・調査フローが変わりつつある領域として注目されています。

用語を理解することが、生成AI活用の第一歩になる

生成AIの用語は多いですが、全部を同じ重さで覚える必要はありません。仕組みを表す基礎、入力設計に関わるもの、精度向上に関わるもの、AI検索時代の評価指標と、層ごとに整理して押さえていくと理解が進みます。

用語の違いがわかるだけで、ベンダーとの会話・社内説明・施策設計の精度は変わります。難しい技術をすべて習得することではなく、よく使う言葉を正しく使い分けられる状態になることが、生成AI活用の確かな第一歩です。

解析人材育成
収集
活用・分析
保守

解析人材育成

リテラシー講座

DX推進を内製化する上で最初の壁となる「AI・DX人材の不足」。オンライン化が前提となり、職種・役職問わず、全社員にデジタルリテラシーが求められています。講座受講により社内のリテラシーを高め、さらに現場視点のアイデアを吸い上げ収益化につなげます

【保存版】プロンプト？言及率？RAG？生成AIに関する用語をわかりやすく解説！

生成AIの基本用語:まず何を知ればよいか

生成AI:新しいコンテンツをつくるAIの総称

LLM:文章の生成・要約・質問応答を得意とする言語モデル

トークン:料金や処理上限に直結するテキストの処理単位

コンテキストウィンドウ:モデルが一度に扱えるトークンの上限値

プロンプトとは何か、関連用語をまとめて整理する

プロンプト:モデルへの指示文

システムプロンプト:AIの役割や制約をあらかじめ定める設定

プロンプトエンジニアリング:再現性のある指示を設計するプロセス

ゼロショット・Few-shot・CoT:例示の量と思考の誘導による使い分け

Temperature:出力のランダム性を調整する設定値

RAGとグラウンディングはどう違うのか

グラウンディング:回答を根拠ある情報源に結びつける考え方

RAG:グラウンディングの代表的な実装手法

エンベディングとベクトル検索:RAGの検索精度を支える仕組み

ファインチューニング:RAGとは目的が異なるモデル調整の手法

AI検索時代に登場した新しい指標を理解する

AI Overviews:「上位表示＝流入」の前提を変えたGoogleの新機能

言及率:AI回答に自社名が登場する頻度の指標

引用率:AI回答で自社サイトが根拠として参照される頻度の指標

AIシェア・オブ・ボイス:AI回答全体での自社の存在感を競合と比較する指標

LLMO:AIに最適化された情報発信の考え方

エージェント機能:AIが自律的にタスクを実行する仕組み

構造化データ:AIに情報を正確に伝えるためのデータ形式

API連携:外部サービスと生成AIをつなぐ接続の仕組み

Gem:Geminiのカスタムアシスタント機能

Deep Search:AIが深く調査して回答を生成する検索機能

用語を理解することが、生成AI活用の第一歩になる

解析人材育成

リテラシー講座

簡易企業診断サービス

収集

CC-BizMate

CC-Smart

WebNESTEE STAMP

BIコンサルティングサービス

groWiz

OCVS構築支援サービス

活用・分析

CC-Dash AI

小売業向け CC-Dash AI

BIコンサルティングサービス

Data Knowledge

BIスターターパックby Tableau / by Oracle Analytics Cloud

CC-MicView

ADB移行支援サービス

groWiz

保守

CC-Dashの保守サービス

BIサポート定額オプションサービス

DX推進提供サービス各バナー

執筆：CC-Dash編集部

新着記事

人気記事

DX推進提供サービス各バナー

カテゴリー

人気タグ

BIスターターパック
by Tableau / by Oracle Analytics Cloud