ベクトル検索
ベクトル検索とは、文章を「意味を表す数値の配列(ベクトル)」に変換して、意味が近い文書を探す検索方式。キーワード一致ではなく「意味の近さ」で検索できるのが特徴で、RAGの中核技術です。
ベクトル検索
ひと言で: 言葉を「意味の数値」に変換して、似た意味の文書を探す検索です。
ベクトル検索とは
ベクトル検索(Vector Search / Semantic Search)は、テキストを 埋め込みモデル(Embedding Model) で数百〜数千次元の数値ベクトルに変換し、「ベクトル同士の距離」を測ることで意味的に近い文書を探す検索手法です。
例えば「車を買いたい」と「自動車購入」は、文字列としては全く違いますが、ベクトル空間上ではほぼ同じ位置に配置されるため、ベクトル検索なら意味的にヒットします。
従来の キーワード検索(全文検索) との違い:
- キーワード検索: 「車」と「自動車」は別物
- ベクトル検索: 「車」≒「自動車」≒「マイカー」と理解
なぜ重要か
RAGアーキテクチャの「検索」部分は、ほぼベクトル検索で実装されます。LLMが質問を受け取る → ベクトル化 → 関連文書をベクトル検索 → LLMに渡して回答生成、という流れです。LLMO観点では 自社コンテンツのベクトルが、ユーザー質問のベクトルと近づくような書き方 が重要になります。
例・具体例
- OpenAI の
text-embedding-3-smallで文書をベクトル化 - Pinecone、Weaviate、Qdrant、pgvector などのベクトルDBに格納
- ユーザー質問もベクトル化し、コサイン類似度で上位N件を取得
初心者向けまとめ
- ベクトル検索 = 意味の近さで検索する方式
- 文字列一致ではなく意味的類似度
- RAGの中核技術
関連用語
もっと詳しく
関連用語
- AI Overview(AIオーバービュー)
AI Overviewとは、Google検索結果の最上部にAI(Gemini)が要約回答を表示する機能。2024年5月から米国で本格導入され、2024年8月以降日本を含む各国に拡大。SEO/LLMOの最重要トピックです。
- AEO(Answer Engine Optimization)
AEOとは「Answer Engine Optimization(回答エンジン最適化)」の略。フィーチャードスニペット・音声検索・AI回答など、ユーザーの質問に直接答える形式の検索結果に最適化する取り組みです。
- SGE(Search Generative Experience)
SGEとは「Search Generative Experience(検索生成体験)」の略で、Googleが2023年に発表した生成AI検索の実験名。2024年5月にAI Overviewへリブランドされ、現在はSGE = AI Overviewと考えてOKです。
- LLM(大規模言語モデル)
LLMとは「Large Language Model(大規模言語モデル)」の略で、膨大なテキストデータで学習された巨大なAIモデル。ChatGPT、Gemini、Claudeなどの中身がLLMで、現代の生成AIの中核技術です。