核心概念

向量資料庫是專為儲存和檢索高維度向量而設計的資料庫,是 RAG 檢索增強生成架構 的核心儲存層。與傳統關聯式資料庫的精確比對不同,向量資料庫執行「近似最近鄰」(Approximate Nearest Neighbor,ANN)搜尋——找出語意上最接近的文件,而非完全相符的字串。

為什麼需要向量資料庫?

傳統關聯式資料庫 無法高效支援高維度向量查詢。一個典型的嵌入向量有 768 到 1536 個維度,要在數百萬筆記錄中找出「距離最近」的幾筆,暴力搜尋的計算成本無法接受。向量資料庫使用特殊索引結構(最常見是 HNSW,Hierarchical Navigable Small World)在毫秒內完成近似搜尋。

關鍵技術概念

  • HNSW:層次化可導航小世界圖,建立多層圖結構讓查詢從稀疏的上層圖開始,逐步收斂至密集的底層精確結果,兼顧速度與召回率
  • Pre-filtering vs Post-filtering:元資料過濾的時機。Pre-filtering(先過濾再向量搜尋)精確度更高;post-filtering(先向量搜尋再過濾)可能遺漏目標文件
  • Hybrid Search:結合向量相似度與 BM25 關鍵字搜尋,解決語意搜尋對低頻術語的弱點
  • Namespace / Collection:多租戶隔離機制,讓不同用戶或專案共用同一資料庫實例

關鍵要點

資料庫 架構 過濾方式 特色 適用場景
ChromaDB Python-native,嵌入式 Post-filtering 零配置啟動,開發者體驗最佳 原型開發、1000 萬向量以內
Qdrant Rust,獨立服務 Pre-filtering 效能可預測,複雜過濾最強 生產環境、複雜元資料過濾
Pinecone 全託管 SaaS 零運維,整合生態豐富 無 DevOps 資源的團隊
Weaviate 開源,GraphQL 混合 原生 Hybrid Search,多模態 明確需要混合搜尋或多模態

選型決策樹

  1. 快速驗證概念 → ChromaDB(本地嵌入,pip install 即可)
  2. 資料量超過 500 萬或需要複雜元資料過濾 → Qdrant
  3. 完全不想管基礎設施 → Pinecone(成本較高,5M+ 向量約 $500–1500/mo)
  4. 必須同時支援向量搜尋 + 全文搜尋 → Weaviate 或 Qdrant(兩者皆支援 Hybrid Search)

成本比較(自托管 vs 托管雲)

  • ChromaDB:自托管 < $30/月,無官方托管服務
  • Qdrant:自托管 $30–50/月,托管雲 $100–300/月
  • Pinecone:$50/月起,大規模時 $500–1500/月
  • Weaviate:自托管 $50–100/月,托管雲 $150–400/月

Qdrant 的技術優勢

Qdrant 使用 Rust 編寫,記憶體安全且延遲可預測。其 Pre-filtering 實作是主流向量資料庫中最完整的——可在向量搜尋執行前,對日期、文件類型、地理位置等欄位做複合過濾,不會犧牲召回率。這對法律、醫療、金融等有精確文件範圍需求的 RAG 應用特別關鍵。

實務應用

RAG 系統的典型資料流

  1. 文件切塊(chunking)→ 呼叫 嵌入模型 → 得到向量
  2. 將(向量 + 原始文字 + 元資料)存入向量資料庫
  3. 使用者查詢 → 同一嵌入模型轉向量 → 向量資料庫 ANN 搜尋 → 取回 top-k 文件
  4. 將文件作為 context 注入 LLM prompt

部署建議

  • 開始用 ChromaDB 本地驗證整個 pipeline,不需要跑 server
  • 上線前先用真實資料測試 Qdrant(Docker 一行啟動:docker run -p 6333:6333 qdrant/qdrant
  • 若有多個微服務需要存取同一向量庫,必須改用 client-server 模式(Qdrant 或 Weaviate),不能繼續用 ChromaDB 的嵌入模式

延伸觀點

pgvector 的崛起

PostgreSQL 的 pgvector 擴充套件正在成為向量資料庫的第四條路:在既有的 PostgreSQL 實例中直接支援向量搜尋。對於已有 PostgreSQL 基礎設施的團隊,pgvector 可以避免引入新服務——但在千萬向量規模下,召回率和延遲不如原生向量資料庫。ZenML 與 4xxi 兩篇比較研究均提及 pgvector 作為「不想多一個服務」情境的折衷方案。

Sparse + Dense Hybrid 是生產標配

多篇比較研究確認,單純向量搜尋對低頻術語(如產品代碼、專有名詞)召回率差。Qdrant 的 Sparse + Dense 混合向量(結合 BM25 稀疏向量與語意密集向量)是目前生產環境準確度最高的方案,已成為 2025–2026 年 RAG 系統的新標準配置,Weaviate 也以原生 Hybrid Search 跟進支援此需求。

反向連結

以下頁面引用了本頁: