核心概念
向量資料庫是專為儲存和檢索高維度向量而設計的資料庫,是 RAG 檢索增強生成架構 的核心儲存層。與傳統關聯式資料庫的精確比對不同,向量資料庫執行「近似最近鄰」(Approximate Nearest Neighbor,ANN)搜尋——找出語意上最接近的文件,而非完全相符的字串。
為什麼需要向量資料庫?
傳統關聯式資料庫 無法高效支援高維度向量查詢。一個典型的嵌入向量有 768 到 1536 個維度,要在數百萬筆記錄中找出「距離最近」的幾筆,暴力搜尋的計算成本無法接受。向量資料庫使用特殊索引結構(最常見是 HNSW,Hierarchical Navigable Small World)在毫秒內完成近似搜尋。
關鍵技術概念
- HNSW:層次化可導航小世界圖,建立多層圖結構讓查詢從稀疏的上層圖開始,逐步收斂至密集的底層精確結果,兼顧速度與召回率
- Pre-filtering vs Post-filtering:元資料過濾的時機。Pre-filtering(先過濾再向量搜尋)精確度更高;post-filtering(先向量搜尋再過濾)可能遺漏目標文件
- Hybrid Search:結合向量相似度與 BM25 關鍵字搜尋,解決語意搜尋對低頻術語的弱點
- Namespace / Collection:多租戶隔離機制,讓不同用戶或專案共用同一資料庫實例
關鍵要點
| 資料庫 | 架構 | 過濾方式 | 特色 | 適用場景 |
|---|---|---|---|---|
| ChromaDB | Python-native,嵌入式 | Post-filtering | 零配置啟動,開發者體驗最佳 | 原型開發、1000 萬向量以內 |
| Qdrant | Rust,獨立服務 | Pre-filtering | 效能可預測,複雜過濾最強 | 生產環境、複雜元資料過濾 |
| Pinecone | 全託管 SaaS | — | 零運維,整合生態豐富 | 無 DevOps 資源的團隊 |
| Weaviate | 開源,GraphQL | 混合 | 原生 Hybrid Search,多模態 | 明確需要混合搜尋或多模態 |
選型決策樹
- 快速驗證概念 → ChromaDB(本地嵌入,pip install 即可)
- 資料量超過 500 萬或需要複雜元資料過濾 → Qdrant
- 完全不想管基礎設施 → Pinecone(成本較高,5M+ 向量約 $500–1500/mo)
- 必須同時支援向量搜尋 + 全文搜尋 → Weaviate 或 Qdrant(兩者皆支援 Hybrid Search)
成本比較(自托管 vs 托管雲)
- ChromaDB:自托管 < $30/月,無官方托管服務
- Qdrant:自托管 $30–50/月,托管雲 $100–300/月
- Pinecone:$50/月起,大規模時 $500–1500/月
- Weaviate:自托管 $50–100/月,托管雲 $150–400/月
Qdrant 的技術優勢
Qdrant 使用 Rust 編寫,記憶體安全且延遲可預測。其 Pre-filtering 實作是主流向量資料庫中最完整的——可在向量搜尋執行前,對日期、文件類型、地理位置等欄位做複合過濾,不會犧牲召回率。這對法律、醫療、金融等有精確文件範圍需求的 RAG 應用特別關鍵。
實務應用
RAG 系統的典型資料流
- 文件切塊(chunking)→ 呼叫 嵌入模型 → 得到向量
- 將(向量 + 原始文字 + 元資料)存入向量資料庫
- 使用者查詢 → 同一嵌入模型轉向量 → 向量資料庫 ANN 搜尋 → 取回 top-k 文件
- 將文件作為 context 注入 LLM prompt
部署建議
- 開始用 ChromaDB 本地驗證整個 pipeline,不需要跑 server
- 上線前先用真實資料測試 Qdrant(Docker 一行啟動:
docker run -p 6333:6333 qdrant/qdrant) - 若有多個微服務需要存取同一向量庫,必須改用 client-server 模式(Qdrant 或 Weaviate),不能繼續用 ChromaDB 的嵌入模式
延伸觀點
pgvector 的崛起
PostgreSQL 的 pgvector 擴充套件正在成為向量資料庫的第四條路:在既有的 PostgreSQL 實例中直接支援向量搜尋。對於已有 PostgreSQL 基礎設施的團隊,pgvector 可以避免引入新服務——但在千萬向量規模下,召回率和延遲不如原生向量資料庫。ZenML 與 4xxi 兩篇比較研究均提及 pgvector 作為「不想多一個服務」情境的折衷方案。
Sparse + Dense Hybrid 是生產標配
多篇比較研究確認,單純向量搜尋對低頻術語(如產品代碼、專有名詞)召回率差。Qdrant 的 Sparse + Dense 混合向量(結合 BM25 稀疏向量與語意密集向量)是目前生產環境準確度最高的方案,已成為 2025–2026 年 RAG 系統的新標準配置,Weaviate 也以原生 Hybrid Search 跟進支援此需求。
反向連結
以下頁面引用了本頁:
- 嵌入模型基礎與選型(技術與AI)
- RAG 檢索增強生成架構(技術與AI)
- 後端資料庫基礎概念(技術與AI)
- RAG 三路選型:Naive、Agentic 與 GraphRAG(技術與AI)