向量資料庫選型：Pinecone、Weaviate、Qdrant 與 ChromaDB 比較

核心概念

向量資料庫是專為儲存和檢索高維度向量而設計的資料庫，是 RAG 檢索增強生成架構的核心儲存層。與傳統關聯式資料庫的精確比對不同，向量資料庫執行「近似最近鄰」（Approximate Nearest Neighbor，ANN）搜尋——找出語意上最接近的文件，而非完全相符的字串。

為什麼需要向量資料庫？

傳統關聯式資料庫無法高效支援高維度向量查詢。一個典型的嵌入向量有 768 到 1536 個維度，要在數百萬筆記錄中找出「距離最近」的幾筆，暴力搜尋的計算成本無法接受。向量資料庫使用特殊索引結構（最常見是 HNSW，Hierarchical Navigable Small World）在毫秒內完成近似搜尋。

關鍵技術概念

HNSW：層次化可導航小世界圖，建立多層圖結構讓查詢從稀疏的上層圖開始，逐步收斂至密集的底層精確結果，兼顧速度與召回率
Pre-filtering vs Post-filtering：元資料過濾的時機。Pre-filtering（先過濾再向量搜尋）精確度更高；post-filtering（先向量搜尋再過濾）可能遺漏目標文件
Hybrid Search：結合向量相似度與 BM25 關鍵字搜尋，解決語意搜尋對低頻術語的弱點
Namespace / Collection：多租戶隔離機制，讓不同用戶或專案共用同一資料庫實例

關鍵要點

資料庫	架構	過濾方式	特色	適用場景
ChromaDB	Python-native，嵌入式	Post-filtering	零配置啟動，開發者體驗最佳	原型開發、1000 萬向量以內
Qdrant	Rust，獨立服務	Pre-filtering	效能可預測，複雜過濾最強	生產環境、複雜元資料過濾
Pinecone	全託管 SaaS	—	零運維，整合生態豐富	無 DevOps 資源的團隊
Weaviate	開源，GraphQL	混合	原生 Hybrid Search，多模態	明確需要混合搜尋或多模態

選型決策樹

快速驗證概念 → ChromaDB（本地嵌入，pip install 即可）
資料量超過 500 萬或需要複雜元資料過濾 → Qdrant
完全不想管基礎設施 → Pinecone（成本較高，5M+ 向量約 $500–1500/mo）
必須同時支援向量搜尋 + 全文搜尋 → Weaviate 或 Qdrant（兩者皆支援 Hybrid Search）

成本比較（自托管 vs 托管雲）

ChromaDB：自托管 < $30/月，無官方托管服務
Qdrant：自托管 $30–50/月，托管雲 $100–300/月
Pinecone：$50/月起，大規模時 $500–1500/月
Weaviate：自托管 $50–100/月，托管雲 $150–400/月

Qdrant 的技術優勢

Qdrant 使用 Rust 編寫，記憶體安全且延遲可預測。其 Pre-filtering 實作是主流向量資料庫中最完整的——可在向量搜尋執行前，對日期、文件類型、地理位置等欄位做複合過濾，不會犧牲召回率。這對法律、醫療、金融等有精確文件範圍需求的 RAG 應用特別關鍵。

實務應用

RAG 系統的典型資料流

文件切塊（chunking）→ 呼叫嵌入模型 → 得到向量
將（向量 + 原始文字 + 元資料）存入向量資料庫
使用者查詢 → 同一嵌入模型轉向量 → 向量資料庫 ANN 搜尋 → 取回 top-k 文件
將文件作為 context 注入 LLM prompt

部署建議

開始用 ChromaDB 本地驗證整個 pipeline，不需要跑 server
上線前先用真實資料測試 Qdrant（Docker 一行啟動：docker run -p 6333:6333 qdrant/qdrant）
若有多個微服務需要存取同一向量庫，必須改用 client-server 模式（Qdrant 或 Weaviate），不能繼續用 ChromaDB 的嵌入模式

延伸觀點

pgvector 的崛起

PostgreSQL 的 pgvector 擴充套件正在成為向量資料庫的第四條路：在既有的 PostgreSQL 實例中直接支援向量搜尋。對於已有 PostgreSQL 基礎設施的團隊，pgvector 可以避免引入新服務——但在千萬向量規模下，召回率和延遲不如原生向量資料庫。ZenML 與 4xxi 兩篇比較研究均提及 pgvector 作為「不想多一個服務」情境的折衷方案。

Sparse + Dense Hybrid 是生產標配

多篇比較研究確認，單純向量搜尋對低頻術語（如產品代碼、專有名詞）召回率差。Qdrant 的 Sparse + Dense 混合向量（結合 BM25 稀疏向量與語意密集向量）是目前生產環境準確度最高的方案，已成為 2025–2026 年 RAG 系統的新標準配置，Weaviate 也以原生 Hybrid Search 跟進支援此需求。

反向連結

以下頁面引用了本頁：

嵌入模型基礎與選型（技術與AI）
RAG 檢索增強生成架構（技術與AI）
後端資料庫基礎概念（技術與AI）
RAG 三路選型：Naive、Agentic 與 GraphRAG（技術與AI）