什麼是Chroma?
Chroma 是一個開源的 AI 搜尋基礎設施,專為現代人工智慧應用打造。它支援向量搜尋、全文檢索、正則表達式與元數據過濾,讓開發者能快速建構高效、準確的語意搜尋系統。無論你是在做聊天機器人、知識庫問答,還是文件檢索,Chroma 都能提供低延遲、高擴展性的解決方案。
最大的亮點在於 Chroma 採用無伺服器架構,並以物件儲存(如 S3 或 GCS)為基礎,自動進行資料分層與快取,大幅降低運營成本與複雜度。它不僅完全開源(Apache 2.0 授權),每月下載量超過 1500 萬次,還擁有超過 27,000 顆 GitHub 星星,深受全球開發者信賴。
Chroma的特色是什麼?
- 混合搜尋能力:同時支援向量搜尋(語意相似度)、稀疏向量(BM25/SPLADE)、全文檢索、正則表達式與元數據過濾,滿足多元檢索需求。
- 零運維擴展:自動根據流量與資料量擴展,無需手動調校,內建熱/溫/冷資料分層機制,查詢效能優異。
- 開源且免費:Apache 2.0 授權,無授權限制、無廠商綁定,可自由部署於本地或雲端。
- 高效能架構:基於 Rust 打造查詢引擎,支援每秒數千次寫入與讀取,p99 延遲僅 57 毫秒(10 萬筆向量下)。
- 集合分叉(Forking):支援快速複製資料集,方便進行 A/B 測試、版本迭代與實驗。
- 多語言支援:提供 Python、TypeScript 和 Rust 客戶端,整合簡單,上手快速。
- 企業級安全:支援 SOC 2 Type II 合規、客戶管理加密金鑰(CMK)、私有網路連線(如 AWS PrivateLink)與 BYOC(Bring Your Own Cloud)。
Chroma的使用案例有哪些?
- 建構企業內部知識庫問答系統,讓員工快速找到技術文件或政策說明。
- 為聊天機器人或 AI 助理提供即時、準確的上下文檢索能力。
- 自動化分析 GitHub 儲存庫內容,實現程式碼或文件的語意搜尋。
- 在電商平台中實現商品屬性與描述的混合檢索(例如:「紅色、防水、價格低於 1000 元」)。
- 支援學術研究中的大量文獻檢索與相關性排序。
- 為法律或醫療領域建立專業術語導向的文件檢索系統。
- 快速原型驗證新興 AI 應用,無需花費大量時間在基礎設施搭建上。
如何使用Chroma?
- 安裝 Chroma:使用
pip install chromadb(Python)或npm install chromadb(JavaScript)快速開始。 - 建立集合(Collection):定義你的資料結構,並選擇合適的嵌入模型(如 BM25 用於關鍵字,或 dense embedding 用於語意)。
- 新增文件:透過
collection.add()上傳文件、ID 與元數據。 - 執行混合搜尋:結合向量、全文與元數據條件,使用
collection.search()取得排序結果。 - 利用集合分叉功能測試不同嵌入策略或 chunking 方法,無需重複載入資料。
- 若需更高可用性與安全性,可升級至 Chroma Cloud 或部署企業版 BYOC 架構。









