什麼是Mezmo?
Mezmo 是一個專為 Agentic Ops(自主運維) 打造的 AI 驅動遙測數據平台,能將原始的日誌、指標與追蹤資料轉化為高價值的行動洞察。透過其核心技術 Active Telemetry(主動遙測),Mezmo 可在 AI 代理看到數據前,自動去除多達 99.98% 的雜訊,大幅節省推理成本並提升準確度。
搭配開源控制平面 AURA,Mezmo 不僅能快速偵測異常、精準定位根本原因,還能協調多個 AI 代理自動執行修復建議——全程支援人類審核把關,確保安全可靠。無論你是 SRE、平台工程師還是開發者,都能用 Mezmo 讓 AI 在生產環境中真正「看得懂、想得清、做得對」。
Mezmo的特色是什麼?
- Active Telemetry 主動遙測:即時去重、聚類並豐富遙測數據,將數百萬原始事件壓縮成千級別的高信噪比信號,節省高達 99.98% 的 LLM 處理成本。
- AURA 開源代理控制平面:基於 Apache 2.0 授權的 Rust 框架,支援多代理協作、人類審批閘道與完整審計追蹤,可部署於自有基礎設施。
- MCP 原生整合:無縫連接 PagerDuty、Datadog、Prometheus 等工具,並透過 Mezmo MCP 伺服器提供「情境化」而非原始數據,避免上下文窗口被雜訊淹沒。
- LLM 全相容架構:支援 OpenAI、Anthropic、Gemini、Bedrock、Ollama 等主流模型,前端可直接串接 LibreChat 或 OpenWebUI,無需額外適配程式碼。
- 預建 Agentic SRE 工作流:內建事件分級、根因分析(RCA)、修復建議等自動化流程,並可與現有 Runbook 整合,實現 <1 分鐘 MTTR。
- 靈活的 OTel 遷移路徑:支援 OpenTelemetry 數據路由至多個目的地(如 Grafana、Elastic、S3),助你逐步擺脫廠商綁定,降低觀測成本最高達 70%。
Mezmo的使用案例有哪些?
- 自動化事件分級與根因分析:當 PagerDuty 觸發警報時,AI 代理自動抓取情境化遙測數據,18 秒內鎖定問題根源(如組態錯誤導致連線飽和)。
- 多代理協同故障排除:由編排器協調「事件響應員」「指標分析師」「日誌分析師」三類專職代理平行作業,將平均修復時間(MTTR)從 15 分鐘縮短至 5 分鐘。
- Kubernetes 集群智能運維:AI 代理自動檢查工作負載狀態、查詢指標趨勢,協助快速診斷 Pod 崩潰或資源瓶頸。
- DevOps 助理自動審查 PR:整合 GitHub 與 Mezmo 日誌,自動分析程式碼變更對服務穩定性的潛在影響。
- 低成本觀測數據治理:先透過 Mezmo 控制遙測數據流向與成本,再逐步疊加 AI 能力,適合尚未準備好全面導入 Agentic Ops 的團隊。
如何使用Mezmo?
- 從 單一代理 開始:選擇「事件分級」「RCA」或「值班助理」任一場景,用 TOML 設定檔 1 小時內上線首個生產級代理。
- 連接 Mezmo MCP 伺服器:在 AURA 設定中加入
mcp.mezmo.com端點,即可取得已處理過的高品質信號,無需自建本地 MCP 伺服器。 - 啟用多代理編排:設定 orchestrator 與 worker 角色(如 metrics-analyst、log-analyst),並透過
turn_depth和 MCP 工具過濾確保執行安全。 - 整合現有框架:若使用 LangGraph、CrewAI 或 Temporal,只需將 Mezmo MCP 工具注入現有流程,立即提升代理推理效率。
- 利用向量儲存庫強化知識:將 SRE Runbook 存入 Qdrant 等向量資料庫,讓日誌分析代理能自動比對已知故障模式。









