AI 性能監控 (AI Observability)

讓 AI 系統由黑盒轉為可觀測。追蹤請求、日誌、延遲、錯誤與流程狀態，協助團隊分析問題和持續改善。

探索監控能力

AI 可觀測性核心能力

整合指標、日誌與流程追蹤，協助團隊理解 AI 系統行為，建立排查與改善依據。

Metrics

系統指標監控

追蹤 AI 系統運行指標，掌握性能變化、錯誤與異常趨勢。

推論延遲與資源使用監測
錯誤率與行為變化追蹤
自定義業務與模型指標

Logs

互動日誌記錄

按資料政策記錄必要互動資料，支援問題排查、回溯分析與審計需求。

記錄必要輸入、回應與中繼資訊
支援關鍵字與異常搜尋
可配置保存週期與遮罩規則

Traces

流程與推論追蹤

追蹤多步驟 AI 任務流程，協助分析延遲、錯誤與依賴關係。

Agent 與流程執行路徑可視化
分析各步驟耗時與依賴關係
協助定位流程中的異常節點

Storage

觀測數據集中管理

整合指標、日誌與追蹤數據，支援查詢與歷史分析。

多類型數據統一管理
支援高效查詢與回溯分析
靈活的數據保存與分層策略

Visualization

監控與分析看板

透過儀表板呈現系統狀態，協助團隊分析問題、趨勢與改善方向。

監控系統與模型表現
趨勢分析與異常檢測
支援跨維度數據分析

Deployment

私有化部署與數據安全

可按企業要求選擇部署與資料保留方式，控制觀測數據的存取與使用範圍。

支援本地與私有雲部署選項
可配置資料保留與遮罩策略
可控的數據存取與保留策略

AI Observability

觀測 AI 系統運行狀態

集中追蹤指標、日誌與推論流程，讓 AI 系統由黑盒轉為可觀測，協助團隊理解系統狀態與排查問題。

指標監測（Metrics）： 追蹤延遲、錯誤率與系統資源使用情況
日誌記錄（Logs）： 按資料政策記錄必要內容，支援問題回溯
流程追蹤（Traces）： 觀測多步驟推理與任務流程，協助定位問題節點

Deep Analysis

問題定位與行為分析

透過指標與流程追蹤數據，分析 AI 系統行為與異常線索，協助團隊進行排錯與優化。

數據關聯分析： 結合 Metrics 與 Traces，還原系統運行全貌
問題定位（RCA）： 追蹤每次推論流程，找出錯誤與異常來源
持續優化支援： 根據分析結果調整 Prompt 與模型設定

應用場景

支援 AI 系統的監控、排錯與改善，協助團隊建立可追蹤的運行依據

Reliability

系統穩定性與效能監控

持續觀察 AI 系統運行狀態，支援穩定性與效能分析。

追蹤延遲、錯誤率與資源使用
識別效能波動與異常
分析長期運行趨勢

Troubleshooting

問題排查與行為分析

透過日誌與追蹤資料還原 AI 系統行為，協助定位錯誤與異常。

搜尋與分析歷史對話與輸出
識別錯誤模式與異常情況
還原問題發生過程

Workflow Analysis

AI 流程與推論追蹤

追蹤多步驟 AI 流程，分析每個環節的執行與效能。

可視化請求與流程路徑
分析各步驟延遲與依賴
定位流程中的瓶頸與錯誤

Platform

統一觀測與管理平台

整合不同來源的觀測數據，提供統一的監控與分析入口。

整合指標、日誌與追蹤數據
建立跨系統監控視圖
支援團隊協作與決策

導入流程

從觀測資料收集到問題分析，建立可追蹤的 AI 運行與排查流程

產生觀測數據

AI 系統在運行過程中產生指標（Metrics）、日誌（Logs）與流程追蹤（Traces）。

收集與整合數據

透過統一機制收集不同來源數據，並按資料政策設定欄位、遮罩與保存方式。

儲存與查詢分析

將數據集中管理，支援查詢、關聯分析與歷史回溯。

監控與問題定位

透過儀表板與分析工具觀察系統狀態，協助發現異常並定位問題。

常見問題

了解 AI 可觀測性如何協助您監控系統並建立排查依據

系統會收集哪些數據？

可收集 AI 運行過程中的指標（Metrics）、日誌（Logs）與流程追蹤（Traces）。實際欄位會按業務需要、資料敏感度與保存政策配置。

可以觀測哪些系統層面？

可觀測系統效能（延遲、錯誤率）、AI 回應內容，以及多步驟流程中的執行狀態。

數據是否需要傳送到外部服務？

不一定。可按企業要求選擇本地、私有雲或其他受控部署方式，並設定觀測資料的存取、保留與傳輸規則。

是否可以整合現有 AI 系統？

可以。可透過 SDK、API 或既有日誌管道接入不同 AI 應用，逐步統一收集觀測數據。

出現問題時如何協助排查？

透過指標、日誌與流程追蹤數據，協助團隊比對錯誤、延遲、請求路徑與上下文，縮短排查時間。

如何查看系統狀態？

可透過儀表板查看系統指標、趨勢與異常線索，並按團隊角色配置不同視圖。

如何處理敏感資料？

可設定敏感資料遮罩、欄位過濾、保存週期與存取權限，避免不必要地保留完整輸入或輸出內容。

從一個 AI 系統開始建立觀測能力

先釐清需要追蹤的指標、日誌與流程，再建立可排查、可改善的 AI 運行依據。

預約初步諮詢