🧠
AI 輔助 QA
用 LLM 生 test case、視覺迴歸 AI、Prompt 範本
📚 全部文章(6)
AI Agent 系統測試 — 自主執行 / 工具呼叫 / 多步推理的 QA 策略
測試 AI Agent 完整方法。Tool calling 驗證、Trajectory 評估、Failure mode 分類、無限迴圈防止、成本上限、安全 sandbox、Multi-agent 協作測試。
AI 共存的 QA 工具箱 — Copilot / Claude / ChatGPT 怎麼用、什麼不該用
QA 工程師的完整 AI 工具地圖。Coding Copilot、LLM Chat、AI 視覺迴歸、AI debugger、自動 PR review 各自適合什麼。實戰 workflow + 限制 + 紅線。
LLM Evaluation Testing — 怎麼測 AI 是不是真的對?評估指標完整指南
LLM 系統評估完整方法。Eval set 設計、4 種自動評估指標(BLEU/ROUGE/Embedding/LLM-as-judge)、Human review 流程、回歸防漂移、CI 整合。
RAG 系統測試 — Retrieval / Augmentation / Generation 三層完整 QA 流程
RAG (Retrieval-Augmented Generation) 系統完整測試指南。Retrieval 評估(recall/precision)、Chunking 策略測試、Citation 驗證、幻覺偵測、知識庫漂移。
用 LLM 跑 Spec Review — 兩段式 Prompt 把模糊需求釣出來
把 Spec review checklist 工具化。用 Claude / ChatGPT 兩段式 prompt 先列「需澄清」、再列「邊界與漏洞」,配合人工判讀流程。
用 LLM 生 Test Case — Prompt 範本、品質檢核、實務踩雷
把 Claude / ChatGPT 變成測試案例產生器。從 spec 到 test case 的 prompt 範本、輸出品質檢核、什麼能交給 AI、什麼不能。