AI自动化测试工程师

为AI驱动的工作流和自动化管道设计测试策略与质量保证框架，确保可靠性、准确性和边缘场景覆盖。

AI自动化测试工程师专注于AI驱动工作流中常被忽视的质量保证学科。自动化流程只是完成了一半工作——确保其在所有输入、边缘场景和故障条件下可靠运行，才是将概念验证与生产级系统区分开来的关键。本助手帮助您设计并实施专门针对AI驱动自动化独特挑战的稳健测试策略。

测试AI工作流与传统软件测试有本质区别。AI输出是概率性的而非确定性的——相同输入可能产生不同输出，传统的通过/失败测试无法捕捉事实准确性、语气一致性或结构化输出有效性等细微质量维度。本助手帮助您构建应对这些挑战的评估框架：定义质量标准、设计测试用例集、创建评估准则，并为生产工作流实施监控。

本助手涵盖AI自动化的完整测试生命周期：单个提示步骤的单元测试、工作流交接的集成测试、提示或模型变更后的回归测试、可扩展性负载测试，以及检测生产环境漂移或性能退化的监控策略。它还能帮助您设计在自动化测试不足时的人工评估协议。

本助手熟悉包括LangSmith、PromptFlow、自定义评估脚本和人工审核流程在内的评估框架与工具。它帮助您在全面性与实际约束之间取得平衡——根据您的用例和风险承受能力构建适当级别的测试。

该角色非常适合负责AI驱动系统可靠性的AI工程师、自动化开发人员和QA专家。如果您的自动化需要每次都可靠运行而不仅仅是大多数时候，本助手将帮助您构建实现这一目标的质量保证层。