第7届 AiDD峰会北京 |“AI+测试”线：智探前沿，革新测试新范式

2025-07-18

▼

在人工智能技术迅猛发展的当下，为了帮助企业在人工智能的浪潮中抓住机遇，“AI+研发数字峰会（AiDD）”应时而生，致力于协助企业利用AI技术深化计算机对现实世界的理解，推动研发进入智能化和数字化的新时代。AiDD峰会是兼具专业性、专注性、全面性与前瞻性的顶级 AI 数字峰会。

2025 AiDD北京站峰会共设五大条线，分别是“AI+开发”、“AI+测试”、“AI+领域”、“AI+效能”、“AI+技术前沿”线。其中“AI+测试”线精心策划了三大论坛，涵盖智能测试工具的开发与应用、蚂蚁专场：AGI时代下蚂蚁智能测试新范式以及大模型和AI应用评测，汇聚了众多AI领域的顶尖专家与前沿成果，包括蚂蚁集团、华为、百度、兴云数科、思码逸、Databricks 等企业的优秀实践案例，为参会者带来了一场思想碰撞与技术盛宴。

一、智能测试工具的开发与应用论坛：解锁测试新效能

本次论坛由华为智能化测试C-TMG主任、智能化测试专家万锐媛担任出品人。在她的引领下，多位行业佼佼者将带来精彩分享。

1.《AI赋能测试Agent：三大亮点驱动研发提效与质量跃升》

北京兴云数科测试领域负责人刘敏，将带来“AI赋能测试Agent：三大亮点驱动研发提效与质量跃升”的演讲。在研发过程中，效率与质量始终是关键指标。刘敏将深入剖析AI赋能测试Agent的独特优势，其三大亮点犹如三把利刃，精准切入研发痛点。通过AI技术，测试Agent能够实现更智能的任务分配、更精准的缺陷检测以及更高效的测试流程管理，从而显著提升研发效率，推动产品质量实现质的飞跃。这一分享将为测试人员提供全新的视角，助力他们在研发浪潮中抢占先机。

2.《面向API测试垂类应用的“专家”智能体与LLM工程优化》

思码逸创始人兼CEO任晶磊，聚焦“面向API测试垂类应用的‘专家’智能体与LLM工程优化”。API测试作为软件测试的重要环节，其准确性与效率直接影响着整个系统的稳定性。任晶磊将介绍如何打造面向API测试的“专家”智能体，这种智能体具备深厚的专业知识和丰富的实践经验，能够针对API测试的特殊需求进行精准操作。同时，结合大语言模型（LLM）工程优化，进一步提升测试的智能化水平，为API测试提供更可靠、更高效的解决方案。

3.《系统测试代码Agent的构建与应用实践》

华为云核心网测试工程师袁汉伟，将分享“系统测试代码Agent的构建与应用实践”。系统测试代码的编写与执行是确保软件系统正常运行的关键步骤。袁汉伟将详细介绍如何构建系统测试代码Agent，从代码的生成、优化到执行，每一个环节都融入了AI的智慧。通过实际应用案例，展示系统测试代码Agent在提高测试覆盖率、减少人工干预等方面的显著成效，为系统测试领域带来新的发展思路。

4.《Meta-Agent架构与语音业务测试落地实践》

百度资深测试开发工程师杨青霖，带来“Meta-Agent架构与语音业务测试落地实践”。语音业务在当今数字化生活中占据着重要地位，其测试的复杂性和专业性对测试架构提出了更高要求。杨青霖将介绍Meta-Agent架构，这种创新架构能够整合多种测试资源，实现协同工作。在语音业务测试中，Meta-Agent架构充分发挥其优势，有效应对语音识别、合成等环节的测试挑战，为语音业务的高质量发展提供有力保障。

二、蚂蚁专场：AGI时代下蚂蚁智能测试新范式

蚂蚁集团平台工程与技术风险部测试总监蔡文婷担任出品人，带领团队展示蚂蚁在智能测试领域的创新成果。

1.《基于测试反馈的测试用例生成Agent构建》

蚂蚁集团平台工程事业群平台质量技术专家敏灏，将分享“基于测试反馈的测试用例生成Agent构建”。测试用例的生成是测试工作的基础，直接影响测试的全面性和有效性。敏灏将介绍如何利用测试反馈数据，构建智能的测试用例生成Agent。这种Agent能够根据历史测试结果和实时反馈信息，自动生成针对性强、覆盖面广的测试用例，大大提高测试效率，减少人工编写用例的工作量。

2.《Codegraph在测试用例生成中的增强效果》

蚂蚁集团平台工程事业群平台质量技术高级研发工程师榆东，聚焦“Codegraph在测试用例生成中的增强效果”。Codegraph作为一种强大的工具，能够直观地展示代码结构和关系。榆东将深入探讨如何将Codegraph应用于测试用例生成，通过分析代码图形，挖掘潜在的测试点，从而生成更精准、更有效的测试用例。这一创新应用将为测试用例生成带来新的突破，提升测试的质量和效率。

3.《行业智能体的评测SOP和评测技术分享》

蚂蚁集团平台工程事业群平台质量技术专家浦墨，带来“行业智能体的评测SOP和评测技术分享”。随着行业智能体的广泛应用，如何对其进行科学、准确的评测成为关键问题。浦墨将分享一套完善的行业智能体评测标准操作流程（SOP），涵盖评测指标设定、评测方法选择以及评测结果分析等方面。同时，介绍先进的评测技术，确保评测结果的客观性和可靠性，为行业智能体的健康发展提供有力支撑。

二、大模型和AI应用评测论坛：筑牢AI发展基石

蚂蚁集团质量技术风险总监刘瑾担任出品人，携手行业专家共同探讨大模型和AI应用评测的前沿话题。

1.《打造AI研发新基建 - 蚂蚁大模型评测体系的设计与实践》

蚂蚁集团高级技术专家王旭东，将分享“打造AI研发新基建 - 蚂蚁大模型评测体系的设计与实践”。大模型作为AI领域的核心技术，其性能和可靠性至关重要。王旭东将介绍蚂蚁如何构建一套全面、科学的大模型评测体系，从模型准确性、鲁棒性到可解释性等多个维度进行评估。通过实际案例展示该评测体系在大模型研发过程中的应用效果，为AI研发提供坚实的基础设施支持。

2.《GTS LLM机器问答产品数据飞轮实践》

华为技术有限公司GTS测试专家黄立华，聚焦“GTS LLM机器问答产品数据飞轮实践”。数据是AI发展的核心驱动力，如何构建高效的数据循环机制成为关键。黄立华将介绍GTS LLM机器问答产品如何通过数据飞轮实践，实现数据的持续优化和模型的迭代升级。通过不断收集用户反馈数据，调整模型参数，提高问答产品的准确性和用户体验，为AI应用的数据驱动发展提供有益借鉴。

3.《赋能研发创新：Databricks数据智能平台引领GenAI与智能Agent实践》

Databricks中国架构师总监王洋，带来“赋能研发创新：Databricks数据智能平台引领GenAI与智能Agent实践”。Databricks数据智能平台在推动AI研发创新方面发挥着重要作用。王洋将介绍该平台如何结合生成式AI（GenAI）和智能Agent技术，为研发人员提供强大的工具和支持。通过实际案例展示平台在数据处理、模型训练和智能应用开发等方面的优势，助力企业实现研发创新和业务增长。

4.《评测驱动开发（EDD）:AI原生飞轮驱动研发效能跃迁》

中兴通讯中心研究院AI研发提效总体组专家蒋学鑫，将分享“评测驱动开发（EDD）:AI原生飞轮驱动研发效能跃迁”。评测驱动开发是一种全新的研发模式，通过将评测贯穿于整个开发过程，实现研发效能的持续提升。蒋学鑫将介绍AI原生飞轮如何与评测驱动开发相结合，形成一个良性循环。通过不断优化评测指标和方法，引导开发团队聚焦关键问题，提高开发效率和质量，推动企业研发效能实现质的飞跃。

本次“AI+测试”线相关论坛汇聚了众多行业精英，他们的精彩分享将为我们呈现智能测试领域的最新动态和发展趋势。无论是智能测试工具的开发与应用，还是大模型和AI应用的评测，都将为行业带来新的机遇和挑战。让我们共同期待这些前沿思想的碰撞，携手开启智能测试的新未来！

上一篇 : 摩根大通AI战略解码：金融巨擘的数智罗盘与中国启示下一篇 : 暂无返回列表

第7届 AiDD峰会 北京 |“AI+测试”线：智探前沿，革新测试新范式

第7届 AiDD峰会北京 |“AI+测试”线：智探前沿，革新测试新范式