在人工智能技术迅猛发展的当下,为了帮助企业在人工智能的浪潮中抓住机遇,“AI+研发数字峰会(AiDD)”应时而生,致力于协助企业利用AI技术深化计算机对现实世界的理解,推动研发进入智能化和数字化的新时代。AiDD峰会是兼具专业性、专注性、全面性与前瞻性的顶级 AI 数字峰会。
2025 AiDD北京站峰会共设五大条线,分别是“AI+开发”、“AI+测试”、“AI+领域”、“AI+效能”、“AI+技术前沿”线。其中“AI+测试”线精心策划了三大论坛,涵盖智能测试工具的开发与应用、蚂蚁专场:AGI时代下蚂蚁智能测试新范式以及大模型和AI应用评测,汇聚了众多AI领域的顶尖专家与前沿成果,包括蚂蚁集团、华为、百度、兴云数科、思码逸、Databricks 等企业的优秀实践案例,为参会者带来了一场思想碰撞与技术盛宴。
本次论坛由华为智能化测试C-TMG主任、智能化测试专家万锐媛担任出品人。在她的引领下,多位行业佼佼者将带来精彩分享。
1.《AI赋能测试Agent:三大亮点驱动研发提效与质量跃升 》北京兴云数科测试领域负责人刘敏,将带来“AI赋能测试Agent:三大亮点驱动研发提效与质量跃升”的演讲。在研发过程中,效率与质量始终是关键指标。刘敏将深入剖析AI赋能测试Agent的独特优势,其三大亮点犹如三把利刃,精准切入研发痛点。通过AI技术,测试Agent能够实现更智能的任务分配、更精准的缺陷检测以及更高效的测试流程管理,从而显著提升研发效率,推动产品质量实现质的飞跃。这一分享将为测试人员提供全新的视角,助力他们在研发浪潮中抢占先机。2.《面向API测试垂类应用的“专家”智能体与LLM工程优化》思码逸创始人兼CEO任晶磊,聚焦“面向API测试垂类应用的‘专家’智能体与LLM工程优化”。API测试作为软件测试的重要环节,其准确性与效率直接影响着整个系统的稳定性。任晶磊将介绍如何打造面向API测试的“专家”智能体,这种智能体具备深厚的专业知识和丰富的实践经验,能够针对API测试的特殊需求进行精准操作。同时,结合大语言模型(LLM)工程优化,进一步提升测试的智能化水平,为API测试提供更可靠、更高效的解决方案。华为云核心网测试工程师袁汉伟,将分享“系统测试代码Agent的构建与应用实践”。系统测试代码的编写与执行是确保软件系统正常运行的关键步骤。袁汉伟将详细介绍如何构建系统测试代码Agent,从代码的生成、优化到执行,每一个环节都融入了AI的智慧。通过实际应用案例,展示系统测试代码Agent在提高测试覆盖率、减少人工干预等方面的显著成效,为系统测试领域带来新的发展思路。4.《Meta-Agent架构与语音业务测试落地实践》百度资深测试开发工程师杨青霖,带来“Meta-Agent架构与语音业务测试落地实践”。语音业务在当今数字化生活中占据着重要地位,其测试的复杂性和专业性对测试架构提出了更高要求。杨青霖将介绍Meta-Agent架构,这种创新架构能够整合多种测试资源,实现协同工作。在语音业务测试中,Meta-Agent架构充分发挥其优势,有效应对语音识别、合成等环节的测试挑战,为语音业务的高质量发展提供有力保障。蚂蚁集团平台工程与技术风险部测试总监蔡文婷担任出品人,带领团队展示蚂蚁在智能测试领域的创新成果。
蚂蚁集团平台工程事业群平台质量技术专家敏灏,将分享“基于测试反馈的测试用例生成Agent构建”。测试用例的生成是测试工作的基础,直接影响测试的全面性和有效性。敏灏将介绍如何利用测试反馈数据,构建智能的测试用例生成Agent。这种Agent能够根据历史测试结果和实时反馈信息,自动生成针对性强、覆盖面广的测试用例,大大提高测试效率,减少人工编写用例的工作量。2.《Codegraph在测试用例生成中的增强效果》蚂蚁集团平台工程事业群平台质量技术高级研发工程师榆东,聚焦“Codegraph在测试用例生成中的增强效果”。Codegraph作为一种强大的工具,能够直观地展示代码结构和关系。榆东将深入探讨如何将Codegraph应用于测试用例生成,通过分析代码图形,挖掘潜在的测试点,从而生成更精准、更有效的测试用例。这一创新应用将为测试用例生成带来新的突破,提升测试的质量和效率。蚂蚁集团平台工程事业群平台质量技术专家浦墨,带来“行业智能体的评测SOP和评测技术分享”。随着行业智能体的广泛应用,如何对其进行科学、准确的评测成为关键问题。浦墨将分享一套完善的行业智能体评测标准操作流程(SOP),涵盖评测指标设定、评测方法选择以及评测结果分析等方面。同时,介绍先进的评测技术,确保评测结果的客观性和可靠性,为行业智能体的健康发展提供有力支撑。蚂蚁集团质量技术风险总监刘瑾担任出品人,携手行业专家共同探讨大模型和AI应用评测的前沿话题。
1.《打造AI研发新基建 - 蚂蚁大模型评测体系的设计与实践》蚂蚁集团高级技术专家王旭东,将分享“打造AI研发新基建 - 蚂蚁大模型评测体系的设计与实践”。大模型作为AI领域的核心技术,其性能和可靠性至关重要。王旭东将介绍蚂蚁如何构建一套全面、科学的大模型评测体系,从模型准确性、鲁棒性到可解释性等多个维度进行评估。通过实际案例展示该评测体系在大模型研发过程中的应用效果,为AI研发提供坚实的基础设施支持。华为技术有限公司GTS测试专家黄立华,聚焦“GTS LLM机器问答产品数据飞轮实践”。数据是AI发展的核心驱动力,如何构建高效的数据循环机制成为关键。黄立华将介绍GTS LLM机器问答产品如何通过数据飞轮实践,实现数据的持续优化和模型的迭代升级。通过不断收集用户反馈数据,调整模型参数,提高问答产品的准确性和用户体验,为AI应用的数据驱动发展提供有益借鉴。3.《赋能研发创新:Databricks数据智能平台引领GenAI与智能Agent实践》Databricks中国架构师总监王洋,带来“赋能研发创新:Databricks数据智能平台引领GenAI与智能Agent实践”。Databricks数据智能平台在推动AI研发创新方面发挥着重要作用。王洋将介绍该平台如何结合生成式AI(GenAI)和智能Agent技术,为研发人员提供强大的工具和支持。通过实际案例展示平台在数据处理、模型训练和智能应用开发等方面的优势,助力企业实现研发创新和业务增长。4.《评测驱动开发(EDD):AI原生飞轮驱动研发效能跃迁》中兴通讯中心研究院AI研发提效总体组专家蒋学鑫,将分享“评测驱动开发(EDD):AI原生飞轮驱动研发效能跃迁”。评测驱动开发是一种全新的研发模式,通过将评测贯穿于整个开发过程,实现研发效能的持续提升。蒋学鑫将介绍AI原生飞轮如何与评测驱动开发相结合,形成一个良性循环。通过不断优化评测指标和方法,引导开发团队聚焦关键问题,提高开发效率和质量,推动企业研发效能实现质的飞跃。
本次“AI+测试”线相关论坛汇聚了众多行业精英,他们的精彩分享将为我们呈现智能测试领域的最新动态和发展趋势。无论是智能测试工具的开发与应用,还是大模型和AI应用的评测,都将为行业带来新的机遇和挑战。让我们共同期待这些前沿思想的碰撞,携手开启智能测试的新未来!