您当前的位置:首页 > 电脑百科 > 人工智能

AI应用如何进行测试?

时间:2023-09-03 11:34:30  来源:51CTO  作者:



作者 | Sanjana Thakur

编译 | 徐杰承

 

人工智能技术正在世界范围内以一种前所未有的速度发展,大量的AI应用在短时间内被构建出来,当开发人员正在热火朝天的追赶进度时,测试人员也需要及时跟上这个时代的步伐。

 

值得庆幸的是,随着人工智能的快速进步,测试、自动化和质量保证 (QA) 的新方法也正在出现,为 AI 应用程序测试打开了新的大门。测试人员该如何在现在与将来测试AI和ML应用程序?以下是你应当了解的一些主要方法。

1.数据质量测试

 

数据测试环节需要使用基准来评估数据的状态,虽然每家公司的目标可能有所不同,但高质量的数据通常是AI应用的最核心要求:

 

  • 无误差:所使用的数据没有结构和格式的任何问题。
  • 合并:数据在一个集中式系统中得到保护,而不是分散在多个系统中。
  • 唯一性:数据不重复。
  • 实时性:信息是及时和相关的。
  • 准确性:提供准确的信息,帮助应用做出明智的决策。
  •  

测试数据质量意味着通过将企业信息与既定的已知事实进行比较来识别标记错误、过时或不相关的数据。在此级别的测试中,它可以像为数据集创建数据配置文件一样简单,此过程称为合成数据生成。使用此数据集的定义验证,公司可以对其数据是否有效进行分类,从而衡量其质量。

2.偏差测试

 

另一个越来越受欢迎的重要测试是偏差测试。人工智能系统的偏见在很大程度上取决于它收集的数据。

 

例如,2016年的一份报告发现亚马逊偏向于男性IT申请人。当这家电子商务巨头训练其人工智能机器人找到最适合这份工作的候选人时,它使用现有员工的简历作为数据库,这些数据库主要是男性。根据这些信息,他们的人工智能推测只有男性候选人才能成为最好的IT员工,但事实并非如此。

 

为了避免犯同样的错误,你应该在将算法推送到网上时进行偏差测试。

 

早在 2016 年,偏差测试只是分析需求以建立对一组输入的适当响应的问题。现在,它没有那么明确。你需要更多种类和更多选择。你希望创建多个测试用例来考虑所有可能的变量,而不是使用一个数据集仅生成一个方案。虽然结果可能并不总是完美的,但它们仍然提供了一种更好、更公平、更全面的方法来消除偏见和开发更具包容性的人工智能应用。

3.AI 模型评估与测试

 

AI 模型评估和测试可帮助你预测分析和评估的结果,它涉及三个步骤:在 AI 测试的第一阶段,收集的数据分为训练集、验证集和测试集。训练集包含多达 75% 的数据集,并分配模型权重和偏差。验证集由训练期间 15% 到 20% 的数据组成,以评估初始准确性并查看模型如何适应、学习和微调超参数。

 

在此阶段,模型仅考虑验证数据,但尚未使用它来学习模型的权重和偏差。测试集则占整个数据集的 10% 到 15%。这用于最终评估,作为一个受控集,没有偏见。

 

测试过程的第二阶段是调整超参数。在此阶段,开发人员可以控制训练算法的行为,并根据第一阶段的结果调整参数。在人工智能和深度学习的背景下,可能的超参数可能包括学习率、卷积核宽度、隐藏单元数量、正则化技术等。

 

最后,执行批量规范化涉及两种技术:规范化和标准化,以便在训练准备期间以相同的比例转换数据。一旦AI模型经过充分的训练、微调和标准化,就应该通过混淆矩阵、AUC ROC、F1分数和其他精度/准确度指标来衡量其性能。经历这一严格的过程对于了解你的算法执行的有效性和准确性至关重要。

4.安全测试

 

测试你的AI应用程序的安全性需要结合传统的安全性测试方法和特定于AI系统的考虑。从以下几点开始考虑:

 

  • 确定安全目标和风险:确定与AI应用程序相关的安全目标和潜在风险。考虑数据隐私、模型完整性、对抗性攻击和对输入变化的鲁棒性等方面。这一步将有助于形成你的测试策略。
  • 数据安全性:评估用于训练、验证和推断的数据安全性。评估数据隐私、存储、处理实践和访问控制。确保敏感数据得到适当保护,并遵守隐私法规。
  • 系统架构和基础设施:分析人工智能应用程序的架构和基础设施。考虑安全性方面,如身份验证、授权和加密。验证在系统的设计和实施中是否遵循了安全最佳实践。
  • 输入验证和净化:注意输入验证和净化机制。验证应用程序是否正确处理输入数据,以防止常见的漏洞,如注入攻击或缓冲区溢出。
  • 第三方组件:评估AI应用程序中使用的任何第三方库、框架或组件的安全性。确保它们是最新的,没有已知的漏洞,并且配置正确。
  • 文件和报告:记录你的发现、建议和测试结果。创建全面的安全测试报告,概述已识别的漏洞、风险和缓解措施。

5.性能和可扩展性测试

 

要对AI应用进行性能测试,需要全面了解应用的架构、组件和数据流至关重要。容量测试、耐久性测试和压力测试是最重要的性能测试类型,必须在AI应用程序上执行,以评估其性能和可扩展性。

 

这可以通过不同的测试数据来实现,包括大的和小的测试数据集,因为大量的测试数据会占用更多的计算资源。此外,硬件资源的并行监控有助于设置正确的配置,以支持人工智能应用程序的预期用户请求。

6.聊天机器人测试

 

随着聊天机器人在人工智能应用中越来越受欢迎,确保这些机器人向用户提供的信息是准确的至关重要。如果你的企业使用聊天机器人的功能,你必须测试聊天机器人的功能和非功能组件。

 

  • 领域测试:聊天机器人旨在处理特定的领域或主题。领域测试包括在与其指定领域相关场景中彻底测试聊天机器人。这确保聊天机器人理解并准确响应其预期范围内的查询。
  • 极限测试:极限测试评估聊天机器人如何处理不适当或意外的用户输入。这包括测试聊天机器人对无效或无意义问题的反应,并在聊天机器人遇到故障或错误时识别结果。极限测试有助于发现潜在的漏洞,并改善错误处理和用户体验。
  • 对话因素:聊天机器人依靠对话流来提供有意义和引人入胜的互动。验证不同的对话流对于评估聊天机器人在各种场景下的响应至关重要。这包括评估聊天机器人理解用户意图、处理对话中的多个回合以及提供相关和连贯响应的能力。评估对话因素有助于优化聊天机器人的对话技能,并增强用户体验。

7.机器人测试

 

机器人测试需要模拟真实世界的场景,并评估这些场景中系统或算法的行为。基于模拟的行为测试包括算法调试、对象检测、响应测试和验证定义的目标。

 

为了确保全面的测试,你应该采用低保真度2D模拟和高保真度3D模拟。前者用于模块级行为测试,后者用于系统级行为测试。这允许你在模拟中检查不同级别的复杂性和准确性。该过程还测试硬件可用性场景和硬件不可用性场景。这些场景评估系统或算法在不同硬件条件下的行为和性能,确保在不同环境下的稳健性和适应性。

8.优先考虑测试

 

对于AI/ML应用的测试与传统软件测试有着很大不同,且存在着一些技术挑战。但伴随着越来越多AI/ML应用的诞生,对AI/ML应用的测试方法和实践也在迅速发展和逐步完善。

 

以上便是目前为止对于AI/ML应用的一些有效且合理的测试方法及思路。如果你的企业使用或提供人工智能解决方案,你必须优先考虑全面的测试方法,以确保准确性,安全性和包容性。

 

原文链接:https://dzone.com/articles/10-top-trends-in-ai-based-Application-testing-you



Tags:AI应用   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
影视业AI应用如何超乎想象?
在本周落幕的2024年首都电视节目春推会上,主题创作、经典拓新、科技进步共同组成了业内关注度最高的“新质生产力”。包括春推会和香港国际影视展等具有风向标地位的会议中,如...【详细内容】
2024-04-01  Search: AI应用  点击:(7)  评论:(0)  加入收藏
开发者如何使用Postgres扩展,包括AI应用?
作者 | Richard MacManus编译 | 言征一家名为Tembo的公司鼓励开发人员在Postgres之上进行构建,使用越来越多的Postgres扩展。PostgreSQL(通常称为Postgres)是一个流行的免费开...【详细内容】
2024-01-24  Search: AI应用  点击:(49)  评论:(0)  加入收藏
年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏
量子位 | 公众号 QbitAI百模齐发、AI工具乱杀的一年里,谁是真正赢家?ChatGPT访问量遥遥领先位居第一,但单次使用时长没超过平均线。Midjourney访问量年度第四,但下滑量位居第二...【详细内容】
2024-01-02  Search: AI应用  点击:(51)  评论:(0)  加入收藏
除了卫星通话,未来手机竞争的焦点或许就是AI应用能力了
中国电信已经发布消息称,来年会有更多的支持卫星通话的旗舰手机出现,也就是说,除了华为手机之外,别的手机厂商的旗舰产品也要支持卫星通话功能了。如今卫星通话在华为Mate 60系...【详细内容】
2023-11-14  Search: AI应用  点击:(101)  评论:(0)  加入收藏
AI应用“龙头”浮现:Adobe!
来源:华尔街见闻 赵颖强大的视频AI技术能让用户“节省数小时的重复性琐碎工作”,Adobe预计将迎来业绩兑现且利润率可能保持在45%以上。强大AI功能重振增长前景,Adobe或将迎来业...【详细内容】
2023-10-16  Search: AI应用  点击:(99)  评论:(0)  加入收藏
AI应用如何进行测试?
作者 | Sanjana Thakur编译 | 徐杰承 人工智能技术正在世界范围内以一种前所未有的速度发展,大量的AI应用在短时间内被构建出来,当开发人员正在热火朝天的追赶进度时,测试人...【详细内容】
2023-09-03  Search: AI应用  点击:(242)  评论:(0)  加入收藏
国内AI应用将迎来政策和需求共振 商用化时点渐行渐近
机构指出,国内大模型正在加速追赶海外,在具体应用场景中加快研发进度,预期国内AI应用会加速落地。日前,微软公布了其生成式人工智能工具Copilot的定价,每用户每月30美元,相较此前...【详细内容】
2023-08-14  Search: AI应用  点击:(45)  评论:(0)  加入收藏
数千名黑客齐聚拉斯维加斯 共同“围剿”ChatGPT等AI应用
本周末,数千名黑客将齐聚美国赌城拉斯维加斯,共同参加一场针对包括ChatGPT在内的人工智能(AI)聊天应用的“围剿战争”。这场“争斗”发生之际,人们对人工智能技术的担忧和审查日...【详细内容】
2023-08-11  Search: AI应用  点击:(280)  评论:(0)  加入收藏
大学生求职技能跨入AI纪元 “熟悉AI应用软件”写进要求
大学生求职技能跨入AI纪元【辅助办公提升效率 “熟悉AI应用软件”写进岗位要求】“能熟练使用ChatGPT、Midjourney等AI软件生产高质量文图内容完成辅助工作。”今夏应聘季,AI...【详细内容】
2023-06-21  Search: AI应用  点击:(121)  评论:(0)  加入收藏
AI应用路线图:可控性是最强路标
生成式AI的可控性越强,对市场和产业的颠覆性就越大!作者 | 王咏刚、童超责编 | 夏萌生成式 AI 的应用场景在哪里Stable Diffusion、ChatGPT等生成式AI技术(Generative AI)在2023...【详细内容】
2023-06-13  Search: AI应用  点击:(372)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条