解析图像识别AI会犯的“低级错误”

对于图像识别技术来说,有时原因是因为给定的训练数据集出了问题。比如近日Facebook人工智能实验室的一项新研究就表明,科技巨头销售的物体识别算法在识别来自低收入国家的物品时表现得更差。  

解析图像识别AI会犯的“低级错误”

目前的人工智能技术已经非常擅长识别图像中的物体,但仍然很容易犯些“低级错误”。
在部分情况下,只需在人眼不可见的静态噪声中添加一些可选的笔触或图层,就可以“愚弄”AI图像识别系统,这有时甚至会造成致命的后果。
例如,曾有研究人员将打印的涂鸦贴在路牌上导致AI自动驾驶系统将限速标志识别为禁行,腾讯科恩实验室也曾发布报告称路面上难以注意到的小贴纸就能误导特斯拉错误判断并驶入反向车道。
这些误导标志被称为“对抗补丁”,研究人员现在正忙于开发保护人工智能系统不受这些例子影响的方法。
但在去年的一篇论文中,GoogleBrain和普林斯顿大学的一组研究人员,包括该领域最早的研究人员之一IanGoodfellow,认为这些新研究过于理论化,没有抓住重点。
他们说,虽然大部分研究的重点是保护系统免受特别设计的标志的干扰,但黑客可能会选择一种更直接的方法:使用一张完全不同的照片,而不是在现有照片上叠加噪音图案。这也可能导致系统误判断。这一批评促使加州大学伯克利分校的博士生DanHendrycks编写了一个新的图像数据集。
这个数据集中包括一些容易被误判的图像,比如松鼠(它们通常会被误认为是海狮)或蜻蜓(它们会被误认为是井盖)。他表示:“这些例子似乎更难防范。”
人工合成的对抗标志需要知道所有的人工智能系统是如何防范误判的。但相比之下,即使人工智能系统各自的防范措施不同,这些自然的例子也能很好地发挥作用。
Hendrycks上周在国际机器学习会议上发布了该数据集的早期版本,包含大约6000幅图像。他计划在几周内发布最终版本,其中包括近8000个图像。他打算让研究团体使用该数据集作为基准。
换句话说,与其直接在图像上训练图像识别系统,不如将其保留下来只用于测试。他说:“如果人们只是用这些数据集训练系统,那么系统仅仅只是记住了这些例子。这样虽然系统已经解决了误判这些图像的问题,但它们对新图像的误判程度并没有得到改善。”
破解这些令人困惑的误判背后的逻辑,可能会让系统的适应性更广。“为什么系统会把蜻蜓和鳄梨色拉酱搞混?”Hendrycks开玩笑道,“根本不清楚为什么会犯这样的错误。”为什么人工智能会误判?
有些人工智能系统的底层计算机制是已知的,有些则不是,这被称为“黑箱”,即该系统的开发者可能都无法完全了解系统如何做出决策。
对于图像识别技术来说,有时原因是因为给定的训练数据集出了问题。比如近日Facebook人工智能实验室的一项新研究就表明,科技巨头销售的物体识别算法在识别来自低收入国家的物品时表现得更差。
据报道,研究人员测试了五种流行的现成对象识别算法――微软Azure、Clarifai、谷歌CloudVision、亚马逊Rekognition和IBMWatson。而测试的图像包括来自全球不同阶级的家庭的家中用品的图像。这些图像可能来自非洲布隆迪的一个月收入27美元的家庭,也可能来自乌克兰一个月收入1090美元的家庭。
研究人员发现,与月收入超过3500美元的家庭相比,当被要求识别月收入50美元的家庭的物品时,物体识别算法的出错率要高出10%左右。
而且在识别来自美国的照片时,算法的准确性也比识别来自索马里或布基纳法索的照片要高出15%至20%。
研究人员称,在一系列用于图像识别的商业云服务中,这些发现具有一致性。
人工智能算法的这种“偏见”还有很多别的例子,其中一种常见的推测原因是用于培训的数据有了偏颇――它们往往反映了相关工程师的生活和背景。由于这些人通常是来自高收入国家的白人男性,他们训练的算法所要识别的世界也是如此。
研究人员称,视觉算法的训练数据主要来自欧洲和北美,“在人口众多的地理区域,特别是非洲、印度、中国和东南亚,对视觉场景的采样严重不足”。
由于美国科技公司在人工智能领域处于世界领先地位,这可能会影响到从照片存储服务、图像搜索功能到更重要的AI安全摄像头、自动驾驶汽车等系统的方方面面。
“评估人工智能系统并不一定容易,因为没有执行这类评估的标准基准。”帮助开展这项研究的Facebook人工智能研究科学家劳伦斯・范德马顿(LaurensvanderMaaten)在接受采访时表示。
“对抗这种偏见最重要的一步是,在培训AI系统之前的数据收集环节就要谨慎得多。”
值得注意的是,科技公司们经常把自家人工智能产品宣传为“人人平等、人人可得”,但实际上,它们可能只是在按照自己的形象来评估、定义和塑造世界。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)

相关推荐

  • 被英国警方称赞的中国人脸识别技术,有多先进?

    前几天,四川省自贡市公安局举行“向人民报告”最强实战专场新闻通气会,会上,由自贡警方自主开发建设的“大数据 情指勤“实战应用平台――“猎狐工程”成功抢占C位,成了众多媒体争相报道的对象。

    2026年3月24日 知识
  • 德国教研部和法国研究部联合发布人工智能研究合作资助指南

    据德国联邦教育与研究部(BMBF)网站报道,该部和法国研究部(MESRI)发布了联合资助指南。德法间的高质量人工智能(AI)研究合作将得到支持和资助。德国联邦教研部长卡利切克指出:“人工智能是欧洲竞争力的核心,德国和法国的商业和科学在此领域将拥有巨大的机会。因此,借助我们新的资助指南,我们希望将两国在人工智能研究方面的优势捆绑在一起。”

    2026年3月24日
  • 赵克志检查环京“护城河”安保 要求发挥科技和大数据优势

    在兴礼公安检查站,赵克志与民警、辅警亲切交谈,详细询问进京车流量和值班执勤、工资收入等情况,深入了解智慧安检、勤务查控和疫情防控处置情况。他要求,要充分发挥科技优势和大数据优势,积极改进检查方式,科学设置检查流程,提高安检效率,提高查控精准度,做到“少扰民、多惠民、保畅通”。

    2026年3月24日
  • 5G全面商用,从技术到应用还要过几道关

    今年毫无疑问是5G发展的元年,无论是芯片、网络,还是终端,这三大领域都在快速并行的发展。来自GSMA智库的数据显示,截止到今年的第一季度,全球有147家运营商已经在做5G的实验网络。

    2026年3月24日
  • 高新兴科技集团2017年一季度经营分析会顺利召开

    高新兴集团董事长刘双广在会上指出,基于业务高增长的态势,公司对单元的经营管理能力和干部素质都提出了新的要求。各经营单元要秉承“赢第一”的理念,向行业标杆学习并不断超越。高新兴的干部要不断提升自我,以适应公司的迅猛发展。

    2026年3月24日
  • 全国信标委人工智能分委会第一届第一次组长会成功召开

    秘书处汇报了前期工作进展、组织机制建设情况及下一步工作计划。基础工作组、模型与算法研究组、芯片与系统研究组、产品与服务研究组、可信赖研究组组长单位分别汇报了各组工作进展和2021年工作计划。会议肯定了分委会秘书处和各工作组/研究组前期进展,与会专家对分委会后续工作提出了具体意见和建议。

    2026年3月24日