AI可以窥见未来?

随着技术的迭代,人工智能正在快速从解决 “具体问题” 的弱人工智能向解决 “通用问题” 的强人工智能演进。

【安防在线 www.anfang.cn】随着技术的迭代,人工智能正在快速从解决 “具体问题” 的弱人工智能向解决 “通用问题” 的强人工智能演进。

在这个过程之中,人工智能想要获得同人类一样的解决问题的能力,必须具备与人类相似的 “知识架构”。有了这个基础,人工智能不仅可以做到 “共情”,甚至可以对人类行为或事态的发展进行一定程度的 “预判”。

初窥预言 “水晶球”

10 月 15 日,来自北卡罗来纳大学教堂山分校的博士生雷杰在 arXiv 上传了一篇名为 “What is More Likely to Happen Next? Video-and-Language Future Event Prediction” 的预印本论文,这篇论文的内容提出并初步实现了让 AI 预测事态未来,目前该论文已经被 EMNLP2020 接收。

雷杰告诉 DeepTech,前几年业内关注的研究重点都在于机器如何 “理解” 视频的内容,而他们的工作对于业内来说算是在新领域进行了些许拓荒,为加强和测试模型的事件预测能力及常识认知能力提供了一个新的方向。

他们的项目名为 “VideoLanguageFuturePrediction”,其中 Video 指视频,而 Language 指视频中对话的文本,可以理解为 “字幕”。一次完整的预测流程大概是这样:

将视频 + 字幕 + 两种人类给出的未来可能方向 A 和 B,输入模型,模型将输出它的判断结果,即 A 和 B 各自发生的概率。通过这种做 “选择题” 的方式实现一定程度的 “预测”。

AI可以窥见未来?

  图 | VideoLanguageFuturePrediction 数据流程图

雷杰补充道,这是一种比较初步的解决方案,未来 AI 将能够做 “阅读理解”,即直接从给定的视频和字幕之中自己生成对未来的预测。当然,不管是 “选择题” 还是 “阅读理解”,都需要 AI 具备一定的理解能力。

同时,雷杰和同事也暂未加入让 AI 给出决策理由的功能。他说,这项能力可以单独作为一个比较复杂的研究课题,所以他们暂时聚焦于 “预测” 这件事。

为了训练这个模型,雷杰和同事准备了 2.8 万个用例,并将其命名为 “VLEP(Video-and-Language Event Prediction)”。

这批视频数据分成两类,电视节目以及来自 YouTube 的 Vlog。

AI可以窥见未来?

  图 | 视频素材统计

他们首先将这些视频进行预处理,最终它们被切割为一个个 60 到 90 秒的片段。之后将这批素材提交到数据标注平台进行人工标注。人类将标注短视频内 “事件” 的起止时间,并且给出两个预测结果 ―― 未来较大可能发生的和较小可能发生的。

雷杰说,假如视频中显示一个人拿起杯子,那么按照常理推断,他更可能要喝水,而不是将杯子摔碎。“这种人类非常容易完成的事情,对机器来说并不简单。”

未来,他们将尝试结合大规模视频数据进行一些无监督学习,让模型能够加深对视频和字幕的理解,并建立像人类一样的 “关联”。

谈及应用,雷杰坦言,目前他们的研究仍然处于比较早期的阶段,但他认为未来人工智能必将具备同人类一样的 “知识架构”,它们将更加懂得人类的想法,同人类的合作也会更加 “心有灵犀”。

更喜欢 “确定性”

雷杰 2013 年考入坐落于成都的电子科技大学,大学二年级他凭借优异成绩入围了仅接收年级前 5% 学生的 “英才实验学院”,在这里,雷杰接受了较同龄人更为全面、系统性的计算机教育。

虽然他现在的研究方向专攻 “人工智能”,但其实雷杰最早报考的是微电子专业,入学之后才转到了计算机。

对此他解释道,“小的时候我非常喜欢鼓捣电子元器件,所以高考选择了这个专业,但当我设计的正确电路因为粗糙的工艺而失效时,我的内心动摇了。” 经过一段时间的自我审视,他发现自己更加倾向于 “1 + 1 = 2” 这类严格规整、且确定性的东西,便义无反顾地投身到计算机科学之中。

大一结束时,雷杰在同一位博士学长交流的过程中第一次听到了 “机器学习” 这个概念,这让他感到非常震惊。是的,机器为什么不能 “学习” 呢?

在好奇心的驱使下,他开始孜孜不倦地学习相关知识,并最终选择留学攻读相关领域的博士学位。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)

相关推荐

  • 物理知识可以协助应对人工智能的关键挑战

    在今天发表在《科学报告》杂志上的一篇文章中,研究人员展示了如何采用一个世纪前引入的物理概念来解决这两个挑战,该物理概念描述了铁块冷却过程中磁体的形成。

    2026年3月15日
  • 人脸识别安全技术的研究与应用

    近几年,人脸识别技术在现实生活中得到大规模应用,设备解锁、刷脸支付以及门禁安防等场景随处可见,且人脸编辑等新技术也不断涌现,带来便利的同时也引起人们对人脸安全的担忧。

    2026年3月15日
  • “新基建”背景下 智慧建筑未来发展机遇

    如今,全球各地都在不断推出智慧城市计划。根据IDC最近的一份报告,从西雅图到新加坡再到伦敦等城市预计今年将在智慧城市计划上花费近1240亿美元,比2019年增长18.9%。

    2026年3月15日
  • 算法能成为AI进步的核心驱动力吗?

    2006年以来,以深度学习为代表的机器学习算法在机器视觉、语音识别等领域取得了较大成果,识别准确性大幅提升,何为人工智能发展的核心驱动力这一问题受到学术界和产业界的关注。

    2026年3月15日
  • 人工智能将如何改变世界

    对于消费者和组织而言,人工智能是一项巨大的革命性进步。它带来了一些更重要和更紧迫的发现。2019年全球人工智能市场规模为399亿美元,并且在2020年至2027年将以每年42%的速度增长。

    2026年3月15日
  • 机器学习和人工智能在网络安全中的作用

    网络攻击活动如今日益猖獗,以至于组织采用的安全工具很难保护其业务并打击网络攻击者。采用机器学习和人工智能技术可以改善网络安全性。

    2026年3月15日