人工智能大会在中国的哪一个城市举办,盘点2019世界人工智能大会的意义( 五 )


电影《我,机器人》剧照 。
技术大鳄们每次发布这样的新闻稿,基本都是同一个套路 。而众多媒体
(幸亏不是所有媒体)
都将一点点小进展描绘成意义非凡的革命壮举 。举例来说,几年前,Facebook开展了一个基础的概念验证项目,针对AI系统阅读简单故事并回答相关问题的能力进行评估 。结果一大堆热情高涨的新闻标题随之呼啸而来,《Facebook称已找到让机器人更富智慧的秘密》《能学习并回答问题的Facebook AI软件》《能阅读〈魔戒〉概要并回答问题的软件,可加强Facebook搜索能力》,诸如此类 。
果真如此的话,确实属于重大突破 。哪怕是能看明白《读者文摘》或托尔金的简明注释本,都算是个了不起的壮举,更别提看懂《魔戒》原著本身了 。但无奈的是,真有能力完成这一壮举的AI根本不在我们现如今的视野之中 。Facebook AI系统所阅读的文本概要实际上只有4行文字:比尔博回到洞穴 。咕噜将魔戒留在了那里 。比尔博拿到魔戒 。比尔博回到夏尔郡 。比尔博将魔戒留在了那里 。佛罗多拿到魔戒 。佛罗多前往末日山 。佛罗多将魔戒留在那里 。索伦魔王死去 。佛罗多回到夏尔郡 。比尔博前往灰港 。全剧终 。
但即使这样,这个AI系统竭尽全力能做到的只是直接回答段落中所体现的基本问题,例如“魔戒在哪里”“比尔博现在何处”“佛罗多现在何处” 。千万别想问“佛罗多为什么放下魔戒”之类的问题 。许多媒体人在进行技术报道时,尤其喜欢夸大其词 。这样做的直接后果就是让公众误以为AI成真的曙光已经洒满大地 。而实际上,我们还有很漫长的夜路要走 。从今往后,若再听说某个成功的AI案例,建议读者提出以下6个问题:

1.抛开华而不实的文笔,此AI系统究竟实实在在地做到了哪些事?
2.此成果的通用性有多强?
(例如:所提到的阅读任务,是能测量阅读中的所有方面,还是只有其中的一小部分?)
3.有没有演示程序,能让我用自己的例子来实验一下?如果没有,请保持怀疑态度 。
4.如果研究人员或媒体称此AI系统强于人类,那么具体指哪些人类,强出多少?
5.被报道的研究成果中所成功完成的具体任务,实际上将我们与真正的人工智能拉近了多少距离?
6.此系统的鲁棒性如何?如果使用其他数据集,在没有大规模重新训练的情况下,是否还能成功?
(例如:一个玩游戏的机器如果掌握了下国际象棋的技能,它是否也能玩《塞尔达传说》这类动作冒险游戏?用于识别动物的系统,是否能将之前从未见过的物种准确识别为动物?经过训练能在白天出行的无人驾驶汽车系统,是否也能在夜间或雪天出行,如果路上新增了一个地图中没有的绕行标志,系统是否知道如何应对?)

推荐阅读