人工智能|李国杰院士:国内AI研究如何摆脱困境

2016年DeepMind公司的人工智能程序AlphaGo战胜了人类围棋冠军 , 曾引起全世界的轰动 。
2020年11月30日 , DeepMind公司的另一个人工智能程序AlphaFold 2在蛋白质结构预测大赛CASP 14中 , 对大部分蛋白质结构的预测与真实结构只差一个原子的宽度 , 达到了人类利用冷冻电子显微镜等复杂仪器观察预测的水平 , 这是蛋白质结构预测史无前例的巨大进步 。这一重大成果虽然没有引起媒体和广大民众的关注 , 但生物领域的科学家反应强烈 。
中国科学院院士施一公对媒体说:“依我之见 , 这是人工智能(AI)对科学领域最大的一次贡献 , 也是人类在21世纪取得的最重要的科学突破之一 , 是人类在认识自然界的科学探索征程中一个非常了不起的历史性成就 。”
【人工智能|李国杰院士:国内AI研究如何摆脱困境】蛋白质是生命的基础 , 了解蛋白质的折叠结构和分子动力学是生物学界最棘手的问题之一 , 已经困扰科学家50年之久 。
目前已知氨基酸顺序的蛋白质分子有1.8亿个 , 但三维结构信息被彻底看清的还不到0.1% 。最近DeepMind公司在《自然》上宣布已将人类的98.5%的蛋白质预测了一遍 , 计划今年年底将预测数量增加到1.3亿个 , 达到人类已知蛋白质总数的一半 , 并且公开了AlphaFold 2的源代码 , 免费开源有关数据集 , 供全世界科研人员使用 。
被释放的海量蛋白质结构信息蕴含着生命信息的密码 , 将有力推动生命科学的发展 , 大大加速针对癌症、病毒的抗生素、靶向药和新效率的蛋白酶的研发 。
在AlphaFold 2 问世以前 , 许多科学家做过用计算机预测蛋白质三维折叠结构的研究 。中科院计算技术研究所的卜东波团队去年在《自然》发表论文 , 他们在蛋白质结构预测方面做出了出色的成果 。
DeepMind团队采用的注意力机制也是计算机视觉和自然语言处理领域较成熟的技术 。最近华盛顿大学推出预测准确度与AlphaFold 2差不多的新算法 , 只需要一个GPU , 10分钟左右就能算出蛋白质结构 。
蛋白质折叠问题的解决是生物学界和人工智能界长期合作努力的结果 , 但AlphaFold 2的“临门一脚”是取得胜利的标志性突破 , 它用精确的预测结果显示出人工智能技术在基础科学研究上的巨大威力 。AlphaFold 2的巨大成功给我们许多耐人寻味的启示 。
2017年国务院印发《新一代人工智能发展规划》后 , 我国立即启动了“新一代人工智能重大科技项目” , 开展数据智能、跨媒体感知、群体智能、类脑智能、量子智能计算等基础理论研究 , 统筹布局了人工智能创新平台和许多关键共性技术研究 。
近三年 , 我国学者发表了大量人工智能论文 , 申请几万件专利 , 在北京冬奥会、城市大脑等应用场景和抗击新冠疫情中取得显著成效 , 出现了一些人工智能独角兽企业 , 取得的成绩可圈可点 。但总的来讲 , 我们的研究多数是技术驱动、论文导向的 , 目标导向和问题导向的研究较少 。
AlphaFold 2的成功首先是因为10年前DeepMind团队就开始关注“蛋白质折叠”这个有重大价值的科学问题 。几年前用计算机预测复杂的蛋白质折叠结构 , 正确率还不到40% , DeepMind团队当时就有信心攻克这个世界难题 。
我们与一流科学家的差距之一是选择可突破的重大科学问题的眼光不够敏锐 , 布局的科研项目要么是增量式的技术改进 , 要么是几十年都难以突破的理想型目标 , 像蛋白质折叠这样的重要研究方向没有列入新一代人工智能重大科技项目 。

推荐阅读