腾讯AI Lab张正友:中国人工智能的未来到底通向何方?泡泡战士散弹技巧

文章正文
发布时间:2019-07-19 20:17

雷锋网按:7 月 12 日-7 月 14 日,泡泡战士散弹技巧2019 第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。

7 月 12 日,中国人工智能学术界首次公开举办了「华人顶会大大圆桌」。五大国际 AI 顶会华人大大分别就各自领域会议的文章水平、大会主题和形式等方面相关变化的观察分享了相关观点,该圆桌论坛主持人由京东集团副总裁郑宇担任。

出席本次圆桌论坛的嘉宾有:

马颂德,原科技部副大大、欧美同学会副会长、ICCV 2005 大会大大;

张正友,腾讯 AI Lab & Robotics X 主任、CVPR 2017 大会大大;

周明,微软亚洲研究院副院长,国际计算语言学会(ACL)会长;

杨强,香港科技大学讲席教授、微众银行首席 AI 官、IJCAI 理事会大大;

陈义明;新加坡工程院院士、南洋理工大学教授、ICRA 2017 大会大大。

中国人工智能四十年 ? 华人顶会大大圆桌

圆桌探讨

以下是圆桌会议的全部精彩内容,雷锋网(公众号:雷锋网)做了不变原意的整理与编辑:

一、顶会现状,一场过去与现在的思维碰撞

郑宇:近几年,各大顶会里面的文章水平、大会主题以及形式有发生哪些变化?尤其是现在相对 10 年前,我们的论文水平、学者参会情况上发生了哪些明显的变化?

周明:这是一个值得探讨的好问题,现在的 ACL 的文章主要有这样的特点——聚焦大数据驱动、神经网络方面的内容,所以文章的技术水平很高;但内容都千篇一律。20 年前大家是基于规则的,语言学规则大家有各自的想法,那时是皓首穷经要写上万条规则,所以 20 年前的文章,个性化更强,在研究方面所下的功夫会比现在更深。

现在是一个好的时代,但是我们更应该用开放的心胸看待历史,格斗小战象充分尊重前辈的工作,从而找到未来新的增长点,即不要拘泥于现在所谓的「深度学习方法」,也应该考虑到人类知识和大数据以及人的各种因素,将其糅合在一起,从而开创一个新的时代。

马颂德:回顾这些会议这么多年来「想解决什么问题、在做什么努力」会对今后很有用。因为我们可能会碰到类似的问题,就可以有类似的解决办法。而反观这些年计算机视觉方面包括 ICPR、ICCV 做的事情可以发现,虽然我们想构筑一个人工智能计算系统或者计算机视觉系统,但这些年的文章、讨论的问题却是在努力寻求突破,而这些内容的本质就是加知识。当然现在计算机视觉领域也有许多做的东西可能方向不太对,但所做的很多努力是能结合今后需要再继续深入研究下去的。

郑宇: ICCV 和 CVPR 有没有区别?有多大区别?

张正友:两者有很大的区别。从频率来讲,ICCV 两年一届,CVPR 一年一届;从规模来讲,我第一次参加 ICCV,规模是两百多人,那时 CVPR 也差不多两三百人,而今年 CVPR 已经达到了九千多人参会;从内容来讲,ICCV 更偏向理论的,更有指导性的工作;CVPR 是更偏向于应用方向的研究;所以 ICCV 的门槛要比 CVPR 更高。

而近年来,会议的一个很大变化是中国人的参会比例。今年 CVPR 的会议,华人投稿比例达到 40%,参会华人估计超过 50%,华人在计算机视觉这个领域参会的人数非常多。除了门槛原因,这也侧面反映中国人掌握应用技术的能力是相当强的;但也希望我们今后的发展,可以更多往原创性方向努力。

郑宇: IJCAI 和 AAAI 有没有什么独立存在的意义?AAAI 与 KDD 的变化以及两者的联系是什么?

杨强:IJCAI 从 1959 年走到今天也犯了很多错误,特种兵对攻这些错误既对我们有教育意义,也反映了人工智能走的一些弯路。人工智能一开始追求的是比较高级的智能,比如:推理、证明定理、下棋,所以有很多这方面的人工智能的研究;但是它却忘记直接让机器去接触这些最原始的数据。所以现今 NLP 大火则告诉我们,不要追求那些看上去高大上的内容而忘记基础。其次,因为 IJCAI 追求这些高级智能,所以一开始 IJCAI 就决定了哪些方面不是 AI,并拒收该类论文。但今天这些拒收领域的参会人数比 IJCAI 更多,包括 CVPR、ICCV 等等的会议就是在这个基础上建立的。尽管这些会议各自蓬勃发展,但会延迟整个人工智能的发展,甚至对这些单独的领域起到延迟作用。

而谈到 AAAI 和 IJCAI,首先 AAAI 的历史是来自美国人工智能的,它是以美国人为主所建立的,至今没有出过北美,只去过一次加拿大。但是 IJCAI 由世界轮流举办,所以每次开会都有一天时间是各国的人工智能学会,大家一起讨论各国的人工智能发展,只是很可惜每次中国人工智能学会都没有参加,也希望这一点在未来能有所改变。

至于 KDD,它本身是由数据库那个方向发展过来的,它里面汇聚了很多数据库的人士,专注于数据科学这个方向;和 AlphaGo、无人车这些全自动驱动的人工智能还是有一定的区别。

郑宇:关于 ICRA 会议,有什么变化?

陈义明:ICRA 是从 1984 年开始的,至今已有 35 年的历史。这个会议过去是偏理论为主,但近 10 年来开始偏向应用方面,墓地守夜人并且参会人员也从只有学校和研究单位,逐渐加入了越来越多的公司。但不管哪个行业应用,针对机器人领域来说,最重要的就是落地。

既然是一个应用学问,它会跟整个技术发展有一连串相关关系。最早机器人跟随汽车业,中国的机器人起源也都是跟汽车工业有关。之后才开始有了移动机器人、医疗机器人等等,所以从它的内容来讲,也主要与时代热点相关。2000 年左右,因为本田推出双足机器人,所以那段时间双足机器人的文章就非常多。在前三五年无人机比较热门,所以无人机的文章就非常多。一直到最近这两年,大家都要用深度学习,很多人就一定要用深度学习来做工业机器人、无人机等等。但最重点是可以从中看出,现在大家对这个应用越来越重视,尤其是落地行业的应用。

郑宇:这些会议最近一届参会人数是多少?

周明:ACL 去年是 2000 多人,今年大概会突破到 2500 至 3000 人。

张正友:CVPR 今年有 9000 人。

杨强:上一届 IJCAI 在瑞典,大概 7000 人。

陈义明:ICRA 今年刚在加拿大蒙特利尔办的,大概有 4000 人。

二、新会迅速崛起,是挑战还是机遇?

郑宇:NeurIPS 最近参会人数有 1 万多,这个会议为什么能崛起?背后有什么样的原因?这些现象说明了什么?

周明:其实 ACL 最近提交论文数量也是爆增,主要原因我认为有四点。第一,现在数据集太多,几乎每年都会新增几个数据集;第二,方法层出不穷;第三,博士生毕业需要撰写相应的论文;第四,中国龙消消看被拒论文流于各个会议,所以每个会都会承接部分相同的论文。但总体来讲,现在的会议都特别相似,所以会议规模太大并非好事,因为大家都从众来做这些事。相反,我更倾向于一个小而精的会议,这样的会更容易让大家坐在一起深入讨论一些方法。

张正友:CVPR 2017 年的时候是 5000 人,今年是 9000 人,假如按照这样的曲线发展,会议量将非常大。我们去开会没有时间听报告,更多是见见老朋友,朋友之间聊聊互相做的事情,所以现在参加会议目的已经很不一样了。真正要做学术,正如周明所说,还是在小会议、闭门会议聊得会深入些。

陈义明:ICRA 是机器人领域最大的会议,它基本上是一支独大,规模也在成长;但毕竟学者总数还不多,因此成长空间有限。现状是很多小会依附于大会,然后大家在大会上见老朋友,在这些小会上讨论详细的领域,所以现在大小会的交叉融合,我认为是一个生态的演化。

郑宇:NeurIPS 的火热程度与深度学习的爆发和应用有很大的关系,但深度学习是不是也会遇到寒冬呢?

杨强:我觉得「深度学习热」是有原因的,因为之前我们主要是从逻辑的角度来做的人工智能,知识的方法根据规则而来,并没有考虑人的大脑结构。但现在发现人是一个鲁棒性非常强的分布式的知识表达,在这种知识表达的思想下设计出来的机器虽然不一定是深度学习的表达,但是它确实是当前最有代表性的。我觉得再往下应该沿着这个方向继续走下去,不一定是接着深挖现在有的神经网络式深度学习,也许还有其它的秉承这种分布式的思想,并且具有高鲁棒性、高并行,能够做知识的非线性转化的方法。所以在这一领域,我们还有很多的路要走。

三、聚焦 AI 大势,学界、业界何解?

郑宇:深度学习在自然语言处理这个领域里面,其重要性和未来的前景如何?现在学生应该花更多精力在深度学习,还是应该反思之前的方法?

周明:我有两个打引号的著名观点,第一个观点是要「与时俱进」,即在你还对这个领域不太了解之前,就先跟随别人。第二个观点是「挑战权威」,即在已经了解这个行业的情况下,提出独到的观点,实现超越。人在任意时刻都是这两个矛盾的有机统一,不同时刻要有不同取舍。

张正友:深度学习的成就还是有目共睹的,无论是在计算机视觉、语音识别还是在 NLP 方面都有很大的进展,深度学习可能会成为一个工具。对每个学生来讲,是需要花时间去了解这个工具的;而之后的发展则要根据个人兴趣。有些学生目的不是要做研究,可能需要掌握深度学习,因为目前在工业界最有用的工具可能就是深度学习;但如果要做研究,那么你去深入思考深度学习背后的一些问题,然后进行创新,可能会更好。

郑宇:在学界和在工业界做人工智能,各有什么样的利弊以及优势与劣势,特别是从学界到工业界,最大的变化和挑战是什么?

杨强:我在学术界往往是深挖一个东西,持续做 10 年、20 年。迁移学习我做了 20 多年,最后写出一本书,这是在学术界的做法。而在工业界就是发现问题,比如在工业界我就发现公司和公司之间、部门和部门之间数据不通,即部门墙。很多人就认为 AI 没法做,但我认为这是机会,所以我尝试在保护数据隐私的情况下,打破部门墙。这是到了工业界才发现的问题。

张正友:工业界和学术界确实是很不一样的,学术界在现在这个大数据时代往往拿不到大数据,只能在相对较小的数据里面做研究,最终效果可能很好,但到工业界要在实际中应用,你会发现很多问题;在学术界可能你会专注于写文章、发表,但是在工业界则是把重要的问题都解决掉,其中可能不光是一个问题;在学术界可能你喜欢某一个方法,你就沿着这个方法深挖、钻研,这个问题本身可能没有实际应用,但在工业界则是以问题为出发点,有哪些重要的问题,那么我们就需要想办法来解决这个问题。

郑宇:请马老师说一下学术界的优势,之前有个观点说好像工业界把学界的人挖得差不多了。

马颂德:因为人工智能很火,学生毕业后假如还留在一般的研究机构,可能收入会和工业界差很多倍。现在可能我们不需要这么多研究,所以有很多人转到工业界,国际上也是这样,很多人进入了工业界的研究所,这是正常现象。我们不太能说清学术界在基础研究方面能够提出很多有价值的问题或者在近期可以做出重要的突破,但我们仍然需要研究,它是必须的,也是应该的,只是它的队伍的稳定或者价值观等,还需要大家来共同努力。

郑宇:有什么好的办法可能保持队伍的稳定性并培养优秀人才?

陈义明:事实上,国内很多做 AI 的人士是从新加坡回国的,所以现今新加坡还能维持当前的状态,主要还是因为它比较国际化。除了吸引华人之外,新加坡也吸引了世界各国的人来工作。但机器人的状况不太一样,因为真正懂机器人的人是比较少的,现在全世界都缺这类人才,而且培养起来要花较长时间,所以解决方法只能是从头培养。

周明:首先看到学术界的人才流失是正常的现象,这是它自身规律所在。第一,因为学校是培养人才的地方,出很多全新的研究成果较难,更多的都是跟随别人;所以很多人的想法是与其跟随别人,不如到工业界发挥更大的作用;第二,反观现在出现这种情况有深层的社会原因,可能有政府政策导向、市场因素等等,这需要国家共同带动好的研究气氛与文化,来将优秀的人才留在学校;第三,业界跟学校的真诚合作并非挖人,而是真正帮助学校将其研究土壤立起来,帮助老师走向国际化,把更好的学生培养出来。

郑宇:在 AI 的道路上,学生应该有哪些东西要注意的,怎么样培养自己的能力?

周明:我觉得最重要的就是找一个好的导师。

马颂德:因为各个学科不一样,在人工智能领域,对地点、对老师、对各方面的选择非常重要。

张正友:一个学生如果真想做研究的话,还是要带着一种热情,你就能够比较持续地坚持你要走的科研道路。不要怕坐冷板凳,现在看起来人工智能很火红,但之前这个领域的图灵奖获得者也坐了 30 多年的冷板凳,所以真想要做科研,要有坐冷板凳的精神。

杨强:除了找好老师,还得多跟老师交流,要善于交流,要勇敢;其次是要有一个好的平台,这个平台会有很多资源给你,包括数据资源、问题资源、周边的一些朋友圈;然后个人要勤奋、要好奇、要有热情。

陈义明:我觉得还有一点也很重要,希望各位同学一定要保持一个开放的心态。做研究,你的热情很重要,你不能只等老师给你题目,自己也要主动去发掘题目。

四、AI 未来何去何从

郑宇:用一句话总结你心目中中国的未来 AI 将是如何?

陈义明:我觉得未来中国的 AI 发展一定会非常好,因为中国的应用场景是全世界第一,机器人需要很多的应用场景。

杨强:我觉得科学不分国籍,要本着开放的心态。

张正友:我也同意陈老师的讲法,中国的应用场景无论是人工智能还是机器人都非常强大,前景是非常好的,希望中国人工智能发展越来越好。

马颂德:中国在 AI 方面的应用一定会是全世界规模最大的,但是在 AI 的基础研究方面要有重大突破,我现在并不乐观,也可能全世界都没有这样的突破。我们采访了全世界目前在人工智能方面最有权威的一些专家,他们也都表示对 AI 的未来有不同的看法,比如「到底能不能实现真正的人工智能」,大家的看法的差别很大。有人说要 20 年以后能实现,有人说 200 年以后才能实现。而这一切都依赖于重大的突破,这方面我现在无法预测。但可以确定的是,目前中国能够看到的 AI 应用是世界组成中最大的一部分。

周明:理论研究固然重要,但是它是需要时间的,我认为中国把实用系统做实做好,踏实苦干可能是最重要的。