活动专区 【第九届中国云计算应用论坛】清华大学教授吴及:知识与智能

【第九届中国云计算应用论坛】清华大学教授吴及:知识与智能

更新时间:2019-01-17 11:37:26    作者:本站编辑    来源:大数据周刊    分享到:


来源:CIO时代网

  2019年1月13日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,互联商苑BBS教务办协办的"第九届中国云计算应用论坛"于北京大学中关新园隆重举行。清华大学电子工程系副系主任、博士生导师吴及教授在论坛上发表了题为《知识与智能》的主题演讲,以下为演讲实录:
\
  清华大学电子工程系副系主任、博士生导师 吴及教授
 
  大家好,我今天汇报的题目是"知识与智能",我先回顾一下人工智能历史,然后谈一些自己的感想。
 
  人工智能
\
  "人工智能"源起于1956年达特茅斯会议,人工智能是一个不断变化着的概念,到今天为止,也没有人能给出人工智能的准确定义;在人们讨论人工智能的时候,每个人对这个词的理解可能有非常大的差异。
 
  人工智能的三条技术线路
\
  从人工智能发展来讲,有三条技术路线:一是符号主义,用符号来表征知识,希望用符号推理来运用知识。这条技术路线在人工智能的早期取得了显着的进展,它最典型的成果是用计算机来证明定理,譬如对四色定理的证明是一个非常重要的成果;二是联结主义,认为知识不是存在于特定的单元之中,而是说联结才产生知识。我们现在这一次人工智能的兴起,联结主义占据了主流地位;三是行为主义,它就是把自己作为一个普通生命体,能够跟外界交互,能够在现实世界中生存。比如说机器人能行走、跑,甚至能上楼梯,这就是从行为主义角度它表现的更像有生命的智能体。所以说人工智能,其实有很多不同的具体的研究方向。
 
  人工智能的三次浪潮
\
  人工智能第一次浪潮是1956年达特茅斯会议之后。人们在定理证明,积木世界方面开展了很多研究工作。第二次浪潮是80年代,典型的就是日本的五代机,当时就想用计算机做语音识别、图像检测等,也包括专家系统的兴起。神经网络的反向传播,也是在那个时候提出来的。第三次浪潮是2006年,Hilton提出了深度神经网络和深度学习的概念。2011年微软宣布用深度神经网络,使语音识别错误率下降了30%,2012年的Imagenet上,基于深度神经网络的系统再次取得完胜。2011年的沃森在电视智力问答比赛Jerpody中战胜了最顶尖的人类选手,2014年Google无人驾驶汽车获得加州上路许可,2016年阿尔法狗战胜李世石,都是这一波人工智能浪潮中的一些标志性事件。
 
  第三次浪潮兴起的原因
\
  人工智能第三次浪潮再度兴起的原因是什么?首先是基础设施,云计算具备了近乎无限的存储能力和计算能力,为人工智能发展提供了基础设施;二是在非常多的应用当中,我们能采集和利用很多数据,大规模可用数据如同不可或缺的氧气,有了数据就可以训练复杂的模型;第三是深度学习算法的提出和发展,可以说是舞台上翩翩起舞的表演者。当然在这三个非常重要的原因背后是无处不在的互联网,他们连接了存储和计算。
 
  AlphaGO对普通老百姓影响力非常大,Deepmind选择了一个非常好的场景。,他找了一个广为人知的项目,并通过和职业棋手的对决,把人工智能宣传打到了深入人心的程度。最早是2016年1月AlphaGO战胜欧洲冠军樊麾,接着是在五番棋中战胜了李世石,接着化名为Master在2017年初在网络上取得了对职业顶尖棋手的60连胜,2017年5月在三番棋中战胜柯洁。2017年10月,新一代的AlphaZero以100:0的战绩上一代的AlphaGo AlphaGO用了人类下棋的棋谱来训练,而zero完全依靠自己跟自己下棋就打到提高到这样的性能,所以他们说"无人自学三天,胜过去3000年"。
 
  Google认为数据最重要,只要有数据,就能把事情做好,做的比人还好,这是Google骨子里深信不疑的事情。但是符号主义的科学家是不认同这一点,认为归根结底需要知识。所以这两派观点的争论有时候很激烈,在最近十年来讲,Google是占上风的。甚至在一些场景,Google用非常简化的算法就取得了很好的性能,就是因为他使用规模大得多的数据。
 
  未来我们发展人工智能技术,仅仅需要数据就够了还是说需要知识?我个人观点还是需要知识的。举个例子,假如有两个人在大街上相遇。一个人说我想上厕所,另一个人对他说拐角处有一个肯德基。这个对话就结束了。一般人都会理解,因为肯德基有对公众开放的洗手间。但是对于机器来讲,就算有更多的数据它也很难理解这个含义。理解这个事情其实还需要额外的知识。这是人工智能另外一派的观点。人工智能是关于知识的学科--怎样表示知识以及怎样获得知识并使用知识的学科。
 
  我们近几年开展智慧医疗方面的研究,2017年我们开发了一个“智能助理”的系统去参加国家执业医师考试,这个考试是医生获得行医许可所必须通过的高利害考试。医考的综合笔试两天四场,每场150分钟,我们的“智医助理”每场所用的时间都少于18分钟,效率远远高于人类应试者;满分600分,通过线360分,智医助理系统考了456分,超过96.3%的人类考生,这可以说是一个非常好的成绩,我们的智医助理也成为全世界首个通过国家执业医师考试的智能系统。从技术上讲,我们这个工作的核心问题有两个:一个是知识表达,一个是知识运用。知识的表达,对计算机来讲非常困难。我们可以把很多数据存在计算机里,包括用搜索引擎搜索它,但这样的知识表达是给人看的,机器无法理解这个知识。同时使用了符号表示和向量表示,前者便于人的理解,后面利于机器的计算;第二是推理,人在解决很多问题时医考逻辑来进行推理。但让计算机表达和实现逻辑是有困难的。这个逻辑一旦复杂到一定程度,计算机很难有效表达,很难解决扩展性的问题,所以这条路没有走通。有了神经网络之后,我们用计算代替推理。这个结果的得出是靠模型和算法算出来的,在这个工作我们就构造了比较复杂的模型结构来实现推理。
\
  我们现在在面对很多具体应用时还是遇到很大的困难。深度学习、深度神经网络,既需要有大规模数据,又要有非常精确的标注。但很多实际情况中,我们并不具备这样的条件,甚至不论你付出多少代价,可能都无法做大,所以实际应用中,普遍存在数据质量不高、真实案例采集困难、标注成本很高还不够精确。那么这对模型的构建和有效训练是很大的挑战,因此也是现在机器学习或者人工智能发展当中遇到主要困难之一。我们认为根本性的解决办法是需要数据的,但数据的问题需要知识来补偿。
 
  人工智能的发展与应用不会一帆风顺
 
  IBM公司很早转型提供企业服务,而且是高端咨询服务。在认知计算、商业智能方面都做了很多实践。人工智能、认知计算这样的技术想要运用到企业当中并不是容易的事情,IBM总结自己的时间,给出了一些基础条件:一是定义价值。认知计算系统的优势往往在最初部署时不能够立即体现,强烈建议向一组真正理解其不断演变的特点的可信用户部署认知及计算解决方案。认知计算它有演进的能力。具有迭代优化的能力,并且在这个过程当中才能使自己的优势逐步的展示出来,所以在刚部署的时候并不能马上看到很大受益,需要时间逐步优化,慢慢地越变越好;二是奠定基础,对于企业来讲需要有人才,需要有高质量的数据,需要考虑人工智能和人只计算对流程与政策的要求和影响,有的企业很难做到这点。改造一个企业流程、制度时,是非常困难的事情。第三,对于一个企业来讲,引入人工智能是一种变革,所以要学习管理变革,首先高管要积极参与,如果没有公司决策层的参与,很难真正的改变,所以很多时候会失败。其次,各级要有效沟通,要让企业从上到下各个层面,无论高管,中层干部还是普通员工,都要能认识和掌握怎样才能做得更好。第三是用户的教育和理解。认知计算系统是基于统计的,具有概率性,而不是完全确定的,不要期望100%奏效。如果不能认识到这样的一些实践中要点,企业往往会以失望而告终,所以用智能化影响和改造各行各业,是一个非常重要的关键性的变化。我认为IBM的总结是真实经验的积累,告诉我们企业从当前的状态向未来的迈进需要经历很多变化,需要克服很多困难。
 
  人工智能的发展前途是光明的,道路是曲折的。谢谢大家!


标签
吴及 | 知识与智能