阿尔法首次复盘人机大战  自评等级分远超柯洁

31.03.2016  10:45
阿尔法首次复盘人机大战  自评等级分远超柯洁 - 海口网
阿尔法首次复盘人机大战  自评等级分远超柯洁 - 海口网
来源: img.hkwb.net

 

人工智能将走入人类生活

  “谷李”世纪大战硝烟散尽,由此引发的机器学习与人工智能的热潮不减反增。日前,AlphaGo (中文俗称“阿尔法狗”)项目负责人,有着阿尔法狗之父之称的大卫·席尔瓦(David Silver)回到英国伦敦,在母校伦敦大学学院(UniversityCollege London,UCL)一场私密会上复盘了人工智能围棋系统AlphaGo与李世石的5番棋大战,在场的听众被禁止拍照。这也是赛后,阿尔法狗团队的首次半公开复盘。

  UCL计算机系是全英计算机排名第一的学院。在UCL计算机系攻读博士学位的中国留学生张伟楠全程参与了这次分享会,并且在会后与席尔瓦进行了面对面的交流。钛媒体独家约稿张伟楠,根据席尔瓦的分享及会后与席尔瓦的交流,写作此文, 席尔瓦也透露了AlphaGo的下一步可能动向以及应用前景。 席尔瓦透露,AlphaGo的最新版本自我估分在4500左右,远远超出积分3625的柯洁,实力水平大约在13段左右,人类选手中已然无敌。

张伟楠与阿尔法狗之父席尔瓦在交流

  两周前的那场人机大战,AlphaGo出人意料地获得了压倒性的胜利,4:1战胜了李世石。棋局进程激烈精彩之处,不亚于那些人类棋手创造的历史名局。

  3月24日,回到UCL大学,席尔瓦在复盘中详细讲述了AlphaGo背后的技术原理以及谷李5场比赛的分析。

  获得历史性的胜利之后,外界十分关心AlphaGo的下一步和未来,席尔瓦透露,在《Nature》那篇文章引发广泛关注和轰动之后,AlphaGo团队还将再写一篇论文,与外界分享AlphaGo与李世石比赛中的技术进步。

  席尔瓦还表示,DeepMind一直希望能够为开发者社区做贡献,他们之前也公布了DQN项目(deep-q-network)的代码——基于深度强化学习的游戏平台。未来他们可能会公布AlphaGo的代码,只要能找到一个合适的方案,但是目前还没有找到。

  投入20个人的团队,花费大量的财力去做围棋对弈,对谷歌来说意味着什么?下一步会如何延伸到其他产业领域?

   席尔瓦透露,DeepMind今后的着眼点是和人们日常生活息息相关,并可以改变世界的应用,比如精准医疗、家用机器人以及智能手机助手。