从零开始下围棋 AlphaGo Zero更加强大

news.imobile.com.cn true http://news.imobile.com.cn/articles/2017/1019/181110.shtml report 1734

美国时间10月18日,《自然》杂志在官网刊登了一篇名为《Mastering the game of Go without human knowledge》的论文。该文章(点我查看PDF)详细介绍了DeepMind公司旗下人工智能算法AlphaGo Zero的特点。

AlphaGo Zero最厉害的地方在于,它不需要人类专家的指导,就能通过自我强化学习来进行训练。直白一点地说,之前打败围棋大师李世石的AlphaGo可能需要人类给它提供各种高手棋谱来进行训练,而Zero就是一个完全的小白,人类也不用教它什么,只需要告诉它规则,它就能完全通过自学的方法来掌握围棋。

和前代版本相比,Zero在效率上有着明显的提升,现在仅需要4块TPU(由谷歌构建的专门的AI处理器)和72个小时的训练,就能胜过之前几个月训练时间的AlphaGo。

根据DeepMind联合创始人Demis Hassabis介绍,AlphaGo Zero的出现意味着,现在他们可以向社会提供类似于科学研究的人工智能引擎。通过摆脱对人类的依赖,这样的算法使得人工智能在其他科学领域上的应用成为可能。

来源: 手机之家

微博评论

之家评论

© 2002-2016 imobile.com.cn 手机之家 所有权利保留 违法和不良信息举报电话:18600380067

京ICP备09079639号 京ICP证090349号 电信业务审批[2009]字第281号 京公网安备 11010502030387号