棋坛风云再起,4月10日下午15时,中国围棋协会、浙江省体育局携手Google在北京中国棋院共同宣布,三方将联合主办“中国乌镇·围棋峰会”,如之前猜测,人机大战第二季终于揭开帷幕,围棋世界第一人、金立智能手机的品牌文化大使柯洁将大战阿尔法狗(AlphaGo)。
5月23,25,27日,柯洁与AlphaGo三番棋:每方3小时,5次1分钟读秒。
其实端倪早现,3月19日,在央视《朗读者》节目中,柯洁九段朗读了《哈利波特与死亡圣器》最后一个节选,内容是哈利波特与伏地魔第一次也是最后一次正面对决,柯洁表示这段文章要“献给未来的对手”,已经暗示了即将到来的与阿尔法狗的比赛,只是碍于谷歌公司的保密条约,不可明言罢了。
第一次人机大战之后,柯洁何时与“阿尔法围棋”对决就成为了大家热议的话题,这不仅仅是围棋界、也是科技界及普通大众期盼。
就在AlphaGo和李世石的比赛期间,金立智能手机顺应潮流,神速签约柯洁,即将到来的五月,AlphaGo和柯洁的大战,显示出这是金立下出的“神的一手”、一个绝妙的伏笔。
AlphaGo获得最终的胜利几乎没有悬念,但围棋人工智能的最高水平与人类最高水平之间的对决,本身的意义却是非同凡响。围棋被认为是人类棋类游戏的巅峰,最难也最为复杂。围棋表达了一种静默的思考、宠辱不惊的气度,是人类智慧的杰作。进入21世纪之后,围棋这项中国古老的技艺不衰反兴,几乎是所有幼儿园、小学必备的兴趣课,其最重要的原因是围棋最能代表中国文化,也是最好的智力游戏。人工智能代表着科技的未来,从某种意义上说,也是人类的未来,人机之战,是人类智慧的延伸,也是人类对未来的一次探索。
AlphaGo的研发团队DeepMind表示非常希望与中国顶尖棋手举行比赛,共同探索围棋的上限,通过此次比赛发现围棋的更多下法,将围棋运动推向更高的水平。
柯洁九段表示:三百年前发明了蒸汽机,超越了当时人类想象。如今DeepMind发明AlphaGo也超出了我们所有棋手想象,与他对决时感觉就像在对话未来。自己会尽最大努力下好棋,抱有必胜心态、必死信念,不会轻易言败,不会轻易妥协。
网络上,围棋和人工智能话题再度点燃,不禁让大家想起一年前,2016年3月15日,李世石完成了与阿尔法狗的5场交锋,最终比分定格在1:4;数月前AlphaGo化名Master,网络上和人类顶尖围棋高手过招,取得60:0的绝对优势。
去年李世石人机大战的AlphaGo版本V18,在网络60胜的是Master是V25版本,此次峰会柯洁将面对是最新的版本,序号不详……
人类好像不再应该对战果再有丝毫的乐观,甚至不该心存侥幸,战斗还没开始,结局就已经注定。可事是真的是这样吗?
围棋AI中最重要的技术是人工神经网络和蒙特卡洛树搜索两个算法,普通人很难理解这两个算法的原理,自然就忌讳莫深,容易出现判断偏差。
人工神经网络是由大量的简单基本元件——神经元相互联接而成的自适应非线性动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统行为却非常复杂。
人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。
与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。
人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。
网络学习的准则是:如果网络作出错误的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。
如果输出为“0”(即结果错误),则把网络连接权值朝着减小综合输入加权值的方向调整,其目的在于使网络下次再遇到“A”模式输入时,减小犯同样错误的可能性。如此操作调整,当给网络轮番输入若干个手写字母“A”、“B”后,经过网络按以上学习方法进行若干次学习后,网络判断的正确率将大大提高。这说明网络对这两个模式的学习已经获得了成功,它已将这两个模式分布地记忆在网络的各个连接权值上。当网络再次遇到其中任何一个模式时,能够作出迅速、准确的判断和识别。一般说来,网络中所含的神经元个数越多,则它能记忆、识别的模式也就越多。
蒙特卡洛树搜索,全称 Monte Carlo Tree Search,是一种人工智能问题中做出最优决策的方法,一般是在组合博弈中的行动(move)规划形式。它结合了随机模拟的一般性和树搜索的准确性。
MCTS 受到快速关注主要是由计算机围棋程序的成功以及其潜在的在众多难题上的应用所致。超越博弈游戏本身,MCTS 理论上可以被用在以 {状态 state,行动 action} 对定义和用模拟进行预测输出结果的任何领域。
MCTS 搜索可能需要足够多的迭代才能收敛到一个很好的解上,这也是更加一般的难以优化的应用上的问题。例如,最佳的围棋程序可能需要百万次的交战和领域最佳和强化才能得到专家级的行动方案,而最优的 GGP 实现对更加复杂的博弈游戏可能也就只要每秒钟数十次(领域无关的)交战。对可承受的行动时间,这样的 GGP 可能很少有时间访问到每个合理的行动,所以这样的情形也不大可能出现表现非常好的搜索。
幸运的是,算法的性能可以通过一些技术显著提升。
很多种 MCTS 强化的技术已经出现了。这些基本上可以归纳为领域知识或者领域独立两大类。
领域知识特定博弈游戏的领域知识可以用在树上来过滤掉不合理的行动或者在模拟过程中产生重要的对局(更接近人类对手的表现)。这意味着交战结果将会更加的现实而不是随机的模拟,所以节点只需要少量的迭代就能给出一个现实的收益值。
领域知识可以产生巨大的性能提升,但在速度和一般性上也会有一定的损失。
领域独立强化能够应用到所有的问题领域中。这些一般用在树种(如 AMAF),还有一些用在模拟(如 在交战时倾向于胜利的行动)。领域独立强化并不和特定的领域绑定,具有一般性,这也是当前研究的重心所在。
你如果能从上面一大堆绕人的学术问题中理清头绪,就能发现,经过这多长时间的准备和背后的技术支持,人工智能已经能充分发挥出自己的优势了,现在,人工智能围棋水平的提升面临的是另外一个瓶颈,算法瓶颈!
AlphaGo之前,最强的围棋人工智能软件只能达到业余3—4段水平,并且当时的研发者也没有短期内突破信心,是谷歌的研究改变了这种局面,是谷歌公开部分技术造成了当前高水准的围棋人工智能争奇斗艳局面。
AlphaGo问世差不多两年的时间,我有足够的理由相信,围棋人工智能的水准已经接近目前算法的极限水准,如果算法没取得重大突破,围棋水平不会出现显著进步了!
现在的软件围棋水平已经比任何一个围棋高手强了,经过实战验证,快棋领域已经是它的私家花园,唯一的希望在慢棋上。
慢棋,电脑的计算速度快的优势被削弱不少,围棋对局中双方斗智斗勇,千古无同居,只要水平相差不是很悬殊,不是说水平高的就一定能取得胜利,只是胜算大一些而已,当今大赛中,排名靠前的高手走麦城的例子不胜枚举。当年,较如今水平弱一些的AlphaGo能给李世石机会,现在,比李世石强一些的柯洁出马,未必没胜机。
只是这不是一场普通的比赛,赛场内外,柯洁需要承受的压力很多,而要达成这一目标,最大的拦路虎是棋手的心理素质,面对冷冰冰的非人类对手,柯洁能“保持一颗大心脏”,不受心理因素影响,发挥出最佳水准,争取到这稍纵即逝的机会吗?对此,我们也只能寄望和祝福,或许这一场对抗柯洁的胜算不大,甚至很多人认为低到只有10%,但是这不也是一线曙光吗?柯洁能拿下人机对抗的最后一局胜局吗?他只有三次机会。
早在2007年,金立就开始赞助中国围甲联赛,推动围棋事业的发展。在金立与中国围棋携手走过的十一年间,共有13位中国籍围甲棋手24次获得世界冠军,中国围棋在世界棋坛中也逐渐夺回霸主地位。而对中国围棋事业的支持,已变成了金立品牌的一种超级续航精神,也是金立对传统文化和人类智慧的敬畏。
围棋,不只是计较一子一目的得失,更有放眼全局的取舍和战略,是一种长距离的“超级续航”,而正是这种全局观和“超级续航”的精神,使得金立从数次行业洗牌中脱颖而出,成为手机行业的翘楚以及资格最老的品牌,也成为了全球知名的科技企业之一,围棋与金立的遭遇,奠定了中国围棋的盛世之基,也造就了一个纵横商界的传奇。