在各种棋类都能打败人类之后,DeepMind终于把目光投向了那些战胜过人类的同类。
昨天,AlphaGo 研究团队提出了 AlphaZero:一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法。
那AlphaZero到底有多厉害呢:
8 个小时训练击败李世石版本AlphaGo
12 小时训练击败世界顶级的国际象棋程序 Stockfish
14小时训练击败世界顶级将棋程序 Elmo
就算是面对强大的AlphaGo Zero,AlphaZero在训练34小时后,也战胜了训练72小时的前者。对,细心的朋友可能已经发现其实二者就差了一个“Go”,那是因为DeepMind认为最新的AlphaZero已经超越了围棋这个界限,所以去掉了作为代表的“Go”。
面对这种全棋种制霸的AI小编只想说,以后各位有了孩子,就别往职业棋手方向培养了吧。。。