2016年有个横空出世的小孩,遍览从古至今的天下棋谱,战胜了人类世界的围棋世界冠军。而今年,小孩的弟弟“从无到有”,从未看过任何棋谱,只靠着棋盘和黑白二子就钻研出前无古人的下法,击败了他的哥哥。
今日,谷歌DeepMind团队在Nature上发表了最新的研究成果——其所研发的人工智能阿法元(AlphaGo Zero)在围棋领域能够不需要借助任何对先验知识的学习,就达到超高的水准。
南昌通报李宜雪已被送诊 直播间榜一大哥1周骗走女主播7.4万 被同学抱摔艺考女生本有望进全省前三
“阿法元远比以前的阿法狗先进强大,因为它不再会被现有知识的边界所局限,而能够不断创造全新的知识。”DeepMind团队的David Silver博士介绍说。他是此前阿法狗项目的负责人。
阿法狗是通过对人类历史上的棋谱数据学习,不断学习进化。而阿法元则与他的哥哥相当不同,它是通过类似于“左右互搏”的方法和自己比赛,并从中学习、进化。
只需三天的训练,阿法元就能以100:0击败AlphaGo Lee!而后者是曾经击败韩国棋手李世乭的人工智能软件。经过40天的训练和约3000万次数的棋局对弈,阿法元甚至能够击败它的哥哥——AlphaGo Master(该人工智能曾击败世界冠军柯洁)!
DeepMind发表的论文数据显示,学习人类选手围棋下法的人工智能最多只能达到和原版阿法狗相似的程度,而靠自己学习的阿法元则表现得更出色。“人类实际上‘误导’了AlphaGo”。
阿法元对于原版阿法狗的改进体现在三个方面:
第一,综合了两种类别的“增强学习方法”的长处;
第二,训练过程从完全随机开始,不依靠人类历史上的棋谱数据;
第三,采用运行速度更加快的全新结构。
可以想见的是,AlphaGoZero的问世不仅是围棋领域人工智能的突破,其采用的算法、使用的最新技术将会开拓更为广阔的领域。
“人工智能不依靠人类的知识输入而实现自我学习训练,这是至关重要的一个环节,它意味着我们离创造一个能够承担一切工作的万能人工智能的理想更进一步。”
高端的猎手通常以猎物的形式出现。