去年,阿法狗4-1打败世界冠军李世石,从此人间无敌手。今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自己参悟,100-0打败哥哥阿法狗。他的名字叫阿法元。
DeepMind这项伟大的突破,今天以Mastering the game of Go without human knowledge为题,发表于Nature,引起轰动。
下面是nature的文章截图:
人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。
而这篇论文在一定程度上很好的达到了这个境界。下面是DeepMind网站截图
那么到底新的阿法元需要训练多久呢?与之前的阿法狗相比较而言呢?
达到对阿法狗100:0这样一个水准,阿法元只需要在4个TPU上,花三天时间,自己左右互搏490万棋局。而它的哥哥阿法狗,需要在48个TPU上,花几个月的时间,学习三千万棋局,才打败人类。下面是这篇论文的作者:
精彩评论