天文可公度模板与拓扑结构学是大数据应用的内核
DeepMind 如约公布了他们最新版AlphaGo论文,也是他们最新的Nature论文,介绍了迄今最强最新的版本AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。AlphaGo已经退休,但技术永存。DeepMind已经完成围棋上的概念证明,接下来就是用强化学习创造改变世界的价值。
今年5月乌镇围棋大赛时,DeepMind CEO Hassabis 表示,将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天,DeepMind在他们最新发表于Nature的一篇论文中,描述了迄今最强大的一版AlphaGo—— AlphaGo Zero 的技术细节。
AlphaGo Zero完全不依赖于人类数据,因此,这一系统的成功也是朝向人工智能研究长期以来的目标——创造出在没有人类输入的条件下,在最具挑战性的领域实现超越人类能力的算法——迈进的一大步。
作者在论文中写道,AlphaGo Zero 证明了即使在最具挑战的领域,纯强化学习的方法也是完全可行的:不需要人类的样例或指导,不提供基本规则以外的任何领域知识,使用强化学习能够实现超越人类的水平。此外,纯强化学习方法只花费额外很少的训练时间,但相比使用人类数据,实现了更好的渐进性能(asymptotic performance)。
在很多情况下,人类数据,尤其是专家数据,往往太过昂贵,或者根本无法获得。如果类似的技术可以应用到其他问题上,这些突破就有可能对社会产生积极的影响。
是的,你或许要说,AlphaGo已经在今年5月宣布退休,但AlphaGo的技术将永存,并进一步往前发展、进化。DeepMind已经完成围棋上的概念证明,接下来,就是用他们的强化学习改变世界。
这也是为什么接下来我们要介绍的这篇论文如此重要——它不仅是很多人期盼已久的技术报告,也是人工智能一个新的技术节点。在未来,它将得到很多引用,成为无数AI产业和服务的基础。
迄今最强大的围棋程序:不使用人类的知识
新系统AlphaGo Zero实现了超人的表现,以100:0的成绩击败了此前发表的AlphaGo。
DeepMind这篇最新的Nature,有一个朴素的名字——《不使用人类知识掌握围棋》。
从此,阿尔法狗让天下一先!
我们来看看围棋建立的可公度模板:
太一居中,三百六十度周天环绕,形成周天运算模式,而落子行间普遍在三,四线为主更加合理,与易经之不三不四,雷风相薄之位契合。
我们再来看看围棋建立的拓扑结构:
黑子,白字,象征阴阳;死活象征生死;两眼则活象征阴阳一呼一吸,生生不息。
而计算地球上面的万事万物的复杂性巨大,但是万变不离其宗,也就是建立立体周天的模板,把可公度模式建立起来,拓扑结构则是五行,八卦,九宫,十天干,十二支,二十四山,二十八宿度,三十六宫,六十四卦,七十二候,三百八十四爻等等。如果觉得拓扑结构的名词比较神秘或者拗口,可以换成其他的名词,例如ABC,12345等等,只要你喜欢。
我们简单举例说明:通过可公度法计算经纬交点,指向立体天球的最南端,对于地球而言就是南极区域;然后以南极区域进行再一次可公度法计算,算出经纬交点指向南极某地;的以南极某地再次进行可公度计算,得到中国南极考察站。以中国南极考察站再次进行可公度计算,得出隔壁老王的具体位置。这样就通过拓扑原理达到了精准定位。
可公度法和拓扑原理都是西方的发明,我们其实早在数千年前,上古中国就已经具有了这样的完善知识,只是应用名词不同,最终被神秘化。
当文明处于低层次的时候,没有办法具体量化数据,这时候神秘文化越有市场,圣人则出。一旦人类文明突破量化思维的瓶颈,寻找到可公度法应用路径,圣人不圣,万物元有,返璞归真!