机器解读知识,从海量的知识中抽取出「元知识」-02

这是mixlab无界社区的成员Jeff的《如何让机器量化知识》系列文章的第02篇。为我们介绍知识的数据化、量化,以及如何把开放的问题转化为封闭式问题让机器解读。

本期主题是「 元知识 」,从海量知识中抽取出5000个元知识,然后以此为元素,组合出各种知识。此过程非常像mixlab之前探索过的颜色谱图的构建:聚类算法+word2vec=传统色彩图谱

本文作者

ML03 -Jeff - 产品/设计/运营/人工智能/物理

GET人工智能创始人

def extract ( knowledge ) :

「 对世界的理解从定义元知识开始 」

化学中我们常常最小的单位理解为元素,元素的排列组合建立起了我们看到的化合物到现在世界见到的物质。我们从简单量化创造象形文字,大约在公元前32世纪,我们的象形文字在500个左右,到后来公元前5-7世纪有5000个左右。基本相当于我们现在常用的中文汉字,但是随着发展,按理说文字的创造会增加,可是实际上变化非常甚微。因为我们在量化这个世界时候遇到了,我们人类本身不可逾越的记忆力困扰,我们发现一旦超过5000个新字符基本会遗忘很多。

思考:如何定义5000个「元知识」?

「 元知识 」应该是被其他知识大量引用的知识,与其他知识重合度越高,相似的知识越多的,是不是就是「 元知识 」?

这个时候元知识开始起到作用了,这个如同我们标记5000个字符为元素,那么元素与元素可以有效排列组合,这种组合就诞生了我们一个简单的知识。元知识就是最简单的组合,这些组合看似简单却拥有神奇的魔力,如同指数的增加,用单一的模式量化我们人类对世界的理解。

我们认为,「 元知识 」的排列组合,是一个在多维空间里的向量运算过程。

元知识重要在于我们能够用一个词来表达复杂的信息。在中国历史的发展中古文其实就是很可怕,我们在字符元素中的理解那么多解释,晦涩难懂。有了对元知识的创造本身就是在减轻人类对信息的记录和传播。一下子我们在过去2000年通过元知识的排列组合建立了文明和制度,如果没有元知识的组合我们的法律条文基本难以传达。正是这样的组合方式发挥让我们把信息能够有效存储,这个在人类发展中有了决定性作用。也许我们感叹过去文明的发展是如此神奇,但是在今天,我们信息已经不在只是你能够一辈子接触的几百人那么简单,互联网信息发展简化了空间的距离关系,强化了信息的指数交流。这个时候元知识似乎排列的速度更加快,快到我们人类必须进行第二次蜕变。

return 

下期预告

算法组合知识 」,用算法来重构知识之间的关系。

   关于MIXLAB

MIXLAB 无界社区是一所面向未来的实验室,它提倡“跨界创新,开放成长”的理念。

——跨界 开放 互助 学习 思维 创新。

目前社区汇集了20000+跨学科人群,主要来自GoogleBrain、微软、华为、阿里鲁班、腾讯、旷视、三角兽、物灵科技、众安保险、美团、360等科技人才、设计师及CEO和投资人;

高校分布MIT、Oxford、Cambridge、CMU、UoM、清华、北大、复旦、上交大、同济等学生及教师群体;

学科跨越机器学习、自然语言处理、量化交易、物联网、区块链、前端、后端、产品经理、UI设计、建筑设计、服装设计、珠宝设计、音乐、艺术等。

详细介绍点击以下卡片:

mixlab期待您的加入!

让你具备无限可能……

赞赏下?

点下广告

转发下?

(0)

相关推荐

  • 金融科技简述 I

    电力革命与大数据.云计算.人工智能 人类的航海历史始于以人力.风帆为动力的传统时代.近代蒸汽机和燃油发动机的出现大大提升了航海的效率,全球贸易蓬勃兴起.应用现代核能技术,航空母舰和大型潜艇在大洋中实现 ...

  • 喂养一个机器人

    互联网给商业带来的巨大变化,首先是效率的提升,这不仅依赖于它打破时空物理限制,还在于一点,对,就是最近火到让人眼睛起茧子的一个词:数据. 数据是什么,某种角度来说它是被记录的信息. 现实世界中,我们说 ...

  • 人际交往中的道理「醍醐灌顶」1

    2021-05-03 14:37:01 1.朋友圈太干净的女生一定不要追. 2.第一次见面就觉得不舒服的人,以后大概率也不会舒服. 3.如果一件事你不想让别人知道,就永远藏在心底.--不要把秘密告诉风 ...

  • 高中政治:高考中各类题型「顺口溜」解题技巧,省时又高效

    政治的记忆应该说是背诵书本的方式,想必大家一听背诵就会头疼,毕竟都是过来人,所以今天给大家整理了政治顺口溜记忆法! 顺口溜具有形象生动.合辙压韵.朗朗上口.便于记忆等优点,在思想政治课的练习中,巧编顺 ...

  • 钱币中的奇葩「二」包罗万象的诸多花钱种类 东方钱币的一枝奇葩

    花钱的种类可谓是包罗万象,其中有这么一种背面有图文的叫做钱文钱,钱文钱是将钱文文字铸于正面,背面则是图案或者其他文字,钱文钱越占花钱数量的百分之十二.钱文钱的正面钱文有"崇宁通宝" ...

  • 钱币中的奇葩「一」它是钱却不能流通 它堪称东方钱币的一枝奇葩

    在中国钱币发展历史过程中,有这样一种举世罕见的钱币现象,它是钱币,却不能流通,本身在当时也没有任何的市场价值.但是它却以其讲究的用料.高超的工艺.精湛的艺术性和独特的文物和艺术价值.审美价值.文化价值 ...

  • 4家非典型3D生物打印公司解读:除了复制外壳,更需要功能性「内核」

    在多学科的融合之下,精准医疗正在到来.作为对精准医疗领域做出直接贡献的重要角色,分子遗传学和生物细胞学在 3D 生物打印方面也发挥着重要作用. 在 3D 生物打印中,分子遗传学和细胞生物学与机械工程技 ...

  • 24h|「猫和老鼠」真人电影;11月进口片盛筵;中国将翻拍「小镇疑云」

    2018年10月16日 星期二 24h 影事 <猫和老鼠>将拍真人动画电影 据外媒报道,华纳正在与导演蒂姆·斯托瑞商谈拍摄<猫和老鼠>的真人动画混合电影. <猫和老鼠&g ...

  • 小说测评《馅饼盒子》|城市文学中还有多少「人情味」

    作者:Jay 校对:litcave 工作室 配图:Online 馅饼盒子 城市文学中还有多少「人情味」 曾经流行过一种戏仿--一段平平无奇的文字,用「王家卫腔」表述出来--「王家卫腔」成了港味文字的一 ...

  • 在生活中你会「示弱」吗?

    社会压力增大大.竞争激烈,大家步履匆匆不断前行,每个人都显得急功近利,争强好胜,在与人相处的过程中,寸步不让,锱铢必较. 网上有这样一种观点:「大家都是第一次做人,我凭什么要让着你?」对于这种语调,有 ...

  • 第一次,我们在人工神经网络中发现了「真」神经元

    参与:杜伟.魔王 无论是字面上.符号上还是概念上的表达,这种神经元都会对相同的概念做出反应. OpenAI 的研究者们在人工神经网络 CLIP 上发现了「真」神经元,这种机制解释了 AI 模型对令人惊 ...