华院数据数据科学家尹相志:智能投顾一定能赚大钱吗?
电脑逐渐可以去做一些我们想不到的事。我不会用替代人力这样的字眼。因为目前来讲,科技取代人类还非常远。最重要的是机器帮助我们从无聊、繁琐的事情中脱身。
作者:尹相志
如今,随着社会不断发展,技术不断进步,国内外各大金融机构已经在大数据、人工智能、区块链等新技术上有很多尝试,智能客服、智能投顾等新金融形式也早已不新鲜。那么,这些前沿新科技遇到严肃谨慎的金融业,究竟是“黑科技”般的存在,还是技术宅们的另一场狂欢呢?
4月25日,由数据猿主办的《当金融遇上黑科技》线下主题沙龙活动在上海腾讯众创空间顺利举行。活动上,来自传统金融机构、金融科技领域新秀、大数据与人工智能专家等一众大咖汇聚一堂,畅聊了大数据、人工智能、区块链等“黑科技”与金融业的那些事!
以下是由数据猿精编整理发布的 华院数据数据科学家尹相志 的精彩分享:
后台回复关键词“尹相志”,获取演讲PPT
分享长度为3400字,建议阅读7分钟
今天我要和大家分享智能投顾。大家不要为了为了追赶热潮而去使用这个技术。十几年前,很多公司对于大数据就是为了做而做。
今年是人工智能60周年的时间点,充满了各种各样的巧合。最近也是人类被人工智能打败的20周年。过去AI经过三次起伏,其中有很多的新发现,以及一些失望。现在的浪潮没有让后来的区域缓和,我觉得所有的科技都是一个生命周期。
过去一直用机器来取代各种各样的劳动力,而现在是工业革命的新开端。由于技术的发展,我们开始通过电脑来取代一些不同的人力。这些人力都不是我们以往定义所谓的劳动力部分,而是知识工作者。
电脑逐渐可以去做一些我们想不到的事。我不会用替代人力这样的字眼。因为目前来讲,科技取代人类还非常远。最重要的是机器帮助我们从无聊、繁琐的事情中脱身。
巴菲特提到,他的成功秘诀之一就是贪婪的时候恐惧,在恐惧的时候贪婪。本事投资判断就是反人性,我们需要能够针对一个事件做一个很谨慎的判断。这个判断通常希望不要带感情,并且希望从危机中找到一些转机。而人类做这些判断的时候通常会受到情绪的左右。
传说中的交易神童也说,做交易的时候不可以有赌的感觉。认为什么爱股票,因为有赌博的成分,会得到赌博的额快感。但是一旦有这种感觉就糟糕了,就容易被股票操纵。对他而言,需要一种非人性的交易方式。既然是非人性的东西,当然是人工智能最合适。
人工智能浪潮从去年3月持续到现在,深度学习作为一项非常年轻的技术,2016年才有了一个学术上的定义。周围许多语音识别都是用这项技术做的。人工智能还有很多新的落地点,投资方希望能找到真正有意义的落地点。
金融是一个大家关注的焦点,智能投顾这个概念也已经讲了很久。虽然有很多公司都说在做智能投顾,但是没有任何一家是真的做了。市面上很多公司是把量化交易偷换概念叫做智能投顾。
智能投顾一定能赚大钱吗啊?不一定。什么样的市场才是能赚大钱的市场?只有流动性和波动性高才有机会获利。是否赚钱这件事也未必等于最佳策略,怎么在赔钱的初期停止损失也是非常重要的策略。在这个情况下,怎么用人工智能判断,是非常重要的。智能投顾不等于量化交易,量化交易重点是做股价的预测。
前阵子,看到摩根大通等等裁掉了几个分析师,他们几万个人的工作,电脑一小时就做到了。很多人担心,是不是大家要没工作了。其实我认为这是新闻某种意义上的营销,它让消费者知道,通过新的技术可以让服务的触角更广。老实说一个资产管理的管理人,他能看的案例有限,当他分身乏术的时候,我们想扩大业务,只能通过新技术,帮我们解决管理上的困难。
最早机器可以和人类交互只是幻想,没有大数据的发展,就不可能有深度学习的发展。深度学习是机器学些的一个特例,通过神经元的连接,投入精巧的设计,找出特征。
在过去,所有的消息、分析都来自于数据,而数据绝大多数都是文字。正因如此,我们缺乏传统量化交易中分析文本的能力,大部分只能做到粗浅的,没有办法对文章的内容做深入的探讨。这对于深度学习来说拥有不一样的角度和切入点。
举例来讲,比如文字。我们一共有120万的中文用字,大家可以想想看,我们一天到晚讲出来的中文有120万字。如果全部压缩到很多的维度,比如200维,这个时候就它就变成一个很小的被代表的向量。因为是向量可以加减乘除,所以加减乘除之后的词向量,我认为是在目前所谓的自然语言分析里面,很简单很初阶的,但是非常有趣的东西。
如果我一个告诉它美金,一个告诉它英镑,他就可以从词向量里面,把所有的币别全部找出来了。除此之外,我告诉他基金和债券,他可以把所有的在里面跟金融商品有关的投资商品全部列举出来。我们可以看到这个有趣的情况,我告诉苹果跟三星,当我列出所有手机代表词之后发现里面出现了香蕉、葡萄之类的结果。因为苹果有歧异,有可能是吃的水果。所以告诉他苹果+三星葡萄,就可以把所有的水果歧义词排掉。
在不需要特别教电脑的情况下,基金和赎回,赎回有特别意义的,第一个方向性。我们发现原来我们认为真实世界很复杂的问题,当你从高维压缩到低维的时候,问题就异常简单,就加减乘除就可以解决了。
现在我们处理的最大困难和核心就是没有能力处理非数值的字段。过去听说过自然语言处理,但是现代基础这块已经不是太困难的事情。中文是非常难的,不光有简体还有繁体,加在一起是非常恐怖的数字,解读方面也是非常困难的。
智能投顾,既要投也要顾。顾就是怎么维护客户。过去依靠昂贵的人力,现在依靠聊天机器人,但体验是不一样的,机器没办法理解客户讲的深入。因此,深度学习里面另外一个重要的模式,Sep2Sep的意图模型,知道的你意图,你的意图体现了那些事物就是实体,因为实体产生行动。
比如“你好,能帮我注意一下美元的波动吗?”意图是设定波动警示。实体包括产品类别:外汇、所有的美金计价基金标的:美金,连接风险:汇兑风险。行动:产生警示。
我认为管理取代人类的时间还很早。但是可以想象的是,当你从繁琐的过程脱身,是不是有时间可以做更多的事情。换一个角度想,如果只能做那种工作的人就比较担心了,所以我觉得每个人都要苦难的培养至少一种不被电脑取代的能力,这是人类未来进化很重要的方向。
前段时间美联航打了一个人,如果你是它资金管理人,你第一事情做什么?第一件事情先查一查全球主要基金持人有多少,顾问有谁。应该先弄清楚背后盘根错节的关系,这些东西都有数据,只不过数据不一定是容易阅读容易查询的方式。很重要的概念是知识图谱,知识图谱也不是什么新东西,区别是图谱效果用人工建还是电脑自己抓。
目前深度学习让图像和文字变得可能。举个例子来说,我们讲视觉的任务,我给你一张图片,你要写文字告诉我这张图片在讲什么。他必须要识别里面有什么内容,然后他变化成文字。未来还有什么可能性?既然能够看这样的图片,我们今年的比赛有一个很重要的题目,就是让机器来读K线图,我们会准备上万张让它读。但是不给他值,我们希望可以找到我们自己关注不到的规律。
深层规则告诉我什么,大家能认出这是长颈鹿,为什么能认出?是因为颜色吗?因为斑纹吗?人天生就有侦测深度规则的能力,而且可以通过多种规则,达到识别的一致性。人可以识别到很多很底层的特征,为什么我们不能从图中找到该买股票的时机点呢,因为这些不是我们人所习惯的。
刚才谈到深度学习和所谓的智能投顾我认为还是有很多不一样的地方。为什么阿尔法狗能打败李世石,因为它使用了增强学习这样的一个技术。强化学习很重要的一环透过互动达到一个策略最佳化的目标,所以也就是说重点在不在预测股价,真正的目的是赚钱。
阿尔法狗和李世石打有什么不同,人下每一个棋子会受到以前教育的制约,比如这个子下这里很烂,或者下在哪里不优雅,下在哪里是好的。但是电脑完全不管这套,电脑只关心我要赢,不管中间过程是什么。这个里面我们的目标是让它能达到最高的收益,所以这个过程里面,可以透过强化学习,让电脑学会最佳策略。
有很多有趣的学习名称,模仿学习、学徒学习,其实都告诉你从零开始学太慢了。从模仿人开始最快。2008年全球大股灾的时候,你的电脑能够做的比较好吗?电脑如何做,其实它的概念是只要在虚拟空间里面,可以让他做1亿次的随机交易,时间点和金额随机。这1亿次里面能不能找到最优解,可以。但是能不能每次交易都算1亿次,当然不行。所以深度学习的功能在于怎么样通过优化过程的网络结构,不用算1亿次,就可以知道最好的点在哪里。
这一个是DQN,重点是两个不同的函数,阿尔法狗就是一个标准的DQN。一个叫做策略函数,判断怎么跟真实环境做交互,以及外面环境会怎么影响我。阿尔法狗是用它判断对方的落子。价值函数会预测这个动作对我未来的收益的变化,所以可以透过这个找到最优解。
怎么找到最优的解在哪里,能不能用最小计算量帮助我们,这个可以通过深度学习帮助我们。量化交易的本质在预测股价,深度学习的本质是让电脑学会找到最佳策略的办法,这两个完全不一样的事情。
谢谢大家!