首页 > 新闻中心 > 博·观
leyu手机:幻方徐进:怎样用Deep Learning为股票定价
2023-02-02 13:23:36 | 来源:leyu乐鱼vip 作者:乐鱼网app

  2021国际人工智能大会于2021年7月8日至10日在上海世博中心和上海世博展览馆一起举行。国际人工智能大会自2018年以来,已成功举行三届。2021国际人工智能大会由国家开展和变革委员会、工业和信息化部、科学技术部、国家互联网信息办公室、我国科学院、我国工程院、我国科学技术协会,以及上海市人民政府一起主办。

  作为本届国际人工智能大会承办单位之一,数库科技于7月9日下午举行以“数据智能,链接未来”主题分论坛,会中幻方量化合伙人徐进讨论了怎样运用量化模型和深度学习在股市中挣钱的途径。

  徐进说到,与传统股票定价不同,量化经过输入获取的信息,包含行情数据、上市公司财务数据,还有特殊数据,比方新闻舆情、产业链等,进行模型练习,运用深度学习对股票进行定价。

  在徐进看来,在这个过程中,需求处理许多要害细节,细节是魔鬼!以时刻序列猜测模型为例,包含数据清洗、规划处理、防止过拟合、 防止未来函数等,许多的细节决定了量化能否挣钱,并不是简简略单就能成功的。“只需你对商场、数据充沛了解之后,才干得出比较好的赚许多钱的成果。”徐进说道。

  徐进说到,量化经过练习模型、进步算力、进步集群运用功率等,来进步其深度学习才干,必定程度上在“薅”商场羊毛。但从另一个视点来看,量化对商场的正面影响很大。一是为商场供给流动性,平抑商场动摇,二是进步商场的有效性,让公司定价更为合理。三是和全球顶尖的对冲基金进行竞赛,进步本国的金融买卖竞赛力。

  量化出资与机器学习大众号作为本次论坛的支撑媒体单位,全程参加论坛的报导作业。下面,是大众号对徐进先生在本次论坛讲演内容的收拾:

  这个模型所需的数据都是揭露的,需求的算力也不是很大,一两块游戏卡就能搞定。当然它不会支撑特别大的资金量。

  首要这个模型的输入是全商场股票的数据价格,这个模型只用到了价格(当日的开凹凸收+均价)。

  中心的图片是一个最简略的时刻序列的猜测模型——LSTM。假如你真的用心拿这个模型去做,终究你也是能挣钱的。可是,挣钱也仍是条件的:细节是魔鬼!便是说上面这些你都做了,可是你仍是要处理很要害的细节,而这些细节其实才是终究你能赚多少钱的一个核心问题。

  拿数据清洗来说,为什么要对数据进行清洗?上面的数据看上去也不是很杂乱,也便是高开低收以及当日成交均价,可是这儿面会躲藏许多问题,比方有些股票是刚上市的新股等。再者是涨停、跌停的股票怎样处理。有些股票动摇反常,乃至被证监会点名有操作的嫌疑,这些该怎样处理?关于金融时序数据来说,噪音非常大,信噪比非常低。咱们假如预先对一些数据进行处理,这对你的模型练习会有很大的协助。假如你什么都不论,把数据直接丢给LSTM模型,根本上得不到好的成果,由于LSTM也不是神!

  类似于这样的细节后边还有许多,只需你对商场、数据充沛了解之后,才干得出较好的、赚更多钱的成果。

  这是一个可以挣钱的实践的模型,咱们也在用,可是这个模型并不能处理一切的问题,接下来介绍一下咱们实践作业的模型。

  榜首行是行情数据,可是咱们做了许多的处理。接下来有来自财报的数据、公告、新闻文本的信息,再有便是上下游产业链,股票相关性的剖析。把这些都输入到多层感知器模型(MLP)咱们才会得到一个支撑大规模资金办理、买卖的杂乱模型。由于时刻序列模型非常耗资源,数据量非常大,一切耗时会非常久!

  咱们用上一年7月份发布的DGX-A100服务器跑完这个模型大约需求120天的时刻,根本毫无意义~

  一个超算和一般的数据机房是不太相同的,由于它的单位面积算力能耗特别大,要处理的杂乱问题比较多,并不是去租几个IDC机房把机器放进去就能处理的。

  采用了现在全国际能买到的最贵的、速度最快的800口的交换机(水冷交换机),每节点IB互联,200 Gbps传输带宽。

  *图片来自幻方,一切功能核算均根据TensorFloat-32格局理论算力值,Nvidia、Tesla超算功能数据均来自揭露资料

  图片的右边是特斯拉的Dojo原型机,左面是萤火,中心是Nvidia的Selene超算,在本年最新一次的排名为全球第6。

  由于现在萤火现已投入了运用,所以萤火在整个工作上比特斯拉超至少超前了半年的时刻。由于A100的核算卡是上一年7月份才发布,幻方是亚太地区榜首批拿到此卡的人,由于其时A100仍是挺难买的。

  本年上半年持续制作萤火的时分也遇到许多的问题,挖矿的人太多了, 买不到满足的CPU和硬盘等等。

  分布式存储非常难做,要害是其读取的速率。下图(右边)是现在全球IO500的存储读取速度榜单,榜首名是我国鹏城实验室,读取速率最快。左图是幻方的成果,可以看到图上有个尖峰,是由于幻方每天早上6点钟会做压力测验,其读取速率达到了2800GIB/s,实践练习时已达到1800GIB/s。幻方现在的速率仅次于鹏城实验室,下半年幻方宣告会去参加这个榜单的评比。

  此外,包含集群怎样调度,怎样进步集群的运用功率,幻方做了许多工作。例如更新了许多针对核算卡做的库,未来有或许都会对外发布。

  根据此,幻方的AUM从2015年5亿增长到现如今的近1000亿。一起,幻方还成立了自己的AI Lab,不仅仅用于自己做买卖,还期望运用一切的算力集群和资源,未来可以做一些根底的科学研究,与高校、实验室进行协作等等。