http://www.7klian.com

精准预测市场?当多方安详计较碰着量化投研|算力智库隐私专栏

样本集为全部股票,用到了百度指数构建模子(其他入参变量与比较组1一致)

本文只是大数据量化建模的初探,隐私计较技能可以或许提供应量化生意业务更为遍及、有效的基本资源、技能支持,有时机促进大数据技能基本下量化生意业务计策的快速成长。本篇文章仅仅是通过非果真信息,操作安详 量化投资依托量化模子与数据,寻找可以或许带来超额收益的多种“或许率”计策。传统量化投资模式下,所利用的外来数据在质量和安详上存在重大隐患,量化模子结果不不变,影响量化计策的完整性与准确度。

综上,该计策通过上述24个指标的构建,团结动量计策和反转计策道理,并通过百度搜索次数作为外部数据,作为回响市场情绪的变量,之后按照IV等指标筛选入参变量,构建逻辑回归模子,预测当日股票是否上涨高出8%。为验证百度指数浸染,计策拟定了四个模子作为比较,详细如下:

作者

操作安详多方计较的方法,量化公司就可以利用外部数据源直接举办联邦进修,数据方会按照量化投资者需求,前期举办数据的加工和处理惩罚,对付量化公司来说,一是可以有效淘汰数据清洗和整理时间,二是直接对接数据源,确保了数据安详和数据质量,三是可以确保业务合规,担保量化模子结果不变,四是可以通过外部数据,构建非果真数据相关的量化计策和指标,获取更多的超额收益。

今朝任职富数科技高级总监,认真隐私计较的办理方案与业务落地。

2)样本集为全部股票,用到百度指数构建模子,AUC为0.76,未用到百度指数构建模子(其他入参变量与比较组1一致),AUC为0.72,说明百度指数对应预测有明明晋升结果。(详细信息见下图)

股票市场的信息差池称性是一直存在的问题,量化生意业务者无法获知市场上非果真数据和互联网数据,且基于大数据与模子的量化生意业务,往往对操纵中的数量与时间节点要求额外严格,丢失或改动数据均会致使预测与正确功效相偏离,又或致使生意业务在差池的时刻,以错误的数量来告竣。若因信息不安详而外泄数据,长时间便大概会致使业内互相操作这些数据来恶化竞争。2

传统的种种量化指标,无论是基于价值照旧基于财政数据城市存在必然的滞后性,无法用更具领先性的手段来相识行业和市场。而回收了大数据技能的行业及个股判定,则可以在必然水平上改进这一景象。操作搜索因子可把握投资者情绪,操作电商数据可及时得知各行业的根基面动向,操作大V数据荟萃了集团的伶俐,这几种大数据理论上都可以用来预测将来市场环境,将互联网金融的大数据作为选股因子引入模子,代表着资产打点机构在指数投资上重构选股逻辑。

研究标的:2019年8月5日-2020年8月4日创业板中所有股票

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章阅读