Python算法交易实验1基于算法的交易实验-假设,设想

发表时间:2021-05-11

说明

在这里插入图片描述

量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。

这个话题其实挺有意思,假设的确存在某个算法,可以帮助我们“赌赢”大多数交易,从而实现“钱生钱”。这大概是算法变现最直接,最理想的方式了。
但这里有一个悖论: 如果你的算法有用,大概是不会公开的。反过来说,如果关于量化的公开的方法,基本就是无效的。

早期还有一些论文是关于量化交易的,后来以这个方向为主题就少了,估计大家发现那些算法并没有什么用。

所以这个系列我大概不会分享任何code,只是一些基本的思路和想法。

目前量化交易从频度上可以分为高频量化和一般量化。高频量化的决策时间大约是毫秒级的,而一般量化可以是分钟,小时,天,甚至更长。

高频对于设备更为依赖,而一般量化的算法更加复杂。

内容

1 本质

赌博是一种拿有价值的东西做注码来赌输赢的游戏,是人类的一种娱乐方式。任何赌博在不同的文化和历史背景有不同的意义。在西方社会中,它有一个经济的定义,是指“对一个事件与不确定的结果,下注钱或具物质价值的东西,赢取得更多的金钱和/或物质价值”。

交易的本质是赌博,数学,特别是概率论,本身也和赌博存在很深的渊源。认识并承认这一点很重要:明确这件事的本质,也能和算法直接挂上勾。

以信贷为例,放贷者(比如银行)向借款者发放贷款就是一次赌博。放贷者如果赢了,那么会得到利息作为奖励,例如5%一年。而放贷者如果输了,最大可能失去100%的金额。信贷者为了增大自己的赢率,可能会要求借款者进行抵押:实物抵押或者信用抵押。无论如何,是否放贷,以及能放多少的决策事实上就是一种赌博。

因为信贷决策的影响很大,早期的信贷决策是由人做的;上个世纪60,70年代,美国开始使用逻辑回归方法进行信贷审批,最终证明其有效性甚至超过的人。逻辑回归里的很多概念仍然是和赌博相关的,例如 odds 几率。

逻辑回归是我最喜欢的模型之一。简单,有效,稳定。而且和决策树一样,可以进行叠加,形成更复杂的模型。(一度逻辑回归是深度学习末端的感知器。)

如果过我们的决策有一个平均值,那么仅仅使用逻辑回归,就可以提升4~5倍的水平。

2 前提

标的物应该是独立和随机的,而非受控的。

在以前的经济学里有说过“无形的手”和“有形的手”,原则上我们应该找那些只受无形之手影响的标的物。万事没有绝对,但总体上我们认为类似上证指数或者黄金价格这一类,在一定的时间内是符合这个前提的。反例就是某些受人控制的开奖行为。

因为标的物受到无形之手的影响,其背后的随机分布会随时间而变化。从随机过程的角度看,均值参数为1的标的物,可能会出现0.8的值,这时候就可以买入。当其表现为1.2的时候,就可以卖出,这个就是我们可以做的事。

最重要的就是判定:

  • 1 现在标的物是否处于稳态(随机过程)
  • 2 现在标的物背后的均值参数猜测

3 一些误区

曾经调研过一些关于量化的模型,里面至少有一点我不太认同:用定长的数据周期进行预测。

有些模型用过去30天,或者过去50天的数据来预测未来一天或几天的数据。

由于价格历史数据的本质是时间序列,我们在说话的时候也是时间序列。应该没有谁固定每句话说几个字的吧?

从模型的角度看,用于训练的数据是“脏”的,存在很多不属于当下模式的数据,结果当然就只能碰运气了。

所以第一步应该是可以把一条连续的曲线切分成不同的区间。这块用隐马尔科夫模型就比较好。

另外就是,模型不是总能工作的,当然我们希望并尽量让模型可以尽可能工作。例如,有时候我们可以根据上半句话猜出下半句话,有时候并不能。你说这时候我们应该诚实的说我不太确定还是瞎蒙一个呢?

现在看来大部分时候使用模型瞎蒙的,没有考虑置信度。

4 决策

决策是基于模型的结果,但不能只考虑模型的结果。一般的决策论会谈到效用论,主要就是考虑人的心理满意度。例如人类存在明显的损失厌恶心态。亏了5块钱和赚了5块钱,估计是前者能量的绝对值大一些。

另外,刚才提到了放贷的例子:赢了只是赚利息,输了缺丢失所有本金,权重是不同的。

更具体的说,如果我是负责天气预报的,当模型告诉天气50%是阴,50%是雨,我一定会说可能下雨,请带好雨具。因为一旦我说阴,最后下雨了,一定会被用户骂。反之,如果你带了伞却没下雨,埋怨确小得多。

基于以上的原则,决策是不是当预测可能赚0.01%就买入,这中间需要进行权衡,这就是决策。

5 理想和复杂度

现实的系统就像弹簧,你按下去越多收到的阻力越大,直到你再也无法前进

即使标的物是符合随机分布的,但也不会是独立的随机分布。例如宏观指数(例如通胀)会影响标的物的分布,而又有别的会影响通胀。所以这个问题是一个层级式的网,比较负责。

另外,标的物本身会产生自扰或者说自相关,但是这种自相关未必是线性的。

当你进行投资(机)活动时,如果体量大了,也会产生自扰。

市场还还存在别的玩家,你的策略会影响他们,他们的策略也会对抗你。

文章来源互联网,如有侵权,请联系管理员删除。邮箱:417803890@qq.com / QQ:417803890

微配音

Python Free

邮箱:417803890@qq.com
QQ:417803890

皖ICP备19001818号-4
© 2019 copyright www.pythonf.cn - All rights reserved

微信扫一扫关注公众号:

联系方式

Python Free