DaQuant > 帮助 > 业绩评价

8.7. 高级统计分析

8.7.1 收益率分布报表

        收益率分布是用如下统计分布特征来衡量的:

统计特征
均值最小值
标准差最大值
偏度分位数(1%、5%、10%、25%、中位数、75%、90%、95%、99%)
峰度
8.7.1.1 均值

        1. 名称:均值(mean,

        2. 释义

        均值是指日收益率序列的平均数,用来估计序列分布的数学期望,表示日收益率的平均水平。

        3. 公式

8.7.1.2 标准差

        1. 名称:标准差(Standard Deviation,

        2. 释义

        标准差是指日收益序列的标准差,用来估计序列分布的总体标准差,表示序列分布的离散程度。

        3. 公式

8.7.1.3 偏度

        1. 名称:偏度(Skewness,Skew)

        2. 释义

        偏度是指日收益序列分布三阶矩的估计,在序列分布非对称情况下,考察偏向。若大于零,说明右偏,有极大值;若小于零,说明分布左偏,有极小值。正态分布对称无偏,偏度为0。

        3. 公式

8.7.1.4 峰度

        1. 名称:峰度(Kurtosis,Kurt)

        2. 释义

        峰度是指日收益序列分布四阶矩的估计,有极值时,衡量尾部的厚度和峰值的高度。正态分布的峰值为3。

        3. 公式

8.7.1.5 最小值

        1. 名称:最小值(Minimum,

        2. 释义

        最小值是指日收益序列的最小值。

        3. 公式

8.7.1.6 最大值

        1. 名称:最大值(Maximum,

        2. 释义

        最大值是指日收益序列的最大值。

        3. 公式

8.7.1.7 分位数

        1. 名称:分位数( Quantile,

        2. 释义

        分位数是指日收益率序列的分位数,这里取1%、5%、10%、25%、50%、75%、90%、95%和99%。

        3. 公式

        其中,是指策略的日收益率分布函数。

8.7.2 收益率分布

        收益率分布分析是利用策略的日收益率信息估计日收益率本身和连续上涨/下跌收益率(游程收益率)的概率分布,并以直方图和密度函数的形式来展示,其中密度估计选取两种:核密度估计和正态估计。

8.7.2.1 日收益率概率分布图

        “日收益率概率分布”图是展示策略日收益率的概率分布情况,其中上左纵坐标是概率密度,上右纵坐标是交易日统计,横坐标是收益率大小;直方图分布用蓝绿色表示,正态估计用蓝色表示,核密度估计用红色表示。

        直方图分布是分析连续数据分布最常用的描述统计方法,即对观察值按照其取值范围等分区间,然后统计每个区间中观测到的数据个数,将其根据大小绘制成具有高度的柱子。这里,我们根据所有观测到的数据个数来确定等分区间数:a)当时,;b)当时,;c)当时,

        正态估计(Normal Estimation,)是假设收益率分布为正态分布,直接利用样本均值和标准差估计分布参数,其中样本均值的算法具体见8.7.1.1部分,标准差的算法具体见8.7.1.2部分(这里使用有略微差别的无偏估计,自由度调整为)。正态分布函数为

        核密度估计(Kernel Density Estimation,KDE)是采用平滑密度函数(“核密度估计函数”)来拟合观测到的数据点,模拟真实概率分布曲线。具体方法是:在每个需要估算概率的位置,通过核函数加权计算所有观测点的贡献,然后汇总得到估算概率。核密度函数为

        其中,为概率密度估计函数,这里采用正态核密度函数,

        为窗宽常数,决定不同观测点的贡献大小,这里取为

        其中用观测值的样本标准差来估计,即是

        采用密度函数估计时,我们根据日收益率的取值范围,按照均匀分布获得N(=100)个估算数据点。

8.7.2.2 游程收益率概率分布图

        和“日收益率概率分布”图类似,“游程收益率概率分布”图是展示策略连续上涨/下跌收益率(游程收益率)的概率分布情况。

        游程收益率(Runs Return,)是指策略连续盈利或亏损交易日的累积收益率。计算公式为

        其中,为满足条件:a) 或 b)的所有可能的取值。

8.7.3 净值曲线检验

8.7.3.1 随机游程检验

        1. 名称:随机游程检验(Run Test,

        2. 释义

        游程检验亦称“连贯检验”,其是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。所谓的游程是指样本序列中连续出现的变量值的次数。检验原则:若序列为真随机序列,则游程的总数应该不太多也不太少。若游程总数极少,说明样本缺乏独立性,内部存在一定的趋势或者结构,这可能由于观测值间不独立或者来自不同的总体;若样本间存在大量游程,则可能是系统的短周期波动影响观察结果。

        游程检验是最简单的判断随机性的方法。对于大样本,游程检验的零假设为:序列是随机的,利用游程构造Z统计量,并依据正态分布表给出对应的概率值。若概率小于或等于用户指定的显著性水平,则拒绝零假设,认为序列是非随机的;反之,不能拒绝零假设,认为序列是随机的。

        3. 公式

        其中,游程的抽样分布接近正态分布,其均值和方差分别为

8.7.3.2 ADF序列平衡检验

        1. 名称:ADF序列平衡检验(ADF Testing for Stationary,ADF)

         2. 方程

        其中,

        3. 释义

        ADF检验的核心通过检验序列是否具有单位根从而判断其是否平稳时,序列具有单位根,如果P值小于0.05,拒绝单位根系数的原假设,可以认为序列不存在单位根,走势统计平稳。实际中,可以用ADF检验来判断产品净值曲线的趋势特征,需要从模型3开始逐渐读数;

        首先假设模型3,如果模型3中的的P值小于0.05,的值大于0.05,这说明序列平稳,既不存在确定性趋势,也不存在随机趋势。停止检验,可以忽略模型2和1的读数;如果的P值大于0.05,的值大于0.05,这时候也许是因为模型3过于饱和(引入确定性时间趋势导致检验功效减弱),需要讲模型3退化到模型2读数;

        如果模型2中的P值小于0.05,说明模型不具备单位根,序列平稳;如果大于0.05,无法拒绝模型具有单位根,这时候需要将模型退化到模型1继续检验;如果模型1中的P值小于0.05,说明模型不具备单位根,序列平稳;如果大于0.05,无法拒绝模型具有单位根,可以认为序列非平稳,接受模型具有单位根。

        注意,如果模型3中,的P值大于0.05,的值小于0.05,这时候将模型3退化到模型2逻辑上不合理,通常是结合时序图等其它证据,直接得出序列具有单位根。

8.7.4 资金管理概率模型建议

8.7.4.1 单笔交易胜率

        具体见8.4.2.5部分。

8.7.4.2 单笔交易赔率

        1. 名称:单笔交易赔率(Odds Ratio from Trading,ORT)

        2. 释义

        单笔交易赔率是指盈利交易的盈利总和同亏损交易的亏损总和的比值。

        3. 公式

        其中,盈利单盈利总和的算法具体见8.4.2.6部分;亏损单亏损总和的算法具体见8.4.2.7部分。

8.7.4. 单笔凯利仓位

        1. 名称:单笔凯利仓位(Kelly Formulas from Trading,KFT)

        2. 释义

        单笔凯利仓位是指利用单笔交易胜率和赔率,由凯利公式测算仓位。其中仓位=(胜率-输率)/赔率,输率即为(1-胜率)。

        3. 公式

8.7.4.4 单日胜率

        具体见8.4.1.11部分。

8.7.4.5 单日赔率

        具体见8.4.1.12部分。

8.7.4.6 单日凯利仓位

        1. 名称:单日凯利仓位(Kelly Formulas Day by Day,KFD)

        2. 释义

        单日凯利仓位是指利用单日交易胜率和赔率,由凯利公式测算仓位。其中仓位=(胜率-输率)/赔率,输率即为(1-胜率)。

        3. 公式

        其中,单日胜率的算法具体见8.4.1.11部分,单日赔率的算法具体见8.4.1.12部分。

8.7.4.7 时均胜率

        1. 名称:时均胜率(Winning Ratio by Time,

        2. 释义

        时均胜率是指时均盈利次数占时均总次数的比例。时均即是将次数除以策略周期时长,目前精确到日。

        3. 公式

8.7.4.8 时均赔率

        1. 名称:时均赔率(Odds Ratio by Time,

        2. 释义

        时均赔率是指时均盈利值同时均亏损值的比值。时均即是将金额除以策略周期时长,目前精确到日。

        3. 公式

8.7.4.9 时均凯利仓位

        1. 名称:时均凯利仓位(Kelly Formulas by Time,

        2. 释义

        时均凯利仓位是指利用时均交易胜率和赔率,由凯利公式测算仓位。其中仓位=(胜率-输率)/赔率,输率即为(1-胜率)。

        3. 公式

上一页下一页