分类
期权市场

基于这个指标的策略效果更好

五种常见的归因模型

基于这个指标的策略效果更好

华宝基金指数研发投资部总经理 基金经理 胡洁

基于这个指标的策略效果更好 如何打造具有核心竞争力的优质指数基金

——指数基金研发深度思考

选择好赛道后,我们需要回归到产品主题的定义上。倘若定义不清晰,则最终指数的中长期表现可能会大打折扣。定义主题的工作看似简单,实则需要深入主题行业中进行研究和分析,目的是把真正能够代表主题的行业保留下来,而把模棱两可、似是而非的行业剔除出去。只有精准定义了主题,主题指数才具备名副其实的优质Beta和核心竞争力。方法上,我们在定义特定主题时会充分借鉴海外成熟市场的实践经验和研究成果,同时结合国内市场环境的特点以及国内知名第三方机构的主题划分的结果,尽可能确定与赛道相契合的主题方向,同时使得整个指数的风格特征尽可能清晰。华宝基金在定义科技板块的细分组成部分时就充分参考了海外关于科技指数的研究成果。海外成熟市场主要把科技股分为三大类:信息科技(Info Tech)、生物科技(Bio Tech)和金融科技(Fin Tech)。美国市场比较成熟,当前规模超过100亿美元的科技类基金共有15只,其中12只属于信息科技板块,3只属于生物科技板块。通过对照国际标准,科技ETF(515000)将科技股的范围界定在以电子、计算机、通信为代表的信息科技,加上生物科技主题板块的成份股,精准定义科技行业的同时,动态覆盖整个科技产业链。

基于这个指标的策略效果更好

图片

如何衡量股债性价比

当这个指标越高时,代表股票资产的性价比更好;反之当该指标越低,代表债券资产的性价比更好。

指标公式为:(1/PE_TTM) - 十年国债到期收益率

如何构建回测

沪深300风险溢价

图片

回测结果怎么样

轮动策略回测情况

图片

目前,沪深300指数的风险溢价是5.5%左右,在4月末的时候曾达到过6%左右,离中值+1倍标准差已经非常接近了,也意味着目前股票资产的吸引力是相对明显优于债券类资产的。

回测效果如何评估?

小壁虎的春天 于 2020-03-26 10:10:32 发布 1010 收藏 4

文献来源: Campbell R. Harvey and Yan Liu. Backtesting. Journal of portfolio management, 2015.

推荐原因:量化实践中的过拟合问题一直饱受诟病,在最新的学术文献中不少学者已经开始反思学术界各类α因子是否只是数据挖掘的产物,一些文章尝试提出更加严格规范的α因子挖掘框架。我们选取了一篇颇具代表性的论文,探究其中关于克服回测过拟合问题的一些技术方法。日常量化实践中研究人员会进行大量实验并选取其中最好的一种进行效果展示,这个过程会带来较大的过拟合问题,本文提出了一种考虑测试次数的策略效果评价调整方法。

1、简介

2、方法

2.1 单一测试和夏普比率

2.2 多次测试后修正夏普比率

3、多次测试框架

3.1 第一类错误

3.2 FWER下的修正P值

3.3 FDR下的修正P值

方法还有如下不同:1. 分析的目的是不同的。我们的研究重点在于识别产生非零回报的策略组,而Lopez 基于这个指标的策略效果更好 de Prado则评估适合于样本的特定策略的相对性能。例如,当有一组因素都为真时,在我们的多次测试下框架下,具有最小t-比率的策略仍可能被拒绝。2.我们的方法基于单个测试统计量,该统计量总结了策略在整个样本上的性能,而他们的方法以多种方式对整个样本进行划分和连接,每种方式对应于人工的“保持”周期。因此,我们的方法更符合多重测试的统计文献,而他们的工作更多地涉及样本外测试和交叉验证。第三,Harvey和刘(2015)中的扩展统计框架只需要检验统计量,而他们的工作很大程度上依赖于每一个策略的时间序列。虽然数据密集,但在Lopez de Prado方法中,没有必要对返回的数据生成过程做出假设。因此,他们的方法更接近机器学习文献,而我们更接近于计量经济学文献。最后,PBO方法评估策略选择过程是否容易过度拟合。它不与任何特定的性能统计相关联。我们主要关注夏普比率,因为它们直接与t统计量联系在一起,因此p值是多个测试调整所需的输入数据。只要其他性能统计信息也有概率解释,我们的框架可以很容易地被推广到合并其他性能统计信息。

3.5 样本内vs样本外多次测试

4、应用

4.1 基于这个指标的策略效果更好 三种策略

4.2 新策略的夏普比率修正

4.3 交易策略的最低盈利能力

数字营销术语词汇表101-数字分析篇

数字分析、网站分析、媒体分析相关概念

数字分析、网站分析、媒体分析相关概念

数字分析相关概念

Web Analytics

网站分析(这个翻译狭隘了,但暂时没有更好的)是通过技术手段对网站、页面、APP进行定性和定量分析的一门学科,它是研究用户行为、网站(转化)表现、流量来源等一系列对象的重要数字营销技能。你所平日听到的诸如访问量、跳出率、停留时间、页面浏览量等指标都属于Web Analytics的范畴。Google Analytics是Web Analytics最常用也是最强大的工具,业界标杆。

Media Analytics

媒体分析是研究、评估媒体组合在转化过程中影响力的一门学科,它是Web Analytics的分支。媒体分析重在考虑媒体对转化的影响,它跳出了网站本身,从媒体的角度来分析问题。媒体分析回答了这些问题:你的转化来自哪些推广活动?当多个推广活动相互影响时,各个转化活动起到的作用占多少?你的推广活动是否被推送到了合适的人群?这些推广活动是否满足“RIGHT TIME,RIGHT PEOPLE,RIGHT CHANNEL,RIGHT OFFER”。

Attribution Model

举个例子,他先是看到了某个充电宝的展示广告(banner)引起了兴趣;接着第二天他去搜索了“充电宝”然后点击搜索广告到了你的在线商城,尽管注册了但是他却没有购买,而是把商品放到了购物车;第三天他通过点击电子邮件里的链接回到了商城并最终支付。在这个过程中如果我们选择First Touch的归因模型,那么所有的“功劳”都要归功于他首先看到的那个展示广告,而这个购买就成为了一个“View-through Conversion”(见展示广告,电邮营销篇)。这显然是不公平的,因为其他渠道也“出力”了。同理,把所有“功劳”按照Last Touch模型来归因也不公平。从下图我们可以看出没有哪个模型是“万金油”的。我们在网站分析和媒体分析中会具体处理。

五种常见的归因模型

五种常见的归因模型

Segmentation

Segmentation是一个对数据抽丝剥茧的过程

Segmentation是一个对数据抽丝剥茧的过程

总之,综合数据并不能给我们带来多少价值,足够的细分才可以。通过分组我们不但可以研究某个群体对广告的反应,还可以发现隐藏得很深的一些作弊、垃圾流量。可以说,没有分组就谈不上分析

Dimension和Metric

按天的投放效果报表

按天的投放效果报表

指标分为两类,一类是原指标(primitive metric)另一类是计算指标(calculated metric)。计算指标是通过原指标计算出的指标,它的特点是无法简单累加,比如上表的点击率和转化率。你若把它们加起来没有任何意义,必须通过原指标的总和重新计算。计算指标还包括许多以“平均”开头的指标,如平均访问时间、平均(广告)排名等。

Hit-Level,Session-Level,User-Level

维度和指标的三个级别,Hit代表一次交互,Session代表一个会话,User代表一个用户。举个例子,页面停留时间这个指标就是Hit-Level的指标,而访问时间这个指标则是Session-Level的指标。如果我们去研究某个页面的访问时间那就会产生错误。因为页面(Page)是一个Hit级别的的维度,它不能向上匹配Session级别的的指标,而只能匹配页面停留时间。当这样的组合出现时我们只能提升到包含这个页面访问的Session的访问时间去理解。同样,如果我们看访问日期这个指标,那我们就无法去匹配过去30天访问数这个指标,因为访问日期是一个Session级别的维度,过去30天访问数是一个User级别的指标,如果这种组合出现,我们只能理解为该日进行访问的用户在过去30天的访问数。

三个层级的维度和指标

三个层级的维度和指标

Tag Management

GTM占了标签管理工具的半壁江山

GTM占了标签管理工具的半壁江山

Tracking

跟踪。只要我们在使用互联网就不可避免地被跟踪。除了上面介绍的标签管理,我们在跨域时同样会被跟踪到。我们经常在地址栏中看到的网址后跟着一大段参数就是跨域跟踪的主流方式。它的优点是不需要在来源媒体中部署代码和Cookie。由于GA的流行,UTM(Urchin Traffic Monitor)跟踪成为了主流。UTM具有五大参数,分别为utm_source,utm_medium,utm_campaign以及utm_term和utm_content。顾名思义这5个参数可以定义一个访问的来源、媒体、推广计划、关键字和创意。举个例子,在百度推广中我们可以在目标网址中填入:

https://maxket.com/? utm_source = baidu & utm_medium = cpc & utm_campaign = brand & utm_term = digital_marketing & 基于这个指标的策略效果更好 utm_content = digital_blog

将你的URL附上UTM参数

将你的URL附上UTM参数

那么极诣安装的GA代码便可以识别这个点击所包含的信息了。如果你的目标网站没有安装GA怎么办?比如你要送一个访客到Apple App Store,你可以参考App Store的文档添加一个ct参数,这样你可以在App Store的报表中看到安装来源。

Cross-environment

跨环境但不跨屏的情况

跨环境但不跨屏的情况

一些重要的数字分析指标

Monthly Active Users,月活跃用户数。也有简称月活的。MAU是衡量社交游戏、社交网站和大型网络服务的重要成长性指标。这里的M没有什么歧义,是过去30天。但是A和U却可以做很多文章。如何定义活跃五花八门,但通常以登录服务为准。而U则可以是免费用户或者付费用户,两者相差甚多。

Facebook月活跃用户2016Q2

Facebook月活跃用户2016Q2

Bounce Rate

每一次真实跳出都是一次不满意的体验

每一次真实跳出都是一次不满意的体验

Exit Rate

退出率。Exit Rate表示当用户到这个页面以后有多少用户没有再继续浏览。我们可以用“压倒骆驼的最后一根稻草”来形容那些退出率高的页面。如果该页面是一个Thank You页面那么说明访客已经完成了购买,如果这个页面的Exit Rate高的话无须担心。但是如果该页面是购买环节中的一个页面,那么我们就应该探究是什么让访客中途离开。对于电子商务网站来说,研究页面的Exit Rate有助于提高转化率,因此它是一个重要指标。下图解释了跳出率和退出率的区别。

跳出率和退出率的区别

跳出率和退出率的区别