量化投资

量化投资模型一般具备如下特点:
• 能使用多层次的量化模型观察海量数据,进而捕捉投资机会。

• 能够依靠概率取胜,如定量投资从历史数据中挖掘有望在未来重复的历史规律,以及大概率获胜的投资策略。量化投资模型是依靠筛选出的股票组合取胜的,而不是依靠一只或几只股票取胜,从投资组合的理念来看也是捕获大概率获胜的股票。

• 能严格地执行量化投资模型所给出的投资建议,克服了人性的弱点。

• 能准确客观地评价交易机会,克服主观情绪的一些偏差,通过全面、系统性扫描捕捉错误定价和错误估值带来的机会。

• 能及时而快速地跟踪市场变化,不断发现能够提供超额收益的新统计模型,寻找新的交易机会。

以上这些量化投资的特点,其实也是我们在投资中需要克服的弱点。那么,如何更加有效地克服这些弱点呢?

量化投资相对于传统投资的主要优势
量化交易有效利用金融学、统计学、数学等多种学科知识建立模型,通过不断测试定制出有效的投资策略,根据行情捕捉合理且具体的买卖点位,理性地对待上涨和下跌的正常波动。
与传统投资相比,量化投资的主要优势如下

(1)并发处理效率高:对于传统的主动型投资者而言,人的精力和体力是有限的,即决策方向的深度和广度都是非常有限的,体现在行情操作上,即所跟踪股票数量的极值不会太大,几只可以看得过来,但当几十只甚至几百只同时发出买入或卖出信号时,是没有相应充裕的时间去决策、思考、应变、操作的;而量化投资依靠计算机来运算执行策略,有着更为专业的投资视角和更宽阔的广度,无论与市场相关的信息量多么庞大,人工智能策略都可以高效快速地挖掘和处理所有信息。

(2)套利思想和概率取胜:定量投资通过全面、系统地深入挖掘,寻找市场中总会出现的一些由于错误的定价或估值等带来的机会,从而通过买入被低估的品种或卖出被高估的品种,等待市场自身纠正错误而达到获利目的。定量投资不断从历史数据中挖掘市场行情走势,重演特点及规律并加以利用;依靠不同策略的投资组合取胜,而不是仅依靠单个资产取胜。

(3)广度大和系统性强:随着市场信息传递速度不断加快,以基本面研究为主的分析师团队,即使不断挖掘并进行更加深入的分析也无法弥补决策广度的不足,而基于计算机执行的量化投资策略可以解决这方面的问题。传统的主动投资,在决策深度上有一定的可取之处,并能深入做足基本面研究,但这些能否弥补决策广度的不足才是决定成败的关键因素。量化投资在多层次、多角度及海量数据领域处于领先优势。多层次是指大类资产、行业选择和精选资产3个以上层次;多角度是指包括估值、成长、盈利等多个角度;海量数据,即对海量数据的处理。

(4)理性、纪律性强:传统投资的管理者很难做到完全理性,如受到周边环境影响,或制订的交易行为计划在执行过程中出现偏差,也在情理之中。而量化投资不受周边环境干扰,根据模型的运行结果严格执行进行决策,而不是凭感觉。纪律性既可以克服人性中贪婪、侥幸心理等弱点,也可以克服认知偏差。

量化投资不仅可以采用“自上而下”的大类资产配置策略,还可以采用“自下而上”的数量化选股策略,其在整个投资流程中运用非常广泛。
目前,在人工智能、大数据、云计算的互联网时代,量化交易随着金融市场、IT及投资方法的发展而不断进步,量化交易技术和策略都只是在一定的时间范围内有效,虽然美国量化交易存在了几十年,量化基金一直保持稳定盈利,但这都是在不断改进策略、优化策略的前提下,所以量化交易无论是技术还是策略都需要不断地完善,发现问题并及时解决问题。在市场有效性不断提升的过程中,量化交易的成长空间不可限量。

步骤1:首先要有一个交易思路,如“热点板块”“市值20亿元左右”“活跃板块”“高净值”“高分红”等,无论是单个因子还是多个因子,首先自己要有一个清晰的想法。

步骤2:要把你的思路变成一个量化投资策略,通过优矿、Wind经济数据库、东方财富网等一些开放、易得的数据商对你的个人想法进行简单验证。

步骤3:有了量化投资策略以后,接下来构建一个量化模型组合。其中包括超额收益、风险控制、交易成本三大项,这也是量化模型的重要组成部分,它们之间是一个平衡关系,在追逐高利润的同时,要做到降低风险和交易成本。

步骤4:量化投资策略通过实盘操作执行,对人来说比较困难但让机器“跑起来”非常容易,根据量化数据、文本数据、媒体数据开发各种因子。因子是指一个成功的选股策略,稳定盈利的量化投资策略需要一个高质量的因子库。量化投资策略执行主要有两条思路:假设驱动和数据驱动。但一定需要大量的数据回测。

步骤5:接下来执行相应操作,首先要对自己的量化投资策略进行回测。假如回测历史时间可以任意选择,就要多运行几次数据看看实际效果,如盈利多少、回撤多少。程序的运行状态、报撤单比率、保证金市值等都需要投资者认真记录,一直到这个策略在历史上的表现符合你的预期,再开始下一步的模拟交易。

步骤6:进行模拟盘交易。先注册一个模拟账户,然后把你的量化投资策略放在上面“跑一跑”,看看在当前市场中能不不能赚到钱。模拟盘交易这一步是必不可少的,因为你的量化投资策略用历史数据“跑”得再漂亮也只代表在历史上曾经有效,并不代表在当前依然有效。任何历史走势都会惊人的相似,但绝不会简单地重复,回测再好也要在模拟交易中验证是否真正有效。

步骤7:最考验人心的是实盘交易。如果模拟盘的回测效果不错,并且量化投资策略在当前市场上观察了几周甚至几个月都表现良好,那么就可以开立实盘账户进行交易。因为是实验实盘阶段,所以需要先小仓位测试,而不能急于满仓期望立即盈利,因为行情琢磨不定且不可预测,需要投资者边投资边看实际效果,而且需要不断地优化相关策略。

步骤8:优化策略就是在交易过程中排除实际交易问题,如回撤的大小、风险可控度的把握等,然后通过修正参数和调整策略来让模型更好地适应当前的情况,从而实现稳定盈利。

量化投资策略的可行性研究
量化投资的传奇人物——詹姆斯·西蒙斯(James Simons)创造了华尔街投资神话。他管理的大奖章基金平均年收益率甚至比巴菲特的收益率还要高,其超越巴菲特收益率的秘密武器就是使用了量化投资策略。西蒙斯管理的大奖章基金从1989年—2007年的平均年收益率高达35%,2008年年度收入更是高达25亿美元,位居《阿尔法》杂志“第八届全球对冲基金经理收入年度排行榜”首位,是当之无愧的量化基金掌门人。

量化投资策略在做的一直都是寻找“大概率”事件。而概率的产生也和历史数据有关。这就类似当我们希望在投100次硬币时得到的结果能达到正面向上的概率是49%~51%。而你会发现当真实试验并记录投100次硬币得到的结果时,其绝不会是49%~51%,只有20%~40%。也就是说。量化投资策略的成功与否,是建立在一个高质量因子库的基础上的。

回到A股市场,可以大胆预测,在未来量化投资将是大趋势。在过去,市场仅有几百只股票,大家挑选研究股票进行选股操作还能快速完成,但是当股票数量接近3600只时,市场的板块越来越多,仅仅依靠个人能力来研究相关数据、挖掘股票获取超额收益的难度越来越大,这也正是量化投资能够得到快速发展的主要原因。

目前,我国为了保护散户投资者,所以还没有实现T+0的交易制度,量化投资策略的道路还有很长的路要走,必须要采用结合中国特色的量化投资策略去量化和管理我们的资金,决不能把国外的量化投资策略模型直接照搬过来,一定要结合中国国情把人气指数,低波动,各种政治、经济因子都包含进去,这样得到的量化投资模型才有真实意义。

在2018年,对私募基金来说是投资界的寒冬,超过4000只私募基金破净亏损被清盘,大量私募基金惨遭清盘肯定是利空消息,但笔者认为,这正是发展量化投资基金的大好时光,量化投资基金已经成为市场力量的重要组成部分。

通过对市场不同时期的收益率进行统计分析,我们发现:当股票市场进入牛市走出一段上升行情时,采取主观投资策略的私募基金的业绩大部分都是非常出色的,能够得到市场认可,无论是产品数量还是资金规模都能迅速增长,但是当股票市场行情出现了大幅回调,市场迅速大跌,由牛市跳入熊市的时候,采取主观投资策略的私募基金的收益率都出现了较大幅度的回撤和亏损,整体行业又会迅速“冷遇”。

采用量化投资策略的私募基金,在股票市场出现暴跌、走势低迷的环境下,能够有效分散风险及对冲,在大多数基金产品大幅回调、亏损的时候,依然能够走出稳定盈利的资金曲线。

量化投资基金依靠多因子策略,如量价等技术面因子、基本面因子等,通过多因子体系、多周期、多品种等稳定策略来跑赢大盘。量化基金通过历史数据挖掘有效因子来寻找潜力证券,通过不断回测改良的模型来配置最优的投资组合,然后运用量化指标衡量基金的过往业绩及可能存在的风险,最终为投资者带来稳定收益。

我国目前有适合量化投资的土壤,主要原因如下。
(1)我国A股市场目前已经处于底部震荡时期,量化投资战胜市场的机会非常大。由于我国A股市场的发展历史较短,市场效率相比国外发达市场要低很多,因此获取超额收益的机会自然会大。
(2)量化投资的市场份额与海外市场动辄数百、上千亿美元的量化基金相比

量化投资策略主要包括量化选股量化择时两种类型。
量化选股策略是指利用分析、研究、统计等方法构建股票组合,期望该股票组合能够获得超越基准收益率的投资行为。在基于行业层面进行周期性和防御性的轮动配置是机构认可的最佳盈利模式

量化择时策略是指利用量化分析方法,找到影响大盘走势的关键信息,并对未来走势进行预测。其是通过对各种宏观和微观指标的量化分析,从而找到最佳市场相对高低点进行投资的操作。
4.1 多因子选股策略
量化选股策略主要分为基本面选股和市场行为选股两种,多因子模型是在基本面选股中常见的一种选股模型。
4.1.1 多因子模型基本方法
例如,选出一些因子作为我们选择股票的标准和规范,满足这些因子的股票则买入,不满足则卖出。多因子模型比较稳定,它以历史数据为出发点,通过计算机量化的方式进行选股。在不同市场环境下,总有一些因子会发挥作用。多因子选股模型通常有两种判断方法:一是打分法,二是回归法。

打分法是指根据各个因子的大小对股票进行打分,按照一定的权重对个股加权得到一个总分,再根据总分筛选出分数较高的股票。

回归法是指利用股票历史数据的收益率对多因子进行回归,从而得到一个回归方程,然后将最新的因子值代入回归方程得到一个对未来股票收益的预测,并以此为依据对未来收益选股进行预测。
建立多因子选股模型主要分为选取候选因子、检验选股因子的有效性、剔除有效但冗余的因子、构建综合评分模型、评价和改进综合评分模型等5个步骤
4.1.2 单因子分析流程

量化投资策略的核心在于找到能够稳健跑赢基准指数的多头组合,而寻找组合的核心在于找到驱使股票获得超额收益的因子。

宏观对冲策略是指使用一切可用的工具,从金融市场的大波动中获利。包括但不仅限于外汇、期货、股票等工具,主要利用这种大级别的行情及大幅度的错配,来对冲风险从而获取丰厚的利润。
微观(Micro hedge)对冲策略是指在较多投资组合中针对其中的某一类资产,建立相反方向的头寸来获取收益、规避风险。具体做法是:投资者在计划长期持有多只股票的前提下,预期大盘有短期下跌风险,就可以在期货市场上卖空相同价值的股指期货,如果大盘下跌导致股票亏损,则做空股指期货获取的收益就可以弥补所持有股票下跌的损失,达到对冲与分散风险的目的。

宏观对冲策略-由于我国对资本项目管制没有完全放开,汇率对冲还受到限制,所以还要先从基本面出发,自上而下重点关注股票、期货、期权、债券等标的,通过跨市场和跨品种的多空交易,来把握资产价格的失衡错配现象,去对冲风险获得绝对收益。需要综合考虑实体经济状况、财政政策、货币政策、通货膨胀预期、固定资产投资、产业链格局、无风险收益率、风险溢价等影响资产定价的因素,以及综合判断现阶段的各类资产估值,来预测未来的走势。

全球宏观对冲策略的含义是充分利用宏观经济基本原理识别各国经济增长趋势、资金流动、财政政策、货币政策等因素,进行自上而下的分析,利用股票、债券、货币、商品、衍生品等各类投资品价格的失衡错配现象做出投资决策,并在不同国家及大类资产之间进行轮动配置,以期获得高额稳定收益。

美林时钟

市场上著名的宏观资产配置模型是美国投行美林证券于2004年提出的The Investment Clock资产配置理论,也就是通常所说的“美林时钟”。

美林时钟认为,一个经济体的长期经济增长速度取决于可用的生产要素、劳动力和资本以及生产率的提高。在短期内经济往往偏离其可持续增长的路径。政策制定者的职责就是使经济回到其应有的增长路径上。金融市场一直将这些短期偏差误认为是长期增长路径的改变。结果,当政策纠正开始奏效的时候,资产就会被错误定价到极致。投资者可以通过正确识别政策的转折点,并且及时转换投资资产而盈利。

1.美林时钟的意义

美林时钟可以帮助投资者找到重要的经济拐点,并利用这个拐点做出投资决策。

我们可以将经济周期分为衰退、复苏、过热、滞胀4个阶段。每个阶段都由经济增长趋势和通货膨胀情况两个维度确定。我们相信每个阶段都与特定表现优异的资产相关:各阶段分别对应债券、股票、大宗商品、现金等优质资产。

(1)在衰退阶段,债券防守性增长,经济增长缓慢。

在衰退阶段,产能过剩和大宗商品价格下跌使得通货膨胀率较低、利润较低、实际收益率也在不断下降,收益曲线向下移动并陡峭,中央银行为保持经济持续增长,将会降低短期利率,所以适宜买入债券。
(2)在复苏阶段,股票周期性增长,经济增长开始加速。

在复苏阶段,货币政策宽松使经济增长开始加速。通货膨胀率继续下降,周期性生产力的增长导致多余的产能得到有效利用,利润也开始上涨。此时最适宜投资股票。

(3)在经济过热阶段,大宗商品周期性价值高,通货膨胀率上升。

在经济过热阶段,生产率增长放缓、产能受限,通货膨胀率持续上升。中央银行通过加息使过热的经济回调到可持续增长路上。GDP增长仍保持在较高水平,此时最适宜投资大宗商品。

(4)在滞胀阶段,现金防守性价值最高,通货膨胀率持续上升。

在经济滞胀阶段,GDP增长率低于潜在经济增长率,通货膨胀率持续上升,生产力下降,工资和原材料价格上升,公司只有通过提高商品价格以确保盈利。而失业率唯一可以打破这种恶性循环。此时,现金是最好的投资资产。

2.美林时钟的两个宏观指标:GDP和CPI美林时钟利用经济增长率(GDP)和通货膨胀率(CPI)两个宏观指标的涨跌规律组合出了4种可能,经济在这4个象限中顺时针转动。

(1)当GDP和CPI是正相关时,即GDP上升,CPI也会上升,反之亦然。

(2)当CPI的变化滞后于GDP时,从GDP的上升到CPI的上升是需要传导时间的,反之亦然。

(3)世界上任何一个国家的中央银行想要促进经济发展都必须是在控制通货膨胀的前提下进行的。当CPI过高时,中央银行会牺牲经济增长来控制CPI;而当CPI相对平稳时,才会再想办法促进经济增长。

(4)中央银行可以通过货币政策来控制CPI及刺激经济。例如,通过降息或下调存款准备金等手段。

如图5-2所示,从左下方开始,“衰退”以顺时针方式旋转,从一个阶段到另一个阶段的转变是由GDP和CPI的箭头所表示的。

GDP和CPI的关联特征分别是:复苏阶段(GDP上升+CPI下降);过热阶段(GDP上升+CPI上升);滞胀阶段(GDP下降+CPI上升);衰退阶段(GDP下降+CPI下降)。

4个时间周期中任何一个时间周期都对应着不同的投资策略。

• 周期性:当经济增长复苏时,股票、大宗商品变现突出,如科技或钢铁等周期性行业表现突出;当经济增长放缓时,债券和现金表现突出。

• 投资期:当通货膨胀下降时,贴现率下降,债券防守型增长,投资者适宜投资长期性资产债券;当通货膨胀上升时,大宗商品和现金等实物资产表现突出,购买能力充足,股票基金走强。

• 调整利率:中央银行通过使用宽松货币政策来调整利率使得经济开始复苏。银行和消费类股票对利率敏感性较高,在经济周期的早期阶段表现最为突出。

• 投资品种:银行股和保险股对债券和股票价格敏感,在衰退或复苏阶段表现良好;矿业股对金属价格敏感,在经济过热期间表现突出;石油和天然气对石油价格敏感,在滞胀时期表现优异。

由于国内经济的特殊情况,经济结构性调整叠加问题可能导致美林时钟测量不准,例如2009年的大规模刺激政策直接从衰退阶段进入过热阶段,但作为成熟经济体的运行周期规律,美林时钟终究会回到它正确的轨道上。

因此,按照美林时钟的测算思路再结合我国经济发展阶段,投资者在投资理财过程中,债券应作为配置的重要选择。虽然2019年的牛市可以确立,但债券在牛市行情仍然存在可观空间。投资者可选择绩优信用等级高的企业债、公司债等品种,或认购债券型基金、券商债券等产品间接参与到债券市场多元化投资中。

宏观对冲策略的特征如下。
(1)投资范围非常广,无论是股票、债券、期货、外汇还是大宗商品,都能做到在不同的投资市场捕捉相应的投资机会。
(2)属于全球性策略,宏观对冲策略可以从特定的国家、市场预期趋势中,快速发现市场偏差和周期性的结构变化,从而获取稳定的高额利润,主要是看清楚宏观经济趋势及结构性宏观失衡偏差等因素。
(3)有效控制风险,由于采用自上而下的分析方法进行宏观判断,并不属于高频交易,所以只要配置弱相关性的各大类资产就能降低与股票市场的相关性,从而达到分散风险及有效控制风险的目的。
(4)适合大型基金的运作,无论资金体量、管理规模有多大都不会受到任何限制。由于资金容量高,宏观对冲策略在海外被誉为是最值得信赖的私募基金策略。

微观对冲策略:股票投资中的Alpha策略和配对交易

Alpha策略是典型的微观对冲策略,也是对冲基金常用的投资策略,其研究在投资策略中相对于指数的投资价值超出市场收益的部分,通过指数对冲系统性风险。

Alpha策略的来源有两种:一种是如国债、企业债、可转换债券等固定收益类资产自身就能提供的Alpha策略,另一种是通过衍生品与股票、基金、商品等组合构成的Alpha策略。

Alpha策略在股票市场、债券市场、商品市场等各类市场都有应用。目前伴随着科创板等衍生品种的推出,Alpha策略利用风险对冲来获取超额收益将会有巨大的需求和空间。

5.2.1 配对交易策略

配对交易策略是指从市场上同一行业内寻找两个相似性较高且走势相近的股票作为配对股票,当两只股票之间出现背离形成偏离价差时,由于已知会在未来某一时刻得到纠正,所以就会在近期卖出股价较高的股票,同时买入近期股价较低的股票,从而抓住套利机会获取利润,当两只股票恢复均衡时就不再进行交易。

配对交易想要实现买入低估值股票、卖出高估值股票,以及评定股票真实价值的目的,就必须了解套利定价理论(Active Portfolio Management,APT)。

1.套利定价理论
CAPM模型给出了基于最小方差构建投资组合的方法论,然而它的最优Sharp Ratio组合构建是假设每位市场参与者都知道所有股票的预期收益率的,这也是最具争议的一点。那么依据CAPM模型,工作的第一步在于努力获取尽可能准确的预期超额收益率。本节基于套利定价理论给出一种获取预期超额收益率的方法。

套利定价理论是基于多因子模型生成预期收益率的理论框架,它认为每只股票的预期超额收益率都可以由因子暴露度的线性组合来表示。股票i的超额收益率Ri可以分为两类:被因子解释的因子收益率σi和不能被因子解释的特异收益率ui。从线性空间的角度,假设我们有足够多的因子可以解释所有的收益率来源,那么任意一只股票的收益率都可以表示成某些因子的线性组合。套利定价理论的公式为
其中,Ri为股票i的预期收益率,σi为股票i的因子收益率,ui为股票i的特异收益率,ai,k为股票i对第k个因子的暴露度,rk为第k个因子的预测收益率
套利定价理论的实现方案如下。
• 因子提取与筛选。
套利定价理论只是给出了一个多因子模型生成预期收益率的框架,然而具体的模型依然建立在寻找因子的基础上,即寻找预期收益率所在的特征空间。笔者给出了几种提取因子的思路。

基于统计模型的方法:使用历史数据进行回归分析,如LS回归、ML估计、主成分分析(Principal Components Analysis,PCA)等。

➢基于神经网络的方法:使用历史数据做神经网络模型训练。

➢基于机器学习的方法:通过SVM等方法寻找高维的特征空间,但要注意过度拟合等问题。

• 因子预测收益率rk的估算。

基于统计模型的方法:对特定股票的收益率和因子的暴露值做回归,或者通过PCA得到特征向量。

特异收益率ui的估算:假设前面所用因子可解释所有预期收益率的来源,那么在建模分析中,股票i的特异收益率只来源于无风险收益率(来自市场的收益率可用β表示)。

2.主成分分析
在多元统计分析中,主成分分析是一种分析、简化数据集的技术,它通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量。它保留低阶主成分,忽略高阶主成分。通用方法主要是对协方差矩阵进行特征分解,以得出数据的主成分(即特征向量)和相应的权值(即特征值)。PCA是简单的基于特征向量分析多元统计分布的方法,其结果可以理解为对原数据中的方差做出解释:哪一个方向上的数据值对方差的影响最大?换句话说,PCA提供了一种降低数据维度的有效办法,如果分析者在原数据中除掉最小的特征值所对应的成分,那么所得的低维度数据必定是最优的。

3.使用PCA分析上证50指数成分股
我们假设将上证50的每只成分股作为一个样本,对这50只样本做主成分分析,得到它们的主成分,并分析其主成分的特性。