menu

洞悉市场的人:量化交易之父吉姆‧西蒙斯与文艺复兴公司的故事

前言 最神秘的避险基金富豪

页码 15

到二零一九年初,避险基金等量化投资人(quantitative investor,或称「宽客」〔quant〕)已经成为市场最大宗交易者,掌控股市三成交易,不论是散户投资人或是传统投资券商,量化投资的比例都居首位

第一章 我想当数学家

页码 34

小吉姆最喜欢做的事是思考,通常是思考数学。他满脑子都是数字、图形、斜率,三岁就会将数字加倍和分半,明白如果把「二」不断翻倍,很快就会神奇的变成「一○二四」,百玩不腻。有一天,马修带全家到海边玩,中途停下来加油,这个小男孩对此百思不解。按照小吉姆的推算,油箱里的汽油永远不会用完才对,油箱用完半桶还会剩下半桶可用,剩下的一半就算再用完一半也还有一半,如此循环下去,永远有剩下的一半可用,不可能全空。

页码 40

有一天,西蒙斯看到两位教授午夜还在当地一家咖啡馆深谈。他们都是知名数学家,分别是华伦·安布洛斯(Warren Ambrose)和艾沙道尔·辛格(Isadore Singer),当下便做了决定,他也想过那种生活,无时无刻都浸淫于香烟、咖啡、数学之中。 「那就像是突然顿悟……灵光乍现。」他说。

页码 48

在博士论文方面,西蒙斯想论证他的研究领域里某个未解难题,但指导教授卡斯坦不相信他能成功。卡斯坦告诉他,已经有许多世界级数学家尝试过,也都失败了,别再浪费时间。别人的怀疑似乎只会激励西蒙斯。他只花了两年时间,就在一九六二年完成论文《完整系统的递移性》(On the Transitivity of Holonomy Systems),探讨多维弯曲空间(multidimensional curved space)。(向初学者解释的时候,西蒙斯喜欢把「完整〔holonomy〕」比喻为「多维弯曲空间里闭曲线的切向量平移」。还真是如此。)一本备受推崇的期刊同意刊登这篇论文,帮助西蒙斯获得MIT一份颇具声望的三年教职。

页码 49

在MIT待了一年后,西蒙斯才终于克服不安。他重返波哥大,想看看有没有机会跟哥伦比亚同学(艾丝奎纳齐和梅尔)一起创业。艾丝奎纳齐回想起MIT宿舍簇新的沥青砖地板,抱怨波哥大的地板材料品质很差,西蒙斯说他认识做地板材料的人,于是,他们决定在波哥大开一家工厂,生产乙烯基地板瓷砖和聚氯乙烯(PVC)塑胶管,资金主要来自艾丝奎纳齐的岳父维克多·萧(Victor Shaio),但西蒙斯和父亲也出了点钱占点股份。

页码 51

「吉姆很小就意识到金钱是力量,」芭芭拉说:「他不希望别人的力量胜过他。」 西蒙斯坐在哈佛图书馆,过去对事业前景所产生的疑虑再度浮现。他开始疑惑其他工作是不是能带来更多成就感和兴奋感,甚至带来一些财富,至少够他清偿债务。 与日俱增的压力终于让他受不了了,他决定做个改变。

第二章 从密码学家到数学系主任

页码 54

蓝尼·鲍姆(Lenny Baum)是里面最厉害的解码者之一,他说过的一句名言成为这个单位的信条:「烂点子很好,好点子很棒,没有点子很逊。」

页码 56

西蒙斯和同事破解苏联机密的同时,私下也在酝酿自己的秘密。电脑运算能力愈来愈进步,但证券公司接受新技术的进度却十分缓慢,仍然继续仰赖卡片分类的人工方法进行会计等作业。西蒙斯决定开一家公司用电子方法来交易、研究股票,这是一个有潜力可以彻底颠覆整个产业的概念。

页码 60

在解码和数学研究双双功成名就的同时,西蒙斯仍然不忘寻找新的赚钱方法。由于IDA给研究人员很大的工作弹性,西蒙斯因而得以投入时间研究股市。在鲍姆和其他两位同事的合作下,西蒙斯开发出一套新奇的股票交易系统。四人替IDA发表一篇机密的内部论文,标题是〈股市行为的机率模型与预测〉(Probabilistic Models for and Prediction of Stock Market Behavior),文中提出一套交易方法,号称每年至少有50%的报酬率。

真正特别的地方是,这篇论文并不想利用经济理论或其他传统方法来辨识、预测那八种状态,也不打算了解市场为什么进入某个状态。西蒙斯和同事是利用数学来判定手上的价格数据最符合哪一种状态,然后模型就会根据这个判断来下注。为什么并不重要,西蒙斯和同事似乎认为,该以何种策略来好好利用推断出的状态才是重点。

页码 66

当时,西蒙斯有三个年幼的子女要养,不知道接下来该怎么办。不过,这么突然就被开除,让他坚信以后一定要对自己的未来握有掌控权,只是他不太清楚该怎么做

页码 76

弗莱费尔德采取的投资策略与众不同。他建构了一个计量经济(econometric)模型来预测原物料商品的期货价格,包括糖。他将经济等数据输入模型里,比方说,如果农作物产量下滑,他的模型就会计算出接下来价格会上涨,这是量化投资的雏形。

第三章 金钱计量学公司

页码 82

西蒙斯来自另一个世界,视角独特。他习惯仔细检视庞大的数据,从他人眼中的随机找出秩序。科学家和数学家所接受的训练是挖掘自然界混乱表象之下意想不到的简朴、构造、甚至美丽,所挖掘出的模式和规律就是科学定律。

页码 90

交易策略:

鲍姆没花多久就开发出一套演算法,只要货币走势比近期趋势线低到某个程度,就发出买进指令,反之则发出卖出指令。这是很简单的工作,没什么难度,但鲍姆看来正走在正确的道路上,这给了西蒙斯信心。

页码 97

不到六个月,胡兰德的数据便显示出令人不安的亏损:西蒙斯转做债券交易失败。客户仍然不断打电话来,只是现在并非打来道贺,而是打来问为什么亏这么多钱。

页码 98

接下来几天,西蒙斯从畏缩中走出来,坚定更胜以往,决心要打造一个高科技交易系统,由演算法主导,也就是逐步的电脑指令,而不是靠人脑判断。在这之前,西蒙斯和鲍姆仰赖的是自己的直觉和粗糙的交易模型,这个方法让他们陷入危机,于是,西蒙斯跟他聘来投资股票的技术专家郝尔德·摩根(Howard Morgan)坐下来,订下新目标:建立一套完全仰赖演算法的精密交易系统,甚至是自动化交易。

页码 102

结果,商品期货交易委员会竟然没看出这起意外的滑稽之处,他们出清西蒙斯的马铃薯部位,导致西蒙斯和他的投资人亏损几百万美元。没多久,西蒙斯和鲍姆就对这套系统失去信心。没错,他们看得到小猪笼的交易,盈亏也都很清楚,但他们不知道这个模型的交易决策背后的原因。也许电脑交易模型终究还是不可行,他们心想。

页码 108

一九八二那年,鲍姆看多股市,宁愿错过公司在西蒙斯的游艇举办的年度郊游,也要看盘买进更多股票期货。到了中午左右,鲍姆心不甘情不愿加入同事,西蒙斯问他为什么一脸闷闷不乐。 「我才买到一半,」鲍姆说:「就得来吃这顿午餐。」

第四章 机器学习

页码 131

交易策略:

劳佛做出电脑模拟,用来测试某些买卖策略是否该纳入交易模型中,这些策略所依据的想法通常是,价格开高或开低之后会出现反转。如果某个期货的开盘价异常低于上次收盘价,劳佛就会买进,如果开盘价比上次收盘价高很多则会卖出

页码 137

终于,艾克斯决定有必要用比较复杂的方式来交易。他们一直没用过比较复杂精细的数学来建构交易公式,原因之一是电脑运算能力似乎还不够,现在艾克斯觉得可以试试看了

页码 137

交易策略:

长久以来,艾克斯便认为金融市场跟马可夫链有著共同点,马可夫链就是下个事件只取决于当前状态的事件序列。在马可夫链中,要百分之百准确预测每一步是不可能的,但如果用一套好的模型,就可以做出具有一定准确度的预测。西蒙斯和鲍姆十几年前在IDA开发那套假想的交易模型时,也是把市场视为一个类似马可夫链的过程。

为了改进预测模型,艾克斯决定是该引进有随机方程经验的人了,因为马可夫链属于随机方程家族的一部分。对于那种会随著时间演化、有很大不确定性的动态过程,可以用随机方程将它模型化。史特劳斯刚读过的学术文献也提到,用随机方程所建构的交易模型是有价值的工具

页码 138

市场虽然明显有随机的成分,跟天气很像,但西蒙斯和艾克斯这些数学家认为机率分布(probability distribution)能描述期货价格,就像机率分布可以描述任一随机过程一样。

页码 142

卡莫纳建议让模型自己运作,先消化所有各式数据,再吐出买卖决策;某种程度来说,这就是机器学习的雏形。这套模型会根据卡莫纳等人不懂、而且无法用肉眼看出的复杂规律、丛集(cluster)、相关性,来产生商品价格的预测。 在其他地方也有统计学家用类似的方法来分析资料库里的规律,这种方法称为核方法(kernel method)。在长岛的亨利·劳佛,也在自己的研究里进行类似的机器学习,并且开始分享给西蒙斯和其他人。

页码 144

艾克斯康团队一著手测试这个方法,很快就开始看到绩效提高,于是,公司开始纳入更高维度的核回归方法(kernel regression approaches),这种方法似乎最适合用于趋势交易模型,也就是预测投资往某个趋势走的时间会持续多久

第五章 成立大奖章基金

页码 146

我强烈相信,对所有小贝比和绝大部分成人来说,好奇心是比金钱更大的驱动力。 ──艾尔文·伯利坎普(Elwyn Berlekamp

页码 156

西蒙斯打造石溪数学系的同时,伯利坎普回到柏克莱担任电机和数学教授。一九七三年,伯利坎普成为一家密码公司的股东,当时,他认为西蒙斯可能会想投资,结果西蒙斯拿不出四百万美元,不过他接下董事一职

页码 157

一九八五年,伊士曼柯达公司(Eastman Kodak)收购伯利坎普创办的一家公司,那是专门将区块码(block code)运用在太空与卫星通讯的公司。这笔好几百万美元的意外之财给他的婚姻带来新挑战。 「我太太想要更大的房子,我想要旅行。」他说。

页码 159

交易策略:

倾整个团队人才之力,再加上卡莫纳等人的襄助,艾克斯康的模型通常以两个简单且常见的交易策略为主:一是追价,也就是锁定涨势或跌势会继续的原物料商品;一是押赌走势即将反转的原物料商品,也就是反转策略。

美林证券有位资深分析师约翰·墨菲(John Murphy)出版《金融市场技术分析》(Technical Analysis of the Financial Markets),用浅显易懂的词汇说明如何追踪价格走势并做出交易决策

第六章 短线交易

页码 176

伯利坎普还认为,若是交易不频繁,每一次的结果就会放大,只要搞砸几次,整个投资组合就完蛋了;相反的,如果交易次数很多,各别交易的影响就没那么大,不至于拖垮整个投资组合。

页码 178

西蒙斯和研究人员认为不该花时间测试直觉想出的交易点子,他们让数据自己指出异常之处,再趁机介入获利。另外,他们也认为不必了解那些异常发生的原因,发生次数够频繁、经过测试并非统计上的偶然才是重点。

页码 180

从德国马克观察到的连动现象实在太出乎意料,日圆的连动甚至更强,伯利坎普团队觉得有必要了解背后可能的原因。史特劳斯发现有学术论文提到,全球各国的央行都不喜欢货币价格突然变动,因为会对经济造成混乱,所以他们会介入来减缓剧烈变动,涨跌都是,如此一来,就会延长那些走势持续的时间。在伯利坎普看来,从伊士曼柯达这种大企业做决策之缓慢,就可看出左右货币价格变动的经济力量很可能一上演就是好几个月。

页码 181

除了清楚好懂的规律之外,伯利坎普、劳佛、史特劳斯开发的系统也能揪出不同市场中难以辨识且无法轻易解释的规律,这些趋势和异常往往来得很快,以致于大多数投资人难以察觉;而且这些异常非常微弱,所以他们称为幽灵,出现的频率又高到必须加入他们的交易里。西蒙斯开始接受「背后原因并不重要」的观点,能赚钱才是重点。

页码 187

才一年前,西蒙斯除了基金的工作,也花很多时间在副业上,现在他很确信团队终于找到某个不一样的东西,他想参与更多,于是开始打电话给伯利坎普,不断的打,几乎天天打。

页码 192

「驱动我的,向来都是好奇心,」伯利坎普说:「而吉姆重视的是金钱。」

第七章 量化交易史

页码 200

丹尼斯对他的顺势投资系统非常有信心,甚至将规则编纂整理,分享给大约二十个他招募来的「海龟」。他给这些新手现金,派他们分头去交易,目的是赢得他跟朋友长久以来的争辩:他的方法连笨蛋都能懂,门外汉也能变成投资专家。其中许多海龟的表现令人眼睛一亮,丹尼斯本人则据说在一九八六年赚了八千万美元,一年后手上操盘金额大约一亿美元,不过,他在一九八七年的市场震荡中遭受重创,成为最新一个跟西蒙斯用类似手法但壮烈成仁的案例。手上现金挥霍大半之后,丹尼斯停止交易,把重心转向鼓吹自由派政治理想、大麻合法化等。

页码 201

整个一九八零年代,不断有应用数学家和前物理学家被网罗到华尔街和伦敦金融城,他们的任务通常是建立模型,以便给复杂的衍生性商品和房贷商品定价、分析风险、替投资部位避险,这些工作内容就是后来所谓的财务工程(financial engineering

页码 202

反对量化交易的论据:

一九八零年代,证明某些参差不齐的数学形状(称为「碎形」,fractal)和自然界的不规则非常相似的本华·曼德博教授(Benoit Mandelbrot)主张:金融市场也有碎形。他的理论意味市场的意外事件远多于普遍认知,这是高性能电脑产生的复杂电脑模型之所以被怀疑的另一个原因。曼德博的研究,使由交易员转为作家的塔雷伯(Nassim Nicholas Taleb)等人的观点得到强化:受欢迎的数学工具和风险模型,并不足以让投资人因应大规模、难以预测、偏离历史规律的事件,偏离现象发生得太频繁,远超过大多数模型的掌握。

页码 204

一九六四年,索普把注意力转到全世界最大的赌场:华尔街。读了技术分析相关书籍,还有班杰明·葛拉汉(Benjamin Graham)和大卫·陶德(David Dodd)的指标大作、给基本面投资打下基础的《证券分析》(Security Analysis)之后,他「对大多数人所知竟然这么少感到惊讶,但也深受鼓舞」,他在自传《他是赌神,更是股神》(A Man for All Markets)如此写道。

页码 209

交易策略:

摩根士丹利这批交易员成为第一批拥抱统计套利(statistical arbitrage)的人。整体来说,统计套利是同时做大量交易,这些交易跟整个市场没有关联,而是著眼于统计异常之处或其他市场行为,从中获取利润。举个例子,APT的软体先根据过去几周的涨跌列出股票排行,然后对某个产业里涨幅最大的前10%股票放空,并对跌幅最大的前10%股票做多,打的算盘就是走势会反转

页码 211

弗瑞提议解析各类股票的走势,找出股票走势的自变数(independent variable)。举个例子,埃克森美孚石油(Exxon)飙涨的原因可能有好几个,譬如油价上涨、汇率、市场的整体动能等;宝侨(Procter & Gamble)股票上涨最有可能的原因是资产负债表健康,市场对稳健股的需求变高,因为负债累累的公司令投资人皱眉。果真如此的话,如果数据显示这两类股票的价差已大于历史水位,或许就有必要卖出财务强健的类股、买进高负债的类股。同一时间,已有不少投资人和学者开始在考虑这种因子投资(factor investing),但弗瑞想知道用电脑统计等数学方法来找出影响股票的真正因素会不会更好。

页码 211

弗瑞辞掉工作,找上吉姆·西蒙斯,获得他的金援,成立克卜勒财务管理公司(Kepler Financial Management)。

页码 213

本身是超级电脑专家的萧,聘请数学和科学博士,这些人也认同他用科学方法交易的概念。另外,他还引进各种背景的聪明人士,主修英文和哲学的人是他最爱找的对象,他也聘用西洋棋高手、单口喜剧表演者、出过书的作家、有资格参加奥运的击剑运动员、长号乐手、爆破专家。

他们有位程式设计师叫做杰佛瑞·贝佐斯(Jeffrey Bezos),跟萧一起工作几年后,他把包袱收一收,搬进一辆开往西雅图的箱型货车,坐在驾驶座开车的是他当时的太太麦肯琪(MacKenzie)。一路上,贝佐斯忙著在大腿上的笔电上打出新公司Amazon.com(亚马逊)的营运计划书

第八章 只要能预测市场规律就好

页码 224

对西蒙斯来说,经历复杂难搞的鲍姆、艾克斯、伯利坎普之后,劳佛的温和友善令他如沐春风。西蒙斯变成总揽公司全局的人,负责募集资金、网罗人才、规划紧急应变,以及根据近来强劲获利制定整个团队的策略,劳佛则在新的石溪办公室带领研究部门,史特劳斯则在柏克莱交易。

页码 224

交易模型:

劳佛一开始就做了一个日后证明价值连城的决定,那就是大奖章基金采用单一模型策略,不打算依照投资和市场情况的不同而采多重模型,后者是多数量化公司采纳的做法。劳佛承认,多重模型策略比较简单,也比较容易完成,但是他认为,如果采单一模型,就可以用上史特劳斯那套庞大的价格数据,侦测相关性、时机及其他跨资产类别的讯号,相反的,范围狭小的个别模型有数据太少的疑虑。

页码 227

交易策略:

团队也挖出跟波动性相关的预测效应,以及一连串的组合效应(combination effect),例如:配对投资,像是黄金和白银、燃料油和原油的走势往往在某些交易时段同步。有些新的交易讯号并不是马上就看得出有用,不过,只要P值(p-value),也就是机率值(probability value)小于0.01,代表在统计上具有显著性,统计假象的可能性很低,这些交易讯号就会纳入系统。

页码 227

交易策略:

西蒙斯的意思是要他们解决另一个伤脑筋的问题:可行的交易策略这么多,大奖章的资金又有限,每一笔交易该投注多少金额?还有,应该选择哪些交易策略?优先顺序为何?于是,劳佛开始写电脑程式,来找出一天中的最佳交易,西蒙斯开始称它为「下注演算法」(betting algorithm)。劳佛决定把这个程式做成「动态」,程式会自己调整,并且根据即时分析、期货市场走势的机率,来调节基金的留仓组合,而这就是机器学习的早期雏形

页码 235

派特森使劲的把电脑搬进西蒙斯办公室的角落,在认定文艺复兴公司应该不是诈骗集团之后,便开始协助劳佛处理一个顽强问题:找出有利可图的交易策略只完成了一半,因为买卖动作本身就会影响价格,甚至可能导致利润瞬间缩水。举个例子,假设你知道铜价会从一口3.00美元涨到3.10美元,但如果你的买单在交易完成前就把价格推升到3.05美元,也许是交易员拉高了价格,也可能是竞争对手也在买,潜在利润就足足少了一半,就算你预先知道会上涨也没多大意义。

页码 238

随著时间过去,西蒙斯渐渐得出结论,他向投资人说,亏钱的人八成不是低频交易者,譬如买进就长期持有的散户,也不是「跨国企业的财务长」,这些人每隔一段时间就会调整外汇投资组合,以因应公司的需求。 看来,文艺复兴公司是利用投机者同行的小毛病和缺失才赚到钱的,大小投机者都有。

页码 240

「我们真正要建模的是人类行为,」研究人员沛纳维克解释:「人类在高压下最容易预测,这时,他们会凭著直觉和恐慌行事。我们的假设是人的反应会跟以前的人一样……而我们知道如何从中受益

页码 247

长久以来,始终有两个动机驱动著西蒙斯,一是证明他能解决大问题,一是赚很多很多钱。朋友无法理解他为何还需要累积更多财富,但这股需求从未停止,始终存在。

第九章 网罗人才

页码 257

朱肯米勒告诉索罗斯,英国当局势必会脱离欧洲汇率机制(European Exchange Rate Mechanism),放手让英镑贬值,以利英国走出经济衰退。朱肯米勒承认他这种看法并不是主流,但他有信心局势会如他所料发展。

页码 258

量子基金放空英镑一百亿美元,其他得知情况演变或得出相同结论的对手也随后跟进,进一步压低英镑,给英国当局造成极大压力。一九九二年九月十六日,英国政府弃守,英镑贬值20%,朱肯米勒和索罗斯短短二十四小时就有超过十亿美元入袋。量子基金一九九三年获利超过60%,操盘规模很快就达到八十亿美元以上,远远大于西蒙斯的梦想。这次英镑放空交易在往后十多年一直被公认是史上最厉害的操作,证明高剂量的见识和胆量可以赚进这么多钱。

页码 259

交易策略:

克卜勒公司做的改良是把这种方法用于统计套利,如果股票涨幅不如过去这些因素所造成的涨幅,那就买进,同时放空表现较差的股票。假设苹果电脑和星巴克在多头市场各上涨10%,但苹果过去在多头市场的涨幅都高于星巴克很多,那么克卜勒公司就会买进苹果,放空星巴克。透过时间序列分析和其他统计方式,弗瑞和同事寻找交易失误(trading errors),也就是无法用各重要因素的历史数据来充分解释的走势,然后假设这些跟历史数据相异的差距会随著时间消逝。

页码 260

把赌注押在股票跟股票之间的相关性和相对差距,而不是押在股票的涨跌,这代表弗瑞不需要预测股票的走向。预测走向对任何人都是困难的工作。他们也不是很在意大盘走向,也就是说,克卜勒公司的投资组合是市场中立型(market neutral),对股市走势免疫。弗瑞的模型通常只锁定股票之间的相关性是否回归历史常态,也就是「回归平均」策略,采取这种投资组合,背后的盘算就是要抑制基金的波动性,制造高「夏普比率」(Sharpe ratio)。夏普比率取名自经济学家威廉·夏普(William F. Sharpe),通常用于计算把风险算入之后的报酬率,夏普比率高代表历史绩效强健稳定。

页码 271

用数学术语来说,布朗、莫瑟及杰利内克团队把语音看成一个序列的输出,里面每个音都是随机出现的,但会取决于前一个音,这就是隐藏马可夫链模型。语音辨识系统就是取一组语音,算出其中的机率,然后猜测背后「隐藏」著什么样的文字序列才会产生那些语音

页码 278

IBM举办重新命名比赛,布朗提议的「深蓝」(Deep Blue)雀屏中选,其中的Blue取自IBM长久以来的称号Big Blue。几年后,一九九七年,数百万人从电视上看到深蓝打败世界棋王盖瑞·卡斯帕洛夫(Garry Kasparov),电脑时代真的到来了。

页码 280

西蒙斯给两人提出薪水加倍的条件,一九九三年,他们终于上了这条船,就在文艺复兴公司无力掌握股票交易而愈来愈紧绷之际。部分研究人员力劝西蒙斯放弃,他们说,弗瑞和他的团队已经花够多时间了,还是拿不出什么成绩。 「我们在浪费时间,」有个人某天在文艺复兴公司的午餐室告诉弗瑞:「我们真的必须做这个吗?」 「我们有在进步。」弗瑞坚持。

第十章 突破

页码 293

布朗和莫瑟全心投入弗瑞的模型改造工作。两人常常工作到很晚,甚至一起回家;周间,两人同住于当地一位老妇人家顶楼的起居空间,周末才各自回家。渐渐的,布朗和莫瑟找到改良西蒙斯股票交易系统的方法。原来,弗瑞的模型所做的建议不切实际,甚至做不到。举例来说,券商给新星基金的杠杆(也就是融资)额度是有限制的,所以,每当新星的杠杆超过某个门槛,弗瑞和同仁为了避免超出上限,就会手动缩小投资组合,这样等于凌驾模型的建议。

页码 294

想做的交易做不到,所造成的后果不仅是绩效不彰而已。这套因子交易系统所建议的交易很复杂又环环相扣,每一笔交易都是获利所必需,也是把风险维持在可接受范围所必需;相对之下,期货的交易就很单纯,如果某一笔交易没做成,造成的影响也不大。在弗瑞这套股票交易系统,只要有几个交易没做成,整个投资组合可能会对大盘变动变得更敏感,而危及整体健全;有时还会产生连锁反应,造成系统性的大问题,连累到整个模型的准确性,甚至只要有一点点差错,就会产生弗瑞他们解决不了的大问题,因为弗瑞和团队使用的是一九九零年代中期的技术,再加上他们的软体工程能力低于一般水准。

页码 295

要是模型推荐的交易没有执行,不管是什么原因,模型会自己修正,自动寻找买单或卖单,把投资组合推回它应该在的地方,以此来解决令弗瑞那套模型绑手绑脚的问题。这套系统一小时会重复循环好几次,进行优化处理,权衡数千笔可能的交易之后,才发出电子交易指令。

页码 296

布朗和莫瑟最后完成的精密系统有五十万行程式码,远多于弗瑞旧系统的几万行。新系统纳入所有必要的限制和条件,从各方面来看,正是西蒙斯梦想多年的那种自动交易系统。

页码 301

西蒙斯还是那个乐观到无可救药的人,但连他都觉得够了。他给布朗和莫瑟下了最后通牒:半年内把你们的系统搞定,否则就不要再继续了。布朗熬夜寻找解决方法,睡在办公室里的活动折叠床;莫瑟的上班时间没那么长,但同样紧凑投入。两人还是找不出问题所在。处理的金额很小时,这套系统可以赚不少钱,一旦西蒙斯加进杠杆操作,交易金额变大,获利就蒸发不见。根据布朗和莫瑟的模拟程式,金额变大应该还是能赚钱才对,但实际上却是赔钱,跟弗瑞几年前的交易没有两样。

页码 302

某天傍晚,连续盯著电脑几小时而视线模糊的梅格曼,隐约看到某个奇怪的东西:显示标准普尔五百指数那一行模拟程式码异常的低。这个模拟程式所用的数字似乎是一九九一年的,只有当前数字的一半左右。莫瑟把它写成一个静态数字,不是会随著市场波动不断更新的变动数字。 梅格曼修好这只虫并更新了数字,其他地方又冒出另一个问题,是一个代数错误。那天晚上,他几乎都在处理这个代数问题,但他觉得他也解决了。现在这个模拟程式的演算法终于能推荐最佳投资组合了,包括要扩大持股的话该融资多少等,所产生的投资组合似乎真能获利丰厚,至少根据梅格曼的计算是如此

第十一章 量化投资的挫败

页码 306

有一天,一个数据输入有误,导致买进的小麦期货变成原本打算买进数量的五倍,也推升价格。隔天,做了蠢事而满怀歉意的同事拿起《华尔街日报》,读到分析师把小麦价格暴涨归因于市场担心小麦歉收,殊不知那只是文艺复兴公司搞了大乌龙。

页码 307

西蒙斯很担心无意中错失赚钱机会,便提出一个新点子。每年有几万篇经过同侪审查的研究论文发表,经济学、金融学、心理学等领域都有,有这么多人钻研金融市场的内部运作,也示范获取超高报酬的方法,最后却都扫进历史垃圾堆。西蒙斯决定每周各分派三篇论文给布朗、莫瑟这几个高阶主管,请他们阅读、消化、报告,一个「宽客读书会」就此成立,只是这群人热衷的主题不是性或谋杀,而是金钱。 读了几百篇论文之后,西蒙斯和同事就放弃了。那些学术论文提到的方法看起来叫人跃跃欲试,但大奖章研究人员实际测试那些论文建议的交易策略后,却往往成效不彰。读了这么多令人失望的论文,只是坐实公司内部某种唱衰氛围:要预测金融走势是不可能的。

页码 308

科学家和数学家必须互动、辩论、分享点子,才有可能产出最佳成果。西蒙斯这番训诫看似不言而喻,但从很多方面来看是很激进的

对于这个问题,其他交易公司的处理方式是让那些研究人员各做各的事,有时甚至让他们互相竞争。西蒙斯则坚持采取另一种方式:大奖章采用单一庞大的交易系统。他们那些带进滚滚钱财的演算法里,每一行程式码都开放给所有同仁取用,全都以清楚易懂的明文(cleartext)*存放于公司的内部网路,没有任何程式码仅限高阶经理人存取。只要是为了改良系统,所有人都能做实验性的修改。西蒙斯期待研究人员互相交换点子,不要藏私。

页码 309

西蒙斯打造出一种非比寻常的公开透明文化。同事们会晃到其他人的办公室,提供建议并展开合作。如果碰到挫败,这群科学家会把工作分出去,向外求援,而不是干脆打掉,换个计划重新开始,所以,有前途的点子不会如同西蒙斯所说的「浪费掉」。

页码 309

于是,同侪压力成了重要的鞭策工具。研究人员、程式设计师等人把大半时间花在准备报告,疯狂的想让同事刮目相看,或至少不能在同事面前丢脸,刺激他们锲而不舍的挑战高难度问题、想出巧妙方法。 「如果你进步不多,就会感受到压力,」弗瑞说:「这会决定你的自我价值。」

页码 314

交易模型:

到了一九九七年,大奖章的同事已经订出三个步骤来挖掘在统计上显著的赚钱策略,也就是挖掘他们所称的交易讯号。第一步是从历史价格数据找出异常规律;再来是确定那些异常在统计上有显著性,是一再出现的、非随机的;三是看看这些辨识出的价格变化能否合理解释。

页码 315

采用这种没有道理可言的策略有个明显的危险,那就是你看到的规律可能只是没有意义的巧合罢了。只要爬梳数据的时间够长,要找到这种报酬亮眼、但其实只是碰巧的交易并不难,宽客把这种情况称为数据过度配适(data overfitting)。为了凸显仰赖这类毫无逻辑讯号的愚蠢,量化投资人大卫·莱伟伯(David Leinweber)后来提出证明,只要拿孟加拉奶油年产量、美国起司产量,再加上孟加拉和美国的羊只总数,就可以预测美国股市的报酬,而且准确度高达九九%。

页码 316

交易策略:

最后,他们拟定一套交易原则,纳入以下三种讯号:有道理可循的讯号、出乎意料但在统计上有强力依据的讯号、古怪但准确到不能忽略的讯号。

页码 317

这时候的大奖章已经愈来愈仰赖系统自己学来的策略,这就是一种机器学习。只要喂电脑够多数据,电脑就会自己学习,然后自己吐出答案。比方说,某个常胜策略会自动收到更多现金去交易,不需要任何人核准,甚至没有人知道。

页码 318

极度认真又精力充沛的布朗,奔波于一场又一场会议之间,骑著一台单轮车穿梭走廊,还差点辗过同事。晚上,他多半在办公室折叠床旁的电脑工作,累了就打个小盹。某个深夜里,他还在处理一件复杂案子,时间虽晚但仍干劲十足的他,拿起电话要打给一位资浅同事询问紧急问题,有位同事在他拨电话前阻止了他。

页码 319

擅长分析且情绪稳定的莫瑟,是布朗这位紧张大师的天然镇静剂。莫瑟工作认真,但喜欢晚上六点就回家。

页码 323

交易模型:

跟文艺复兴公司一样,梅利维勒他们并不在乎整个市场或个别投资的涨跌,他们的模型寻找的是价格异常,通常是同类投资标的之间的异常,然后这支康乃狄克州格林威治的避险基金会押赌这些异常将收敛、消失

页码 325

长期资本管理公司的资本掉到十亿美元以下,杠杆率暴增,联准会插手介入,担心这支基金崩盘会拖垮整个金融体系。在联准会的敦促之下,银行团接手这支基金。短短几个月,梅利维勒这群人赔掉将近二十亿美元的个人资产,写下事业生涯中永远抹不掉的惨烈纪录。 经过这次惨败,投资人纷纷对这种全面用电脑模型进行交易的概念敬谢不敏。

页码 329

长期资本管理公司的失败更证明文艺复兴公司信奉的箴言:永远不要太相信交易模型。没错,公司的系统看起来很成功,但任何数学公式都有可能出错。有鉴于此,他们强化基金的风险控管,如果某个策略无效,或是市场波动性大增,文艺复兴公司的系统通常会自动减少部位和风险,例如一九九八年秋天,大奖章就把期货交易减少二五%,而长期资本管理公司则不然,当他们的交易策略陷入困境时,他们的留仓部位却不减反增

页码 333

大家的忧虑不只来自亏损不断增加,还来自一种不确定感,为什么会这样?大奖章的投资组合是原物料商品、外汇、债券等期货,股票投资组合主要是用来平仓的部位(offsetting position),目的是规避整个市场的波动,所以不该出现这些亏损的。不过,系统的交易讯号多是自己透过机器学习所产生,很难找出问题的确切原因,也不知道问题何时会消退。这些机器似乎失控了。

页码 333

莫瑟还是一付泰然自若的样子,照常跟同事互动,好像什么事都没发生一样。布朗可就不是了。他从未经历过深不见底、突如其来的亏损,震惊显露无遗:神经紧张又情绪化的他,逐渐升高的恐惧完全藏不住。他无法入睡,整晚不断查看电脑,追踪股灾的最新消息;进了办公室,他脸色惨白,睡眠不足的倦容吓坏了同事。朋友说他自认亏损责任在他,因为亏损是来自他的股票交易系统。

页码 335

几个研究人员熬了几个通宵,找出一个可能的原因:有个过去很依赖的策略正在让金钱流失。那是个相当简单的策略,假如有股票在过去几周持续上涨,大奖章的系统就会自动加码买进那些股票,因为系统假设涨势会继续。这个交易讯号多年来一直都很有效,因为自动买进的纳斯达克股票处于多头走势,不断攀高,可是现在凶猛的空头走势已经开始,系统却还在叫大奖章加码买进。

页码 335

西蒙斯虽然常常强调不可凌驾交易系统的重要性,但碰到市场陷入危机的时候,他往往会收回对某些交易讯号的依赖,惹得那些向来不认为调整电脑程式有用的研究人员很不高兴。现在,连他们都巴不得赶快丢掉有问题的讯号,更何况他们的系统比较擅长做短线预测,不擅长这个问题讯号锁定的长线预测。他们迅速去除这个动能策略,止住亏损。过没多久,获利又开始累积了。

第十二章 更多数据就是最好的数据

页码 342

「更多数据就是最好的数据。」(There’s no data like more data.)莫瑟告诉同事,这句话也成了这家公司的口头禅。 莫瑟后来解释,文艺复兴公司的目的是预测股票或其他投资「在未来任一时间点」的价格,「我们想知道三秒、三天、三周、三个月后的价格。」

页码 342

莫瑟他们愈来愈清楚,交易股票和语音辨识有相似之处,因此文艺复兴公司才会不断从IBM计算语言学团队挖人。这两者的目标都是建立一个模型,来消化资料的易变杂乱,再做出可靠的猜测,猜测下一个可能出现什么,同时也都不理会那些一点也不数据导向的传统派。

页码 353

随著股票交易蒸蒸日上,布朗和莫瑟在公司的影响力也愈来愈大,劳佛的权力则日渐式微。这两组人对待工作的急迫度截然不同,就跟他们的领导人一样。不管市场如何变动,劳佛永远一派冷静谨慎;他的团队成员进公司会先喝一、两杯咖啡,翻翻《金融时报》(Financial Times),才开始工作;他们的电脑有时有点笨拙,无法快速测试、执行交易或找出新的关联性和规律,但是收益依然强劲,即使已陷入停滞不前。不管怎样,劳佛这帮人就是无法理解西蒙斯为什么需要扩大基金规模,他们每年都已经赚进几百万美元了,这样还不够吗? 布朗和莫瑟的组员常常写程式写到深夜,比赛谁在办公室待到最晚

第十三章 交棒

页码 377

所有模型都是错的,但有些模型是有用的。 ──乔治·巴克斯(George Box),统计学家

页码 378

西蒙斯的科学家对短线讯号比较有把握,原因之一是短线讯号有较多数据可供确认。举例来说,如果是一日讯号,一年内每个交易日的数据都能纳入参考;如果是一年讯号,一年内能纳入参考的数据就只有一个。虽然如此,如果真要开发以长线交易为主的演算法,研究人员还是相当有把握能有不错的获利

页码 379

最后研究人员敲定新基金会采取最少人工操作的方式,这跟大奖章一样,但持股会长达一个月或更久;另外,新基金会纳入文艺复兴公司几个常用的策略,像是找出价格的相关性和规律,但会加入比较基本面的策略,譬如根据本益比、资产负债表等资料来买进价格偏低的股票。

页码 380

经过彻底仔细的测试,科学家们断定新避险基金每年能打败大盘几个百分点,而且波动性低于大盘,这样的稳定获利对退休基金和其他大型机构特别有吸引力。更棒的是,根据他们的估算,新基金的规模就算成长到一千亿美元之多,还是能赚到那样的报酬率,有望成为史上规模最大的避险基金。

页码 389

知识产权案例:

开始有愈来愈多证据浮现,证明佛夫宾和贝拉波斯基实际上很可能带走大奖章的智慧财产。某位公正第三方专家的结论是,这两个人所使用的程式码有很多跟大奖章相同,另外,他们也用一个跟大奖章类似的模型,来测量自家交易对市场的影响。至少有一位专家证人对两人的说词感到怀疑,所以拒绝替他们出庭作证。他们两个人所采用的交易策略中,甚至有一个叫做「亨利的讯号」,而文艺复兴公司也有一个类似的策略,名字正是取自发明者的名字:亨利·劳佛,西蒙斯的长期战友。要说这纯属巧合,似乎说不过去。 那天,西蒙斯和英格兰德并没有什么进展,但在几个月后达成协议。英格兰德同意解雇佛夫宾和贝拉波斯基,并支付两千万美元给文艺复兴公司。文艺复兴公司内部有些人超级不爽,这两个叛逃的研究人员替英格兰德赚到的钱远远不只两千万美元,而且两人过几年就能摆脱约束重出江湖。不过,西蒙斯倒是松了一口气,终于能把这起纠纷抛诸脑后,同时也给公司那些想仿效的人一个警告。

页码 396

模型vs人

「这是个机会!」布朗说。 罗伯特·莫瑟似乎也认同。 「相信模型,交给模型自己决定。」亨利·劳佛附和。 西蒙斯摇摇头。他不知道公司的承受能力到哪里,能不能存活下来,他很害怕。要是亏损继续扩大,他们又无法提出足够担保,银行势必会出脱大奖章的部位,也会蒙受巨额亏损,如果走到这个地步,以后就不会有银行愿意跟西蒙斯的基金打交道,这才是致命的打击,就算文艺复兴公司的财务损失比银行小也是枉然。 他告诉同事,大奖章必须卖出部位,而不是加码。 「重点是活下去,」西蒙斯说:「就算现在卖是错的,只要能活下去,以后要加码不愁没机会。」

页码 398

「你大错特错了。」一位资深研究人员写电子邮件给西蒙斯。 「你是相信这套系统,还是不相信?」另一位科学家说,语带嫌恶。 西蒙斯说他是相信这套系统的,但是市场的亏损太不寻常,标准差已经超过二十,这种程度的亏损是大多数人从未经历过的

第十四章 川普的金主

页码 418

交易模型:

每一笔交易的获利并不大,而且只有半数多一点的交易有赚钱,但是这样就已经绰绰有余。 「我们猜对的机率是50.75%……但百分之百会有50.75%的机率会猜对。」莫瑟告诉朋友:「用这种方式就能赚进数十亿美元。」

页码 419

举个例子,如果要预测Google母公司字母控股(Alphabet)的股价走向,投资人通常会先预测这家公司的盈余、利率走向、美国经济的健康状况等,也有人会预测网路搜寻和线上广告的未来、整个科技业的展望、跨国企业的发展轨迹,以及盈余、帐面价值等变数的相关指标和比例。 而文艺复兴公司的员工则推断,影响因素不只那些,还有更多,其中有些是不容易察觉的外力,有些甚至是没有逻辑可言的因素。他们分析、估算成千上百个金融指标、社群媒体讯息、网站流量的变化,只要能量化和测试的东西几乎都不放过。透过这种方式,他们挖掘出新的影响因素,其中有些根本是大部分人不可能看得懂的。

页码 419

更重要的是,文艺复兴公司得到一个结论,那就是这些因素之间存在著数学关系。透过资料科学(data science),他们更进一步了解各个因素「何时」会产生关联、是「什么」关联,以及这些关联会「多频繁」影响股价。此外,他们也测试、梳理股票跟股票之间不易察觉、细微的数学关系,他们称之为多维异常(multidimensional anomaly),而其他投资人不是根本看不出这些数学关系,就是没完全看懂。

第十六章 优异的绩效能否持续?

页码 478

传统的主观投资的缺点越来越显著:

连华伦·巴菲特的绩效也出现衰退,在二零一九年五月之前的五年、十年、十五年,他的波克夏海瑟威的绩效都不如标准普尔五百指数

原因之一是传统的主动型基金已经不再拥有资讯优势。过去,成熟的避险基金、共同基金等都拥有一种别人没有的奢侈,那就是能仔细钻研年报和其他财务报告,从中挖掘有用、被忽略的珍贵讯息,如今,只要敲一下键盘或滑一下网页,几乎任何种类的企业财务数据都找得到,电脑也能瞬间就捕捉到,几乎不可能有任何事实或数字只有你看得到而对手不知道。

同时,取缔内线交易,以及一连串监管措施的改变,都是为了确保特定投资人无法比其他人更容易取得企业讯息,投资环境因而变得更加公平,最老练的基本面投资人所拥有的优势也就不再。

页码 481

量化投资人不会被动的坐等农产数据出炉,他们会主动去研究农用设备的销售量或农作物产量的卫星影像,从货柜的提单也可嗅出全球变化。系统交易员甚至会取得手机数据,来了解消费者在门市的哪条走道、甚至哪个货架停下来浏览商品。如果想知道某个新商品的人气如何,可以从亚马逊的评论略知一二;甚至已经有人在开发演算法,用来分析食品药物管理局各个成员的背景,以预测某种新药通过的可能性。

页码 483

文艺复兴公司一位电脑专家说:「以前要找出讯号,都要靠创意和思考碰运气乱试,现在,你只要把某一类算式丢给一台有机器学习的电脑,就能测试几百万个不同的可能

页码 484

关键是在各自的领域战胜对手:

量化公司虽然有这么多优势,投资收益却没有比那些用老派研究方法的传统公司好多少,只有文艺复兴和几家公司是明显的例外。二零一九年春天之前的五年,以量化交易为主的避险基金平均年收益是4.2%,而其他一般避险基金同期的平均收益是3.3%(以上数据并未包含不公布绩效的神秘基金,如大奖章

页码 485

「比方说,你要预测一年后的股价表现,」量化老手理查·杜威(Richard Dewey)说:「由于我们只可回溯到1900年的纪录,所以,美国只有一百一十八个不重叠的一年期数据可参考。」

页码 488

文艺复兴公司的成功足以提醒一件事:人类行为可以预测。文艺复兴公司之所以研究过去,就是因为他们有理由相信投资人一定会在未来做出相同的决策,另一方面,他们采用科学方法来对抗认知和情绪上的偏见,这代表用冷静思考来面对各种难题有其价值。他们先提出假设,然后测试、权衡并调整他们的理论,让数据引导他们,而不是任由直觉和本能带领。

页码 489

文艺复兴公司的经验也给我们上了另外一课,那就是影响金融市场和个别投资的因素和变数远多于多数人的理解与推断。投资人往往把焦点放在最基本的因素,却忽略其他几十个因素,甚至可能忽略其他所有的因素,而文艺复兴公司不只比大多数人掌握更多关键因素,连影响股价和其他投资的数学关系也掌握到了。

页码 489

西蒙斯和同事们的大丰收,可能会让人以为市场的无效率远多于多数人所认为,但其实不然,市场的无效率和赚钱机会可能比一般人以为的少。文艺复兴倾全公司上下之力,集结那么多独一无二的数据、庞大的电脑运算能力、专业人才、交易和风险管理的专业知识,也只有五成多一点的交易是有获利的,可见要打败市场有多么困难,也可见大多数投资人试图打败市场是多么愚蠢。

页码 490

西蒙斯和同事通常不去预测股价走势。现在有没有哪个专家或系统能精准预测个股走势,至少精准预测长期走势,或甚至预测金融市场的走向,不得而知。文艺复兴公司所做的是努力预测股票相对于其他股票、相对于指数、相对于因子模型(factor model)、相对于整个产业的走势。

后记 保持好奇

页码 505

「让美感带领你……也许是公司的经营,也许是实验的方式,也许是一项定理的形成,当一件事做得很好的时候,就会产生一种美感,那几乎就是一种美。」