产品特色
   
     编辑推荐
                                      畅销书《量化投资——策略与技术》全新改版升级,修正了错误,全新的金融理论篇阐述了与量化投资有关的各种经典金融理论,包括投资组合理论、定价理论及金融市场理论。      
内容简介
     《量化投资--策略与技术(精装版)》是一本全面解读量化投资策略方面的著作。畅销书全新改版,全书用60多个案例介绍了量化投资各个方面的内容,主要分为策略篇、技术理论篇和金融理论篇三部分。策略篇主要包括量化选股、量化择时、股指期货套利、商品期货套利、统计套利、期权套利、算法交易和另类套利策略等。技术理论篇主要包括人工智能、数据挖掘、小波分析、支持向量机、分形理论、随机过程、IT技术主要数据与工具及D-Alpha量化对冲交易系统等。金融理论篇阐述了与量化投资有关的各种经典金融理论,包括投资组合理论、定价理论及金融市场理论。
  《量化投资--策略与技术(精装版)》适合基金经理、产品经理、证券分析师、投资总监及有志从事金融投资的各界人士阅读。     
作者简介
     丁鹏,中国量化投资学会理事长,“大数据金融丛书”主编。
  中国量化投资领域的开拓者与奠基者,中国量化投资学会理事长、“大数据金融丛书”主编。
  他编著的《量化投资——策略与技术》是国内原创量化投资策略方面的优秀教材,已经成为业内的启蒙读物。同时担任“大数据金融丛书”主编、CCTV特邀嘉宾、第一财经《解码财商》资深解码人、《财经》《财新》《中国金融报》等知名传媒的撰稿人,发表多篇有深度的文章,深刻地影响了整个行业。他同时还是清华大学、北京大学、中国人民大学、中央财经大学、上海交通大学、南方科技大学等知名学府的讲座教授,开设多次讲座,深得学子好评。从2008年开始,他先后在东方证券衍生品总部(资深投资经理)、方正富邦专户部(副总监)和东航金控财富管理中心(总经理),从事资产管理业务,多年累计总管理规模超过50亿元,累计为客户创造收益超过10亿元。2016年,组建荣石投资进入私募领域,为高净值客户提供资产管理服务。     
目录
   策 略 篇
第1章  量化投资概念 2
第2章  量化选股 24
第3章  量化择时 110
第4章  股指期货套利 179
第5章  商品期货套利 212
第6章  统计套利 239
第7章  期权套利 274
第8章  算法交易 300
第9章  另类套利策略 319
技术理论篇
第10章  人工智能 342
第11章  数据挖掘 377
第12章  小波分析 402
第13章  支持向量机 423
第14章  分形理论 445
第15章  随机过程 465
第16章  IT技术 477
第17章  主要数据与工具 500
第18章  量化对冲交易系统:
金融理论篇
第19章  投资组合理论 528
第20章  定价理论 552      
精彩书摘
     本章中基本面选股介绍了多因子模型、风格轮动模型和行业轮动模型;市场行为选股介绍了资金流模型、动量反转模型、一致预期模型、趋势追踪模型和筹码选股模型。多因子模型是应用最广泛的一种选股模型,其基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。多因子模型相对来说比较稳定,因为在不同的市场条件下,总有一些因子会发挥作用。
  风格轮动模型是利用市场的风格特征进行投资,比如有时候市场偏好小盘股,有时候偏好大盘股,如果是在风格转换的初期介入,则可以获得较大的超额收益。行业轮动与风格轮动类似,由于经济周期的原因,总有一些行业先启动,有的行业跟随。在经济周期过程中,依次对这些轮动的行业进行配置,则比买入持有策略有更好的效果。
  资金流选股的基本思想是利用资金的流向来判断股票的涨跌,如果资金流入,则股票价格应该上涨;如果资金流出,则股票价格应该下跌。所以将资金流入流出的情况编成指标,则可以利用该指标来判断在未来一段时间股票价格的涨跌情况。
  动量反转模型是指股票的强弱变化情况。过去一段时间强势的股票在未来一段时间继续保持强势,过去一段时间弱势的股票在未来一段时间继续保持弱势,这叫作动量效应。过去一段时间强势的股票在未来一段时间会走弱,过去一段时间弱势的股票在未来一段时间会走强,这叫作反转效应。如果判定动量效应会持续,则应该买入强势股;如果判断会出现反转效应,则应该买入弱势股。一致预期是指市场上的投资者可能会对某些信息产生一致的看法。比如大多数分析师看好某只股票,可能这只股票的价格在未来一段时间会上涨;如果大多数分析师看空某只股票,可能这只股票的价格在未来一段时间会下跌。一致预期策略就是利用大多数分析师的看法来进行股票的买入卖出操作。
  趋势追踪属于图形交易的一种,就是当股价出现上涨趋势的时候,则追涨买入;当股价出现下跌趋势的时候,则杀跌卖出,其本质上是一种追涨杀跌策略。判断趋势的指标有很多种,包括MA、EMA、MACD等,其中最简单也是最有效的是均线策略。
  筹码选股是另外一种市场行为策略,其基本思想是:如果主力资金要拉升一只股票,则会慢慢收集筹码;如果主力资金要卖出一只股票,则会慢慢分派筹码。所以根据筹码的分布和变动情况,就可以预测股票价格未来是上涨还是下跌。
  有关量化选股业绩评价要从两个方面来考虑:一个是收益率,另一个是风险指数,只是收益率高的策略并不能成为最好的策略,只有综合考虑收益率和风险情况才能判断一个选股策略的好坏。量化选股需要考虑的是在承担多大的风险情况下的收益率情况。
  ……      
前言/序言
     2012年笔者的这本《量化投资--策略与技术》问世之时,业内还没有多少人知道什么是量化投资;到了今天,量化投资的会议、书籍、报告如雨后春笋般涌现,而量化投资的金融产品也以其收益稳、规模大而受到投资者的广泛关注,主流的金融机构几乎都设立了量化投资部门,建立了量化投资团队,开发了量化投资产品。量化投资与对冲基金正在从小众产品走向更大规模的发展。
  和传统投资相比,量化投资的主要优点:(1)赌大概率事件,通过分散投资、对冲交易、增加交易频率来使得整个投资过程的胜率大大提高;(2)化解人性的弱点,恐惧与贪婪是人性中无法克服的弱点,依靠自身的修炼无法做到,只能通过机器交易来完成;(3)精细化交易,这对于大资金的机构投资者尤其重要,通过计算机将大的委托单拆分成小单,可以在尽量不影响市场的情况下完成交易,降低交易成本。
  正是由于量化投资的这些优点,在过去的全球金融市场中,量化投资得到了如火如荼的发展,成为和价值投资并列的两大投资理论之一。量化投资在国内虽然刚刚起步,但依然得到了银行、保险、券商等*级机构的青睐。尤其对于大的机构而言,量化投资所能管理的资金规模比传统投资大大增多。另外,在国内监管日趋严格的情况下,传统投资很容易触及监管的边界,但是量化投资基于数据分析,基本上和内幕消息、老鼠仓绝缘,大大降低了监管成本。
  所以量化投资这种新的投资理论和投资模式,无论是对于监管层还是民间投资来说,都是*佳选择,这也是国内量化投资得到大力发展的重要原因。目前有很多年轻人正在进入这个行业,他们的蓬勃朝气,相信会对改变中国未来的金融环境起到推动作用。
  2012年1月,笔者发起组建了中国量化投资学会,目前已成为量化投资领域全国影响力*大的民间学术性组织,和电子工业出版社共同策划的"量化投资与对冲基金丛书"也出版了10本左右。从2016年开始,这套丛书改名为"大数据金融丛书",并且邀请了更多业内*尖人士参与丛书的编写,分享他们的经验与理论,力图为中国的金融行业提供持续的理论支持。在这种情况下,笔者在原来典藏版的基础上增加了一篇"金融理论篇",形成精装版,奉献给读者。    
				
 
				
				
					揭秘前沿数据科学:从理论构建到实战部署  本书深入探讨了现代数据科学领域的核心概念、尖端技术和实际应用流程。它旨在为读者提供一个全面而深入的视角,涵盖从数据采集、预处理到复杂模型构建、部署与维护的全生命周期。本书的结构设计旨在平衡理论的严谨性与实践的可操作性,确保读者不仅理解“为什么”,更能掌握“如何做”。  第一部分:数据科学的基石与基础架构  本部分首先为读者奠定了坚实的基础,聚焦于数据科学项目成功所依赖的底层框架和思维模式。  第一章:现代数据生态概览  本章首先描绘了当前数据驱动决策的宏观图景,探讨了大数据、云计算和物联网(IoT)如何共同构建起现代数据生态系统。我们将详细解析数据科学家的核心职责与角色定位,以及不同学科(如统计学、计算机科学、领域知识)之间的交叉与融合。随后,内容深入到数据治理与合规性的重要性,强调在处理敏感信息时,确保数据质量、可追溯性和隐私保护是项目成功的先决条件。本章还会介绍主流的数据基础设施组件,如数据湖(Data Lake)、数据仓库(Data Warehouse)和流式处理平台(Streaming Platforms)的架构选择与适用场景分析。  第二章:数据采集与预处理的精工细作  数据的质量直接决定了模型的上限。本章将详尽介绍从结构化、半结构化到非结构化数据源的有效采集技术。内容涵盖Web抓取(Scraping)的最佳实践、API交互的健壮性设计,以及处理大规模日志文件和传感器数据的分布式采集方案。  预处理环节是本书的重点之一。我们将深入探讨数据清洗的复杂性,包括缺失值(Missing Values)的高级插补技术(如基于模型的方法)、异常值(Outliers)的稳健检测与处理方法。此外,特征工程(Feature Engineering)的艺术性将在本章得到充分体现,介绍如何利用领域知识和数据转换技术(如变换、组合、降维预处理)来最大化特征的表达能力。数据标准化、规范化与离散化的选择标准将被详细论述,并辅以Python/R语言中的实际代码案例演示。  第二章的延伸:特征构建与维度管理  本节着重于如何通过深入挖掘数据间的内在联系来构建预测力强的特征。我们会探讨时间序列数据的滞后特征(Lag Features)和滚动统计量(Rolling Statistics)的计算,以及文本数据中的词袋模型(Bag-of-Words)、TF-IDF向量化和早期的词嵌入(Word Embedding)概念的引入。同时,维度灾难(Curse of Dimensionality)的挑战会被明确提出,并系统介绍主成分分析(PCA)、线性判别分析(LDA)等线性降维方法,以及非线性降维技术如t-SNE和UMAP在可视化和特征压缩中的应用。  第二部分:核心建模技术与高级算法  本部分从统计学习的基础出发,逐步过渡到深度学习的前沿应用,为读者构建一个结构化的模型构建知识体系。  第三章:经典机器学习算法的深入剖析  本章回归机器学习的基石,不仅仅是介绍算法的原理,更侧重于其在实际问题中的调优与性能评估。我们将详述线性模型(如回归与逻辑回归)在正则化(Lasso, Ridge, Elastic Net)下的鲁棒性增强。随后,决策树模型(Decision Trees)的构建机制,以及集成学习方法(Ensemble Methods)——包括随机森林(Random Forests)和梯度提升机(Gradient Boosting Machines, GBM)的内在逻辑和超参数敏感性分析——将得到细致的阐述。对于支持向量机(SVM),本章将探讨其核函数(Kernel Functions)的选择对非线性边界划分的影响。评估指标的选择(如AUC-ROC, F1-Score, PR曲线)及其在不同业务场景下的权重考量,是本章的实践核心。  第四章:深度学习的架构设计与应用  本章深入探索人工神经网络(ANN)的内部工作机制,包括激活函数的选择、损失函数的优化以及反向传播算法的数学基础。内容覆盖多层感知器(MLP)到更复杂的深度学习架构。  卷积神经网络(CNN):聚焦于其在图像处理中的应用,详细解析卷积层、池化层和全连接层的设计,并介绍主流模型如ResNet和Inception结构的核心创新点。  循环神经网络(RNN)与Transformer:重点讲解RNN如何处理序列依赖性,以及长短期记忆网络(LSTM)和门控循环单元(GRU)如何解决梯度消失问题。随后,本章将转向当前自然语言处理(NLP)领域的主导范式——Transformer架构,拆解其自注意力(Self-Attention)机制的强大能力,并简要提及BERT等预训练模型的概念。  第五章:无监督学习与聚类分析  在监督学习之外,无监督学习在数据探索和模式发现中扮演关键角色。本章详细介绍K-均值(K-Means)及其局限性,以及DBSCAN等基于密度的聚类方法。更高级的主题将涉及高斯混合模型(GMM)的期望最大化(EM)算法,以及层次聚类(Hierarchical Clustering)的链式构建过程。此外,异常检测(Anomaly Detection)作为无监督学习的重要分支,将介绍基于距离、基于密度和基于模型的方法(如单类SVM)。  第三部分:模型部署、伦理与未来趋势  一个模型只有被有效部署并持续监控,才能产生真正的商业价值。本部分关注将研究成果转化为生产力的桥梁,并探讨行业面临的挑战。  第六章:模型评估、验证与可解释性(XAI)  模型的健壮性测试是至关重要的环节。本章系统介绍交叉验证(Cross-Validation)的不同策略(K折、留一法、分层抽样),以及如何通过偏差-方差权衡(Bias-Variance Trade-off)来诊断模型过拟合或欠拟合问题。  模型可解释性(XAI):随着模型复杂度的增加,理解其决策过程变得更加重要。本章详细解析局部解释方法,如LIME(Local Interpretable Model-agnostic Explanations)和SHAP(SHapley Additive exPlanations)值的计算原理及其在特征贡献度分析中的应用。此外,全局解释方法如特征重要性排序也将被讨论。  第七章:生产环境的模型运维(MLOps)  本章是连接算法与工程的枢纽。我们将介绍模型部署的常见架构模式,包括实时预测(Online Serving)与批量预测(Batch Prediction)。内容涵盖容器化技术(如Docker)在模型封装中的作用,以及使用Kubernetes进行弹性扩展的策略。  持续集成与持续部署(CI/CD) 在机器学习流水线中的体现,即如何自动化测试、版本控制和模型发布流程。最后,模型漂移(Model Drift)的监测与再训练策略是MLOps的核心内容,确保模型在生产环境中长期保持性能。  第八章:数据科学的伦理、公平性与前沿展望  本章探讨数据科学实践中不可忽视的社会责任。我们将分析算法偏见(Algorithmic Bias)的来源(数据偏差、模型偏差),并介绍常用的公平性度量指标(如平等机会差异、统计均等)。如何设计去偏见的训练流程和后处理技术,是本章探讨的重点。  在展望部分,本书将简要介绍因果推断(Causal Inference)在非实验数据分析中的兴起,以及联邦学习(Federated Learning)在数据隐私保护下的分布式建模潜力,为读者的后续研究方向提供启发。  通过对以上八个章节的详尽阐述,本书旨在为读者打造一个全面、深入且极具实战指导意义的数据科学知识体系。