産品特色
   
     編輯推薦
                                      暢銷書《量化投資——策略與技術》全新改版升級,修正瞭錯誤,全新的金融理論篇闡述瞭與量化投資有關的各種經典金融理論,包括投資組閤理論、定價理論及金融市場理論。      
內容簡介
     《量化投資--策略與技術(精裝版)》是一本全麵解讀量化投資策略方麵的著作。暢銷書全新改版,全書用60多個案例介紹瞭量化投資各個方麵的內容,主要分為策略篇、技術理論篇和金融理論篇三部分。策略篇主要包括量化選股、量化擇時、股指期貨套利、商品期貨套利、統計套利、期權套利、算法交易和另類套利策略等。技術理論篇主要包括人工智能、數據挖掘、小波分析、支持嚮量機、分形理論、隨機過程、IT技術主要數據與工具及D-Alpha量化對衝交易係統等。金融理論篇闡述瞭與量化投資有關的各種經典金融理論,包括投資組閤理論、定價理論及金融市場理論。
  《量化投資--策略與技術(精裝版)》適閤基金經理、産品經理、證券分析師、投資總監及有誌從事金融投資的各界人士閱讀。     
作者簡介
     丁鵬,中國量化投資學會理事長,“大數據金融叢書”主編。
  中國量化投資領域的開拓者與奠基者,中國量化投資學會理事長、“大數據金融叢書”主編。
  他編著的《量化投資——策略與技術》是國內原創量化投資策略方麵的優秀教材,已經成為業內的啓濛讀物。同時擔任“大數據金融叢書”主編、CCTV特邀嘉賓、第一財經《解碼財商》資深解碼人、《財經》《財新》《中國金融報》等知名傳媒的撰稿人,發錶多篇有深度的文章,深刻地影響瞭整個行業。他同時還是清華大學、北京大學、中國人民大學、中央財經大學、上海交通大學、南方科技大學等知名學府的講座教授,開設多次講座,深得學子好評。從2008年開始,他先後在東方證券衍生品總部(資深投資經理)、方正富邦專戶部(副總監)和東航金控財富管理中心(總經理),從事資産管理業務,多年纍計總管理規模超過50億元,纍計為客戶創造收益超過10億元。2016年,組建榮石投資進入私募領域,為高淨值客戶提供資産管理服務。     
目錄
   策 略 篇
第1章  量化投資概念 2
第2章  量化選股 24
第3章  量化擇時 110
第4章  股指期貨套利 179
第5章  商品期貨套利 212
第6章  統計套利 239
第7章  期權套利 274
第8章  算法交易 300
第9章  另類套利策略 319
技術理論篇
第10章  人工智能 342
第11章  數據挖掘 377
第12章  小波分析 402
第13章  支持嚮量機 423
第14章  分形理論 445
第15章  隨機過程 465
第16章  IT技術 477
第17章  主要數據與工具 500
第18章  量化對衝交易係統:
金融理論篇
第19章  投資組閤理論 528
第20章  定價理論 552      
精彩書摘
     本章中基本麵選股介紹瞭多因子模型、風格輪動模型和行業輪動模型;市場行為選股介紹瞭資金流模型、動量反轉模型、一緻預期模型、趨勢追蹤模型和籌碼選股模型。多因子模型是應用最廣泛的一種選股模型,其基本原理是采用一係列的因子作為選股標準,滿足這些因子的股票則被買入,不滿足的則賣齣。多因子模型相對來說比較穩定,因為在不同的市場條件下,總有一些因子會發揮作用。
  風格輪動模型是利用市場的風格特徵進行投資,比如有時候市場偏好小盤股,有時候偏好大盤股,如果是在風格轉換的初期介入,則可以獲得較大的超額收益。行業輪動與風格輪動類似,由於經濟周期的原因,總有一些行業先啓動,有的行業跟隨。在經濟周期過程中,依次對這些輪動的行業進行配置,則比買入持有策略有更好的效果。
  資金流選股的基本思想是利用資金的流嚮來判斷股票的漲跌,如果資金流入,則股票價格應該上漲;如果資金流齣,則股票價格應該下跌。所以將資金流入流齣的情況編成指標,則可以利用該指標來判斷在未來一段時間股票價格的漲跌情況。
  動量反轉模型是指股票的強弱變化情況。過去一段時間強勢的股票在未來一段時間繼續保持強勢,過去一段時間弱勢的股票在未來一段時間繼續保持弱勢,這叫作動量效應。過去一段時間強勢的股票在未來一段時間會走弱,過去一段時間弱勢的股票在未來一段時間會走強,這叫作反轉效應。如果判定動量效應會持續,則應該買入強勢股;如果判斷會齣現反轉效應,則應該買入弱勢股。一緻預期是指市場上的投資者可能會對某些信息産生一緻的看法。比如大多數分析師看好某隻股票,可能這隻股票的價格在未來一段時間會上漲;如果大多數分析師看空某隻股票,可能這隻股票的價格在未來一段時間會下跌。一緻預期策略就是利用大多數分析師的看法來進行股票的買入賣齣操作。
  趨勢追蹤屬於圖形交易的一種,就是當股價齣現上漲趨勢的時候,則追漲買入;當股價齣現下跌趨勢的時候,則殺跌賣齣,其本質上是一種追漲殺跌策略。判斷趨勢的指標有很多種,包括MA、EMA、MACD等,其中最簡單也是最有效的是均綫策略。
  籌碼選股是另外一種市場行為策略,其基本思想是:如果主力資金要拉升一隻股票,則會慢慢收集籌碼;如果主力資金要賣齣一隻股票,則會慢慢分派籌碼。所以根據籌碼的分布和變動情況,就可以預測股票價格未來是上漲還是下跌。
  有關量化選股業績評價要從兩個方麵來考慮:一個是收益率,另一個是風險指數,隻是收益率高的策略並不能成為最好的策略,隻有綜閤考慮收益率和風險情況纔能判斷一個選股策略的好壞。量化選股需要考慮的是在承擔多大的風險情況下的收益率情況。
  ……      
前言/序言
     2012年筆者的這本《量化投資--策略與技術》問世之時,業內還沒有多少人知道什麼是量化投資;到瞭今天,量化投資的會議、書籍、報告如雨後春筍般湧現,而量化投資的金融産品也以其收益穩、規模大而受到投資者的廣泛關注,主流的金融機構幾乎都設立瞭量化投資部門,建立瞭量化投資團隊,開發瞭量化投資産品。量化投資與對衝基金正在從小眾産品走嚮更大規模的發展。
  和傳統投資相比,量化投資的主要優點:(1)賭大概率事件,通過分散投資、對衝交易、增加交易頻率來使得整個投資過程的勝率大大提高;(2)化解人性的弱點,恐懼與貪婪是人性中無法剋服的弱點,依靠自身的修煉無法做到,隻能通過機器交易來完成;(3)精細化交易,這對於大資金的機構投資者尤其重要,通過計算機將大的委托單拆分成小單,可以在盡量不影響市場的情況下完成交易,降低交易成本。
  正是由於量化投資的這些優點,在過去的全球金融市場中,量化投資得到瞭如火如荼的發展,成為和價值投資並列的兩大投資理論之一。量化投資在國內雖然剛剛起步,但依然得到瞭銀行、保險、券商等*級機構的青睞。尤其對於大的機構而言,量化投資所能管理的資金規模比傳統投資大大增多。另外,在國內監管日趨嚴格的情況下,傳統投資很容易觸及監管的邊界,但是量化投資基於數據分析,基本上和內幕消息、老鼠倉絕緣,大大降低瞭監管成本。
  所以量化投資這種新的投資理論和投資模式,無論是對於監管層還是民間投資來說,都是*佳選擇,這也是國內量化投資得到大力發展的重要原因。目前有很多年輕人正在進入這個行業,他們的蓬勃朝氣,相信會對改變中國未來的金融環境起到推動作用。
  2012年1月,筆者發起組建瞭中國量化投資學會,目前已成為量化投資領域全國影響力*大的民間學術性組織,和電子工業齣版社共同策劃的"量化投資與對衝基金叢書"也齣版瞭10本左右。從2016年開始,這套叢書改名為"大數據金融叢書",並且邀請瞭更多業內*尖人士參與叢書的編寫,分享他們的經驗與理論,力圖為中國的金融行業提供持續的理論支持。在這種情況下,筆者在原來典藏版的基礎上增加瞭一篇"金融理論篇",形成精裝版,奉獻給讀者。    
				
 
				
				
					揭秘前沿數據科學:從理論構建到實戰部署  本書深入探討瞭現代數據科學領域的核心概念、尖端技術和實際應用流程。它旨在為讀者提供一個全麵而深入的視角,涵蓋從數據采集、預處理到復雜模型構建、部署與維護的全生命周期。本書的結構設計旨在平衡理論的嚴謹性與實踐的可操作性,確保讀者不僅理解“為什麼”,更能掌握“如何做”。  第一部分:數據科學的基石與基礎架構  本部分首先為讀者奠定瞭堅實的基礎,聚焦於數據科學項目成功所依賴的底層框架和思維模式。  第一章:現代數據生態概覽  本章首先描繪瞭當前數據驅動決策的宏觀圖景,探討瞭大數據、雲計算和物聯網(IoT)如何共同構建起現代數據生態係統。我們將詳細解析數據科學傢的核心職責與角色定位,以及不同學科(如統計學、計算機科學、領域知識)之間的交叉與融閤。隨後,內容深入到數據治理與閤規性的重要性,強調在處理敏感信息時,確保數據質量、可追溯性和隱私保護是項目成功的先決條件。本章還會介紹主流的數據基礎設施組件,如數據湖(Data Lake)、數據倉庫(Data Warehouse)和流式處理平颱(Streaming Platforms)的架構選擇與適用場景分析。  第二章:數據采集與預處理的精工細作  數據的質量直接決定瞭模型的上限。本章將詳盡介紹從結構化、半結構化到非結構化數據源的有效采集技術。內容涵蓋Web抓取(Scraping)的最佳實踐、API交互的健壯性設計,以及處理大規模日誌文件和傳感器數據的分布式采集方案。  預處理環節是本書的重點之一。我們將深入探討數據清洗的復雜性,包括缺失值(Missing Values)的高級插補技術(如基於模型的方法)、異常值(Outliers)的穩健檢測與處理方法。此外,特徵工程(Feature Engineering)的藝術性將在本章得到充分體現,介紹如何利用領域知識和數據轉換技術(如變換、組閤、降維預處理)來最大化特徵的錶達能力。數據標準化、規範化與離散化的選擇標準將被詳細論述,並輔以Python/R語言中的實際代碼案例演示。  第二章的延伸:特徵構建與維度管理  本節著重於如何通過深入挖掘數據間的內在聯係來構建預測力強的特徵。我們會探討時間序列數據的滯後特徵(Lag Features)和滾動統計量(Rolling Statistics)的計算,以及文本數據中的詞袋模型(Bag-of-Words)、TF-IDF嚮量化和早期的詞嵌入(Word Embedding)概念的引入。同時,維度災難(Curse of Dimensionality)的挑戰會被明確提齣,並係統介紹主成分分析(PCA)、綫性判彆分析(LDA)等綫性降維方法,以及非綫性降維技術如t-SNE和UMAP在可視化和特徵壓縮中的應用。  第二部分:核心建模技術與高級算法  本部分從統計學習的基礎齣發,逐步過渡到深度學習的前沿應用,為讀者構建一個結構化的模型構建知識體係。  第三章:經典機器學習算法的深入剖析  本章迴歸機器學習的基石,不僅僅是介紹算法的原理,更側重於其在實際問題中的調優與性能評估。我們將詳述綫性模型(如迴歸與邏輯迴歸)在正則化(Lasso, Ridge, Elastic Net)下的魯棒性增強。隨後,決策樹模型(Decision Trees)的構建機製,以及集成學習方法(Ensemble Methods)——包括隨機森林(Random Forests)和梯度提升機(Gradient Boosting Machines, GBM)的內在邏輯和超參數敏感性分析——將得到細緻的闡述。對於支持嚮量機(SVM),本章將探討其核函數(Kernel Functions)的選擇對非綫性邊界劃分的影響。評估指標的選擇(如AUC-ROC, F1-Score, PR麯綫)及其在不同業務場景下的權重考量,是本章的實踐核心。  第四章:深度學習的架構設計與應用  本章深入探索人工神經網絡(ANN)的內部工作機製,包括激活函數的選擇、損失函數的優化以及反嚮傳播算法的數學基礎。內容覆蓋多層感知器(MLP)到更復雜的深度學習架構。  捲積神經網絡(CNN):聚焦於其在圖像處理中的應用,詳細解析捲積層、池化層和全連接層的設計,並介紹主流模型如ResNet和Inception結構的核心創新點。  循環神經網絡(RNN)與Transformer:重點講解RNN如何處理序列依賴性,以及長短期記憶網絡(LSTM)和門控循環單元(GRU)如何解決梯度消失問題。隨後,本章將轉嚮當前自然語言處理(NLP)領域的主導範式——Transformer架構,拆解其自注意力(Self-Attention)機製的強大能力,並簡要提及BERT等預訓練模型的概念。  第五章:無監督學習與聚類分析  在監督學習之外,無監督學習在數據探索和模式發現中扮演關鍵角色。本章詳細介紹K-均值(K-Means)及其局限性,以及DBSCAN等基於密度的聚類方法。更高級的主題將涉及高斯混閤模型(GMM)的期望最大化(EM)算法,以及層次聚類(Hierarchical Clustering)的鏈式構建過程。此外,異常檢測(Anomaly Detection)作為無監督學習的重要分支,將介紹基於距離、基於密度和基於模型的方法(如單類SVM)。  第三部分:模型部署、倫理與未來趨勢  一個模型隻有被有效部署並持續監控,纔能産生真正的商業價值。本部分關注將研究成果轉化為生産力的橋梁,並探討行業麵臨的挑戰。  第六章:模型評估、驗證與可解釋性(XAI)  模型的健壯性測試是至關重要的環節。本章係統介紹交叉驗證(Cross-Validation)的不同策略(K摺、留一法、分層抽樣),以及如何通過偏差-方差權衡(Bias-Variance Trade-off)來診斷模型過擬閤或欠擬閤問題。  模型可解釋性(XAI):隨著模型復雜度的增加,理解其決策過程變得更加重要。本章詳細解析局部解釋方法,如LIME(Local Interpretable Model-agnostic Explanations)和SHAP(SHapley Additive exPlanations)值的計算原理及其在特徵貢獻度分析中的應用。此外,全局解釋方法如特徵重要性排序也將被討論。  第七章:生産環境的模型運維(MLOps)  本章是連接算法與工程的樞紐。我們將介紹模型部署的常見架構模式,包括實時預測(Online Serving)與批量預測(Batch Prediction)。內容涵蓋容器化技術(如Docker)在模型封裝中的作用,以及使用Kubernetes進行彈性擴展的策略。  持續集成與持續部署(CI/CD) 在機器學習流水綫中的體現,即如何自動化測試、版本控製和模型發布流程。最後,模型漂移(Model Drift)的監測與再訓練策略是MLOps的核心內容,確保模型在生産環境中長期保持性能。  第八章:數據科學的倫理、公平性與前沿展望  本章探討數據科學實踐中不可忽視的社會責任。我們將分析算法偏見(Algorithmic Bias)的來源(數據偏差、模型偏差),並介紹常用的公平性度量指標(如平等機會差異、統計均等)。如何設計去偏見的訓練流程和後處理技術,是本章探討的重點。  在展望部分,本書將簡要介紹因果推斷(Causal Inference)在非實驗數據分析中的興起,以及聯邦學習(Federated Learning)在數據隱私保護下的分布式建模潛力,為讀者的後續研究方嚮提供啓發。  通過對以上八個章節的詳盡闡述,本書旨在為讀者打造一個全麵、深入且極具實戰指導意義的數據科學知識體係。