量化投资: 以Python 为工具+零起点Python大数据与量化交易+机器学习快速入门
9787121311413 9787121305146 9787121306594
零起点Python大数据与量化交易
本书是国内较早关于Python大数据与量化交易的原创书籍,配合zwPython、zwQuant开源量化软件学习,已经是一套完整的大数据分析、量化交易学习教材,可直接用于实盘交易。本书特色:一是,以实盘个案分析为主,全程配有Python代码;第二,包含大量的图文案例和Python源码,无须专业编程基础,懂Excel即可开始学习;第三,配有专业的zwPython、zwQuant量化软件和zwDat数据包。本书内容源自笔者的原版教学课件,虽然限于篇幅和载体,省略了视频和部分环节,但核心内容都有保留,配套的近百套Python教学程序没有进行任何删减。考虑到广大入门读者的需求,笔者在各个核心函数环节增添了函数流程图。
第1章 从故事开始学量化 11.1 亿万富翁的“神奇公式” 21.1.1 案例1-1:亿万富翁的“神奇公式” 21.1.2 案例分析:Python图表 51.1.3 matplotlib绘图模块库 71.1.4 案例分析:style绘图风格 101.1.5 案例分析:colormap颜色表 121.1.6 案例分析:颜色表关键词 141.1.7 深入浅出 171.2 股市“一月效应” 181.2.1 案例1-2:股市“一月效应” 181.2.2 案例分析:“一月效应”计算 191.2.3 案例分析:“一月效应”图表分析 241.2.4 案例分析:颜色表效果图 261.2.5 “一月效应”全文注解版Python源码 271.2.6 大数据?宏分析 341.3 量化交易流程与概念 361.3.1 数据分析I2O流程 361.3.2 量化交易不是高频交易、自动交易 371.3.3 小资、小白、韭菜 381.3.4 专业与业余 381.4 用户运行环境配置 421.4.1 程序目录结构 431.4.2 金融股票数据包 441.5 Python实战操作技巧 461.5.1 模块检测 461.5.2 Spyder编辑器界面设置 471.5.3 代码配色技巧 481.5.4 图像显示配置 501.5.5 Python2、Python 3双版本双开模式 511.5.6 单版本双开、多开模式 521.5.7 实战胜于一切 541.6 量化、中医与西医 54第2章 常用量化技术指标与框架 56
2.1 案例2-1:SMA均线策略 56
2.1.1 案例要点与事件编程 58
2.1.2 量化程序结构 61
2.1.3 main程序主入口 61
2.1.4 KISS法则 63
2.2 Python量化系统框架 64
2.2.1 量化行业关键词 64
2.2.2 国外主流Python量化网站 65
2.2.3 我国主流Python量化网站 67
2.2.4 主流Python量化框架 70
2.3 常用量化软件包 78
2.3.1 常用量化软件包简介 79
2.3.2 案例2-2:模块库列表 80
2.4 常用量化技术指标 82
2.4.1 TA-Lib金融软件包 83
2.4.2 案例2-3:MA均线函数调用 84
2.4.3 TA-Lib函数调用 86
2.4.4 量化分析常用指标 88
2.5 **量化策略 90
2.5.1 阿尔法(Alpha)策略 90
2.5.2 Beta策略 92
2.5.3 海龟交易法则 93
2.5.4 ETF套利策略 95
2.6 常用量化策略 95
2.6.1 动量交易策略 96
2.6.2 均值回归策略 97
2.6.3 其他常用量化策略 98
2.7 起点与终点 100
第3章 金融数据采集整理 101
3.1 常用数据源API与模块库 102
3.1.1 大数据综合API 102
3.1.2 专业财经数据API 103
3.1.3 专业数据模块库 104
3.2 案例3-1:zwDatX数据类 104
3.3 美股数据源模块库 108
3.4 开源文档库Read the Docs 109
3.5 案例3-2:下载美股数据 110
3.6 财经数据源模块库TuShare 113
3.6.1 沪深股票列表 115
3.6.2 案例3-3:下载股票代码数据 116
3.6.3 CSV文件处理 119
3.7 历史数据 121
3.7.1 历史行情 121
3.7.2 案例3-4:下载近期股票数据 124
3.7.3 历史复权数据 130
3.7.4 案例3-5:下载历史复权数据 131
3.8 其他交易数据 134
3.9 zwDat超大股票数据源与数据更新 143
3.9.1 案例3-6:A股基本概况数据下载 144
3.9.2 案例3-7:A股交易数据下载 146
3.9.3 案例3-8:A股指数行情数据下载 150
3.9.4 案例3-9:美股交易数据下载 151
3.10 数据归一化处理 153
3.10.1 中美股票数据格式差异 153
3.10.2 案例3-10:数据格式转化 154
3.10.3 案例3-11:A股策略PAT实盘分析 156
3.10.4 案例3-12:数据归一化 158
3.11 为有源头活水来 160
第4章 PAT案例汇编 162
4.1 投资组合与回报率 163
4.1.1 案例4-1:下载多组美股数据 163
4.1.2 案例4-2:投资组合收益计算 165
4.2 SMA均线策略 168
4.2.1 SMA简单移动平均线 168
4.2.2 案例4-3:原版SMA均线策略 169
4.2.3 案例4-4:增强版SMA均线策略 173
4.2.4 案例4-5:A股版SMA均线策略 174
4.3 均线交叉策略 175
4.3.1 案例4-6:均线交叉策略 176
4.3.2 案例4-7:A股版均线交叉策略 178
4.4 VWAP动量策略 181
4.4.1 案例4-8:VWAP动量策略 182
4.4.2 案例4-9:A股版VWAP动量策略 183
4.5 布林带策略 183
4.5.1 案例4-10:布林带策略 185
4.5.2 案例4-11:A股版布林带策略 186
4.6 RSI2策略 188
4.6.1 案例4-12:RSI2策略 190
4.6.2 案例4-13:A股版RSI2策略 190
4.7 案例与传承 194..........
量化投资:以Python为工具
本书主要讲解量化投资的思想和策略,并借助Python 语言进行实战。本书一共分为5 部分,第1 部分是Python 入门,第2 部分是统计学基础,第3 部分是金融理论、投资组合与量化选股,第4 部分是时间序列简介与配对交易,第5 部分是技术指标与量化投资。本书首先对Python 编程语言进行介绍,通过学习,读者可以迅速掌握用Python 语言处理数据的方法,并灵活运用Python 解决实际金融问题;其次,向读者介绍量化投资的理论知识,主要讲解量化投资所需的数量基础和类型等方面;*后讲述如何在Python 语言中构建量化投资策略。
第1 部分Python 入门 1
第1 章Python 简介与安装使用 2
1.1 Python 概述 2
1.2 Python 的安装3
1.2.1 下载安装Python 执行文件3
1.2.2 下载安装Anaconda 4
1.2.3 多种Python 版本并存6
1.3 Python 的简单使用7
1.4 交互对话环境IPython 8
1.4.1 IPython 的安装8
1.4.2 IPython 的使用9
1.4.3 IPython 功能介绍10
第2 章Python 代码的编写与执行 14
2.1 创建Python 脚本文件15
2.1.1 记事本15
2.1.2 Python 默认的IDLE 环境15
2.1.3 专门的程序编辑器15
2.2 执行.py 文件 17
2.2.1 IDLE 环境自动执行17
2.2.2 在控制台cmd 中执行18
2.2.3 在AnnacondaPrompt 中执行19
2.3 Python 编程小技巧20
2.3.1 Python 行20
2.3.2 Python 缩进21
第3 章Python 对象类型初探 23
3.1 Python 对象 23
3.2 变量命名规则24
3.3 数值类型 25
3.3.1 整数 25
3.3.2 浮点数26
3.3.3 布尔类型26
3.3.4 复数 27
3.4 字符串 28
3.5 列表 29
3.6 可变与不可变30
3.7 元组 32
3.8 字典 33
3.9 集合 33
第4 章Python 集成开发环境:Spyder 介绍 36
4.1 代码编辑器 37
4.2 代码执行Console 39
4.3 变量查看与编辑40
4.4 当前工作路径与文件管理41
4.5 帮助文档与在线帮助42
4.6 其他功能 43
第5 章Python 运算符与使用 44
5.1 常用运算符 44
5.1.1 算术运算符45
5.1.2 赋值运算符46
5.1.3 比较运算符47
5.1.4 逻辑运算符48
5.1.5 身份运算符49
5.1.6 成员运算符51
5.1.7 运算符的优先级52
5.2 具有运算功能的内置函数52
第6 章Python 常用语句 55
6.1 赋值语句 55
6.1.1 赋值含义与简单赋值55
6.1.2 多重赋值57
6.1.3 多元赋值58
6.1.4 增强赋值58
6.2 条件语句 59
6.3 循环语句 60
6.3.1 for 循环60
6.3.2 while 循环61
6.3.3 嵌套循环62
6.3.4 break、continue 等语句62
第7 章函数 66
7.1 函数的定义与调用66
7.2 函数的参数 68
7.3 匿名函数 71
7.4 作用域 72
第8 章面向对象75
8.1 类 75
8.2 封装 77
8.3 继承(Inheritance) 79
第9 章Python 标准库与数据操作 82
9.1 模块、包和库82
9.1.1 模块 82
9.1.2 包 84
9.1.3 库 85
9.2 Python 标准库介绍85
9.3 Python 内置数据类型与操作91
9.3.1 序列类型数据操作91
9.3.1.1list 类型与操作91
9.3.1.2tuple 类型与操作95
9.3.1.3range 类型与操作97
9.3.1.4字符串操作98
9.3.2 字典类型操作103
9.3.3 集合操作106 ..............
零起点Python机器学习快速入门
本书采用独创的黑箱模式,MBA案例教学机制,结合一线实战案例,介绍Sklearn人工智能模块库和常用的机器学习算法。书中配备大量图表说明,没有枯燥的数学公式,普通读者,只要懂Word、Excel,就能够轻松阅读全书,并学习使用书中的知识,分析大数据。本书具有以下特色:独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。首次系统化融合Sklearn人工智能软件和Pandas数据分析软件,不用再直接使用复杂的Numpy数学矩阵模块。系统化的Sklearn函数和API中文文档,可作为案头工具书随时查阅。基于Sklearn Pandas模式,无须任何理论基础,全程采用MBA案例模式,懂Excel就可看懂。
第 1 章 从阿尔法狗开始说起1
1.1 阿尔法狗的前世今生.......1
1.2 机器学习是什么.....2
1.3 机器学习大史记.....3
1.4 机器学习**案例......... 11
第 2 章 开发环境......13
2.1 数据分析, Python.....13
2.2 用户运行平台.......18
2.3 程序目录结构.......19
2.4 Spyder 编辑器界面设置.20
2.5 Python 命令行模式.........26
2.6 Notebook 模式......27
2.7 模块库控制面板...29
2.8 使用 pip 更新模块库......33
第 3 章 Python 入门案例....39
3.1 案例 3-1:,次编程“hello,ziwang” ....39
3.2 案例 3-2:增强版“hello,zwiang” ..42
3.3 案例 3-3:列举系统模块库清单.......44
3.4 案例 3-4:常用绘图风格.........45
3.5 案例 3-5:Pandas 常用绘图风格.......47
3.6 案例 3-6:常用颜色表 cors.....49
3.7 案例源码.....50
第 4 章 Python 基本语法....58
4.1 数据类型.....58
案例 4-1:基本运算.......59
4.2 字符串.........61
案例 4-2:字符串入门...61
案例 4-3:字符串常用方法.....63
4.3 List 列表......64
案例 4-4:列表操作.......65
4.4 Tuple 元组...66
案例 4-5:元组操作.......67
4.5 Dictionary 字典.....68
案例 4-6:字典操作.......68
4.6 数据类型转换.......70
案例 4-7:控制语句.......71
案例 4-8:函数定义.......73
4.7 案例源码.....75
第 5 章 Python 人工智能入门与实践......85
5.1 从忘却开始.85
5.2 Iris **爱丽丝.....89
案例 5-1:Iris 爱丽丝 ....90
案例 5-2:爱丽丝进化与文本矢量化.........92
5.3 AI 操作流程95
5.4 数据切割函数.......98
案例 5-3:Iris 爱丽丝分解 ......99
案例 5-4:线性回归算法.......103
5.5 案例源码...109
第 6 章 机器学习**算法案例(上) . 116
6.1 线性回归... 116
6.2 逻辑回归算法.....124
案例 6-1:逻辑回归算法.......125
6.3 朴素贝叶斯算法.127
案例 6-2:贝叶斯算法.129
6.4 KNN 近邻算法 ...130
案例 6-3:KNN 近邻算法.....133
6.5 随机森林算法.....135
案例 6-4:随机森林算法.......139
6.6 案例源码...140
第 7 章 机器学习**算法案例(下) .149
7.1 决策树算法.........149
案例 7-1:决策树算法.151
7.2 GBDT 迭代决策树算法.........153
案例 7-2:GBDT 迭代决策树算法.154
7.3 SVM 向量机 .......156
案例 7-3:SVM 向量机算法.157
7.4 SVM-cross 向量机交叉算法..159
案例 7-4:SVM-cross 向量机交叉算法....160
7.5 神经网络算法.....161
案例 7-5:MLP 神经网络算法........165
案例 7-6:MLP_reg 神经网络回归算法...168
7.6 案例源码...170
第 8 章 机器学习组合算法 .........183
8.1 CCPP 数据集......183
案例 8-1:CCPP 数据集........184
案例 8-2:CCPP 数据切割....186
案例 8-3:读取 CCPP 数据集.........189
8.2 机器学习统一接口函数.........192
案例 8-4:机器学习统一接口.........193
案例 8-5:批量调用机器学习算法.201
案例 8-6:一体化调用.205
8.3 模型预制与保存.208
案例 8-7:储存算法模型.......210
案例 8-8:批量储存算法模型.........213
案例 8-9:批量加载算法模型.........215
案例 8-10:机器学习组合算法.......219
8.4 案例源码...224
附录 A Sklearn 常用模块和函数.242
探索数据驱动的投资未来:量化交易与机器学习实战指南 在信息爆炸的时代,金融市场的复杂性与日俱增,传统的投资分析方法已难以满足快速变化的交易需求。如何从海量数据中提炼价值,建立科学、高效的投资决策体系,成为每一位有志于在金融市场取得成功的投资者所面临的核心挑战。本书系,集结了量化投资的精髓、零基础Python大数据处理的实践技巧,以及机器学习在金融领域的前沿应用,旨在为广大读者,无论您是初涉金融领域的学生、希望转型提升的交易员,还是追求技术革新的基金经理,提供一套系统、实用、可落地的学习路径。 第一卷:量化投资的基石——从理论到实践的系统梳理 量化投资,并非神秘的黑箱操作,而是建立在严谨的数学模型和统计分析基础上的科学投资方法。本书将带您深入理解量化投资的核心理念,从其发展历程、基本原理,到各类量化策略的构建思路,一一为您揭示。 量化投资的逻辑与哲学: 我们将探讨量化投资的核心逻辑,即通过可量化的指标和模型来捕捉市场异象、识别投资机会。您将了解到,量化投资并非取代人类智慧,而是以一种更客观、更系统的方式辅助决策,从而规避情绪干扰,提升投资效率。我们将深入分析量化投资的优势,例如纪律性、可回测性、风险可控性等,并探讨其在不同市场环境下的适用性。 基础的金融数学与统计学: 量化投资离不开扎实的数理基础。本书将以清晰易懂的方式,回顾和讲解在量化投资中至关重要的金融数学和统计学概念。这包括概率论、数理统计、线性代数、时间序列分析等。我们将重点讲解如何利用这些工具来理解和分析金融数据,例如收益率的分布、风险度量的指标(如标准差、VaR)、协方差矩阵的意义及其应用,以及如何进行回归分析来识别变量之间的关系。您将学习如何用统计学的方法来检验投资策略的有效性,以及如何理解和应用金融学中的基本模型,如CAPM模型、因子模型等。 数据获取与处理: 金融数据是量化投资的血液。本书将引导您了解不同类型金融数据的来源,如股票价格、交易量、财务报表、宏观经济指标等,并教授您如何有效地获取这些数据。我们将重点介绍数据清洗、缺失值处理、异常值检测、数据标准化与归一化等关键步骤,确保数据的质量,为后续的模型构建打下坚实基础。您将学习如何应对数据中的噪声和偏差,以及如何将不同来源的数据进行整合与对齐。 量化策略的分类与构建: 量化投资策略琳琅满目,本书将为您梳理主流的量化策略类型,例如: 趋势跟踪策略: 基于价格或技术指标的趋势性进行交易。 均值回归策略: 利用价格偏离均值后回归均值的规律进行交易。 套利策略: 寻找市场中的无风险或低风险套利机会。 因子投资策略: 基于公开的因子(如市值、价值、动量、质量等)构建投资组合。 统计套利策略: 利用统计模型捕捉资产间的短期价格偏差。 我们将详细讲解每种策略的逻辑、构建方法、优缺点及适用场景。更重要的是,本书将强调策略构建中的关键要素,如信号生成、头寸管理、止损止盈等,并引导您思考如何根据自身风险偏好和市场环境选择和优化策略。 策略回测与评估: 策略的回测是量化投资实践中不可或缺的一环。本书将深入讲解回测的原理、方法和注意事项。您将学习如何构建有效的回测框架,如何评估策略的表现,例如收益率、夏普比率、最大回撤、Calmar比率等指标的计算与解读。我们将强调回测中的偏差问题,如幸存者偏差、前视偏差、过度拟合等,并指导您如何规避这些陷阱,从而获得更真实、可靠的策略评估结果。 第二卷:零起点Python大数据与量化交易——掌握数据分析的利器 Python以其简洁的语法、丰富的库和强大的社区支持,已成为量化金融领域最受欢迎的编程语言。本书将从零开始,为您系统地介绍Python在数据分析和量化交易中的应用。 Python语言基础与环境搭建: 对于没有编程基础的读者,本书将提供详尽的Python入门指导,包括变量、数据类型、运算符、流程控制、函数等基本概念。同时,您将学习如何安装Python以及常用的开发环境(如Anaconda、Jupyter Notebook),并了解如何管理和使用各种Python库。 NumPy与Pandas:量化数据处理的核心工具: NumPy是Python进行科学计算的基础库,而Pandas则为数据分析提供了强大的数据结构(Series和DataFrame)和数据处理功能。本书将重点讲解如何使用NumPy进行高效的数值计算,以及如何利用Pandas进行数据的读取、清洗、转换、合并、分组聚合等操作。您将学会如何处理时间序列数据,如何进行数据筛选、排序、重塑,以及如何利用Pandas进行数据分析的初步探索。 Matplotlib与Seaborn:数据可视化与洞察: “图表胜过千言万语”。本书将教会您如何使用Matplotlib和Seaborn这两个强大的库来创建各种类型的图表,如折线图、柱状图、散点图、箱线图、热力图等。通过直观的可视化,您可以更清晰地理解数据分布、变量关系、策略表现等,从而发现隐藏的洞察,辅助决策。 金融数据处理与分析实战: 本部分将结合实际金融数据,带领您进行一系列的实战操作。您将学习如何下载和处理股票日线、分钟线数据,如何计算技术指标(如均线、MACD、RSI等),如何进行因子数据处理,以及如何构建简单的时间序列模型。我们将通过具体案例,演示如何用Python实现上述量化投资中的数据处理环节,使您能够亲手操作,加深理解。 量化交易策略的Python实现: 本卷的重头戏在于将量化交易策略转化为可执行的代码。您将学习如何利用Python实现简单的交易策略,包括如何定义交易信号、如何执行买卖操作、如何进行风险管理(如设置止损止盈)、以及如何进行策略的回测。我们将引导您逐步构建一个基本的量化交易回测框架,让您能够将理论上的策略变为实际可运行的程序,并对其进行初步的测试和优化。 第三卷:机器学习快速入门——赋能量化投资的未来 机器学习作为人工智能的核心分支,在量化投资领域展现出强大的潜力,能够帮助我们挖掘更深层次的市场规律,构建更复杂的预测模型。本书将带您快速入门机器学习,并了解其在量化交易中的应用。 机器学习的基本概念与分类: 本卷将以最易理解的方式,介绍机器学习的核心概念,包括监督学习、无监督学习、半监督学习和强化学习。您将理解什么是模型训练、特征工程、模型评估等基本流程。我们将重点解释监督学习中的回归与分类任务,以及无监督学习中的聚类与降维。 常用的机器学习算法: 本书将精选并深入浅出地讲解几种在量化投资中具有代表性的机器学习算法: 线性回归与逻辑回归: 基础的预测与分类模型,理解模型的可解释性。 决策树与随机森林: 直观且强大的集成学习方法,能够处理非线性关系。 支持向量机(SVM): 强大的分类和回归模型,在处理高维数据时表现出色。 K近邻(KNN): 简单的分类与回归算法,易于理解。 K-Means聚类: 无监督学习的代表,用于数据分组。 对于每种算法,我们将详细讲解其工作原理、优缺点、适用场景,以及如何使用Python库(如Scikit-learn)来实现。 特征工程与模型选择: 好的特征是模型成功的基石。本书将重点讲解特征工程的重要性,包括特征提取、特征选择、特征构建等方法。您将学习如何从原始金融数据中提取有意义的特征,如何利用各种技术来提升模型的输入质量。同时,我们将探讨如何根据任务的特点选择合适的模型,以及如何进行模型的超参数调优,以获得最佳性能。 机器学习在量化交易中的应用场景: 本卷将聚焦机器学习在量化投资中的具体应用: 价格预测模型: 利用机器学习算法预测未来价格走势,辅助交易决策。 风险管理: 构建模型识别市场风险,预测极端事件,辅助风险控制。 情绪分析: 分析新闻、社交媒体等文本数据,量化市场情绪,捕捉交易机会。 异常检测: 识别市场中的非正常交易行为或异常价格波动。 因子挖掘: 利用机器学习技术发现新的、具有预测能力的投资因子。 我们将通过实际案例,展示如何运用机器学习模型解决这些量化交易中的实际问题,并强调模型在实际应用中可能遇到的挑战以及应对策略。 模型评估与部署: 机器学习模型的评估远不止精度。本书将深入讲解各种模型评估指标,如准确率、召回率、F1分数、AUC等,并强调在金融场景下,评估指标的选择需要与业务目标紧密结合。最后,我们将初步探讨如何将训练好的模型部署到实际交易系统中,实现自动化交易。 本书系特色: 理论与实践深度结合: 每一卷都兼顾理论的深度讲解与实际操作的演示,确保读者不仅理解“是什么”,更能掌握“怎么做”。 循序渐进,零基础友好: 特别针对Python和机器学习部分,从最基础的概念讲起,即使您是零基础读者,也能轻松上手。 强调实战与应用: 全书贯穿大量的案例和代码示例,帮助读者将所学知识快速应用于实际的量化投资场景。 前沿技术引领: 涵盖了量化投资的经典理论、当前主流的Python数据分析工具,以及最具潜力的机器学习技术,为读者提供面向未来的投资知识体系。 通过学习本书系,您将能够构建起一套完整的、数据驱动的投资分析与交易体系,掌握从数据获取、清洗、分析到策略构建、模型预测、最终落地的全流程技能。无论您是希望在金融市场中找到更科学的投资路径,还是希望利用技术革新提升交易表现,本书系都将是您不可或缺的得力助手。踏上这场数据驱动的投资探索之旅,开启您的量化交易新篇章!