都说这年头不会点机器学习不好意思出门,但高深的数学理论,复杂的算法又让很多人忘而却步,不知从何下手,《机器学习篇》绕过理论障碍,打通了一条由浅入深的机器学习之路。
丰富的实战案例讲解,介绍如何将机器学习技术运用到股票量化交易、图片渲染、图片识别等领域。
机器学习需要一条脱离过高理论门槛的入门之路。本书《机器学习篇》从小红帽采蘑菇的故事开篇,介绍了基础的机器学习分类模型的训练(第1章)。如何评估、调试模型?如何合理地发掘事物的特征?如何利用几个模型共同发挥作用?后续章节一步一步讲述了如何优化模型,更好地完成分类预测任务(第2章),并且初步尝试将这些技术运用到金融股票交易中(第3章)。自然界*好的非线性模型莫过于人类的大脑。《深度学习篇》从介绍并对比一些常见的深度学习框架开始(第4章),讲解了DNN模型的直观原理,尝试给出一些简单的生物学解释,完成简单的图片识别任务(第5章)。后续章节在此基础上,完成更为复杂的图片识别CNN模型(第6章)。接着,本书展示了使用Caffe完成一个完整的图片识别项目,从准备数据集,到完成识别任务(第7章)。后面简单描述了RNN模型(第8章),接着展示了一个将深度学习技术落地到图片处理领域的项目(第9章)。
阿布:多年互联网金融技术从业经验,曾就职于奇虎360、百度互联网证券、百度金融等互联网型金融公司,现自由职业,个人量化交易者,擅长个人中小资金量化交易领域系统开发,以及为中小型量化私募资金提供技术解决方案、技术支持、量化培训等工作。
胥嘉幸:北京大学硕士,先后就职于百度金融证券、百度糯米搜索部门。多年致力于大数据机器学习方面的研究,有深厚的数学功底和理论支撑。在将机器学习技术融于传统金融量化领域方面颇有研究。
第一篇 机器学习篇
第1 章 初识机器学习 .................................................................................... 2
1.1 机器学习——赋予机器“学习”的灵魂 ..................................................................... 2
1.1.1 小红帽识别毒蘑菇 ................................................................................................................... 2
1.1.2 三种机器学习问题 ................................................................................................................... 6
1.1.3 常用符号 .................................................................................................................................. 6
1.1.4 回顾 .......................................................................................................................................... 7
1.2 KNN——相似的邻居请投票 ........................................................................................ 7
1.2.1 模型原理 .................................................................................................................................. 7
1.2.2 鸢尾花卉数据集(IRIS) ....................................................................................................... 9
1.2.3 训练模型 .................................................................................................................................. 9
1.2.4 评估模型 ................................................................................................................................ 12
1.2.5 关于KNN ............................................................................................................................... 14
1.2.6 运用KNN 模型 ...................................................................................................................... 15
1.2.7 回顾 ........................................................................................................................................ 16
1.3 逻辑分类I:线性分类模型 ........................................................................................ 16
1.3.1 参数化的模型 ........................................................................................................................ 16
1.3.2 逻辑分类:预测..................................................................................................................... 18
1.3.3 逻辑分类:评估..................................................................................................................... 22
1.3.4 逻辑分类:训练..................................................................................................................... 23
1.3.5 回顾 ........................................................................................................................................ 24
1.4 逻辑分类II:线性分类模型 ....................................................................................... 24
1.4.1 寻找模型的权重..................................................................................................................... 24
VI ∣ 机器学习之路——Caffe、Keras、scikit-learn 实战
1.4.2 去均值和归一化..................................................................................................................... 31
1.4.3 实现 ........................................................................................................................................ 33
1.4.4 回顾 ........................................................................................................................................ 34
第2 章 机器学习进阶 .................................................................................. 35
2.1 特征工程 ...................................................................................................................... 35
2.1.1 泰坦尼克号生存预测 ............................................................................................................. 35
2.1.2 两类特征 ................................................................................................................................ 38
2.1.3 构造非线性特征..................................................................................................................... 41
2.1.4 回顾 .................................................................................
前言
越来越多的人期待能挤进机器学习这一行业,这些人往往有一些编程和自学能力,但数学等基础理论能力不足。对于这些人群,从头开始学习概率统计等基础学科是痛苦的,如果直接上手使用机器学习工具往往又感到理解不足,缺少点什么。本书就是面向这一人群,避过数学推导等复杂的理论推衍,介绍模型背后的一些简单直观的理解,以及如何上手使用。本书希望能够得到这些人的喜爱。
本书包含两部分:机器学习篇和深度学习篇。
机器学习篇(1~3 章)主要从零开始,介绍什么是数据特征,什么是机器学习模型,如何训练模型、调试模型,以及如何评估模型的成绩。通过一些简单的任务例子,讲解在使用模型时如何分析并处理任务数据的特征,如何组合多个模型共同完成任务,并在第3章初步尝试将机器学习技术运用到股票交易中,重复熟悉这些技术的同时,感受机器学习技术在落地到专业领域时常犯的错误。
深度学习篇(4~9 章)则主要介绍了一些很基础的深度学习模型,如DNN、CNN等,简单涵盖了一些RNN 的概念描述。我们更关注模型的直观原理和背后的生物学设计理念,希望读者能够带着这些理解,直接上手应用深度学习框架。说一点关于阅读本书的建议。本书在编写时不关注模型技术的数学推导及严谨表述,转而关注其背后的直观原理理解。建议读者以互动执行代码的方式学习,所有示例使用IPython Notebook 编写。读者可在Git 上找到对应章节的内容,一步一步运行书中讲解的知识点,直观感受每一步的执行效果。具体代码下载地址:https://github.com/bbfamily/abu。
本书适合有Python 编程能力的读者。如果读者有简单的数学基础,了解概率、矩阵则更佳。使用过Numpy、pandas 等数据处理工具的读者读起来也会更轻松,但这些都不是必需的。如果读者缺乏Python 编程能力,或者希望进一步获得Numpy、pandas 等工具使用相关的知识,可以关注公众号:abu_quant,获得一些技术资料及文章。
感谢出版社提供机会让我们编写本书,感谢编辑不辞辛苦地和我沟通排版等细节问题。
本书的完成同样需要感谢我们的几位朋友:吴汶(老虎美股)、刘兆丹(百度金融),感谢你们在本书编写作过程中提供的有力支持。感谢本书的试读人员:蔡志威、李寅龙。
从读者的角度来看,一本好的实战书必须能够建立起读者的信心,让他敢于动手,不怕出错。我关注的重点在于,这本书在代码的“可复现性”上做得有多到位。这不仅仅是代码能跑起来那么简单,而是指环境依赖的清晰罗列、数据集获取的便捷指引,以及最关键的——关键步骤的“预期输出”的展示。如果书中每一段核心代码后,都能附上读者应该看到的结果截图或数据状态描述,那么它就成功地为读者搭建了一个参照系,让我们在调试过程中能快速定位问题所在。我特别希望作者能在深入探讨这些主流框架的同时,也能引入一些新兴的、但已被广泛认可的最佳实践。比如,如何有效地进行模型版本控制,如何利用TensorBoard等可视化工具来深入剖析训练过程中的梯度消失或爆炸问题,这些都是书本知识向职业技能跨越的关键点。这本书的出现,似乎正是瞄准了弥补理论与工程实践之间那道鸿沟的绝佳尝试。
评分拿到书后的第一感受是那种沉甸甸的踏实感,纸张的质感相当不错,阅读体验很舒适,这对一本需要反复翻阅和对照代码的书来说至关重要。我翻开目录,立刻被其结构吸引住了。它似乎没有采取传统的“先理论后实践”的线性叙事方式,而是更倾向于“带着问题去学习”的驱动模式。每一个章节的标题都透露着一种“我们马上要解决一个具体难题”的信号,而不是晦涩的数学概念堆砌。例如,如果某一章聚焦于图像分类,我预感它会直接带我们进入如何配置环境、如何加载数据、如何选择网络结构,而不是先花大篇幅解释卷积的数学原理。这种以结果为导向的编排,对于我这种有着一定编程基础,但对算法细节感到头疼的实践者来说,简直是福音。我迫不及待地想知道,作者是如何巧妙地将Caffe那相对复杂的配置流程,通过Keras的高级封装进行平滑过渡的,并最终用scikit-learn的简洁接口来对比验证结果的。这种多框架并举的视角,无疑能帮助读者构建更全面、更灵活的技术栈认知地图。
评分这本书的封面设计,初看之下,就散发出一种既专业又接地气的气息。那深邃的蓝色背景,仿佛寓意着数据世界的广袤与未知,而那清晰的字体排版,又让人感到条理分明,心中涌起一股“原来如此”的明晰感。我尤其欣赏它在视觉上传达出的那种务实精神,没有太多花哨的装饰,一切都指向核心——实战。这不像那些堆砌理论的教科书,读起来像在啃坚硬的石头,这本书更像是为你准备好了一套精良的工具箱,每一个工具都标明了用途和用法。光是看到“Caffe、Keras、scikit-learn”这几个并列的词组,我就知道作者不是在泛泛而谈,而是直指当下工业界和研究领域最主流、最实用的三大阵营。这种平衡感把握得极好,它让你既能窥见深度学习的尖端应用(Caffe的工业级性能),又能享受到快速原型开发的便捷(Keras的优雅抽象),同时还能顾及到传统机器学习的扎实基础(scikit-learn的普适性)。这种广度与深度兼备的布局,让我对后续的学习内容充满了期待,它承诺的不是象牙塔里的理论推演,而是能够立即投入战斗的实战经验。
评分我对这本书的价值判断,很大程度上建立在它所覆盖的工具链的互补性上。Caffe代表着对效率和底层优化的追求,很多时候,当你需要榨干GPU的每一分性能时,它是不二之选;而Keras,则代表了易用性和快速迭代的哲学,它让我们可以像搭乐高积木一样构建复杂的网络。scikit-learn则像是一个万金油,处理特征工程、模型选择和传统算法时,它的简洁高效无人能及。这本书如果能清晰地阐述何时应该使用哪一个框架,以及它们之间的数据格式转换和模型迁移的技巧,那么它的实用价值将呈几何级增长。我希望看到的是一种融会贯通的境界,而不是简单地把三个工具的书籍内容拼凑在一起。例如,如何利用scikit-learn强大的交叉验证工具来指导Keras模型的超参数搜索,或者如何用Caffe训练出的高性能模型权重,反过来对scikit-learn中集成的某些组件进行微调,这种工具间的“对话”才是真正的实战智慧的体现。
评分这本书的叙事风格,从前言透露出的语气来看,非常像一位经验丰富的前辈在手把手带新人。它没有采用高高在上的姿态去灌输知识,而是充满了一种鼓励和引导的口吻。我能想象到作者在撰写时,一定在斟酌如何用最少的术语解释最复杂的概念,如何在代码示例中植入关键的“陷阱”提示,以及如何在关键转折点设置“思考题”。这种“亦师亦友”的写作方式,极大地降低了学习曲线的陡峭程度。毕竟,机器学习领域的新手最怕的就是“这个参数是干什么的?为什么选这个激活函数?”这种一问三不知的窘境。我期待书中能有大量的代码片段,并且这些片段不仅仅是孤立的功能展示,而是能够串联成一个完整的项目流程,从数据预处理到模型部署的每一个环节都有清晰的注释和逻辑解释。如果书中能加入一些实际生产环境可能遇到的“脏数据”处理案例,那就更是锦上添花,能让我提前领教到真实世界的复杂性。
评分最近才开始看,发现书已经开胶了,这么贵的书居然这样!!!很不满意
评分物流费超快,4.23读书日买的,很划算
评分作为入门的书籍,值得一看。。。
评分粗略翻了一下 这本书适合有一定基础的读者,
评分质量不错,送货速度超级快,文字清晰。
评分书太薄了,完全就是为了蹭热点赚钱,内容简陋粗糙,编辑也不用心,向量的括号真是醉了
评分不是很推荐这本书,里面有些代码看的我一头雾水有些前后根本对不上号,后来干脆去看了官方的tutorials,发现书里面里面的就是把官方文档代码拿来改改
评分特别实用的书,物流也很给力,赞
评分大数据在学习ing,机器学习的东西不错
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有