发表于2024-12-05
世界著名计算机教材精选:数据挖掘十大算法 [The Top the Algorithms in Data Mining] pdf epub mobi txt 电子书 下载
《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途影响十种数据挖掘算法,这十种算法是数据挖掘领域的专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。
吴信东(Xindong Wu),教授英国爱丁堡大学人工智能学博士,任美国佛蒙特大学计算机科学系主任。吴教授在数据挖掘、知识系统和Web信息开发等研究领域内颇有建树,在IEEE TKDE、TPAMI、ACMTOIS、DMKD、KAIS、IJCAI、AAAI、ICMI_、KDD、ICDM和WWW等学术会议和期刊上发表了170余篇学术论文,另外,还出版了18部学术专著和会议文集。他还获得了IEEE ICTAI-2005的论文奖和IEEE ICDM-2007的理论/算法论文奖亚军。
吴博士是IEEE Transactzons on KnowLedge and Data Engineering(TKDE,由IEEE Computer Society主办)的主编,IEEE International Con erence on Data Mining (ICDM)的创始人和指导委员会主席,Knowledge and In ormation Systems(KAIS,由Springer发行)的创办人和荣誉主编,IEEE Computer Society Technical Committee on Intelligent Informatics(TCII)的创始主席(2002-2006),Springer Advanced Information and Knowledge Processing (AI& KP)系列著作的编辑。他还是ICDM'03(the 2003 IEEE International Conference on Data Mining)程序委员会主席和KDD-07(the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)程序委员会联合主席。他获得了2004 ACM SIGKDD服务奖、2006 IEEE ICDM杰出服务奖,是2005年合肥科技大学“长江学者奖励计划”讲座教授。他还是很多学术会议的特邀专家/专题报告人,如NSF-NGDM'07、PAKDD-07、IEEE EDOC'06、IEEE ICTAI'04、IEEE/WIClACM WI'04lIAT'04、SEKE 2002和PADD-97等。
Vipin Kumar,教授,明尼苏达大学计算机科学与工程系William Norris讲席教授、系主任。他于1977年获得印度鲁尔基理工学院(正式名称是鲁尔基大学)的电子和通信工程学士学位,1979年获得荷兰埃因霍温飞利浦国际学院的电子工程硕士学位,1982年获得马里兰大学帕克分校的计算机科学博士学位。Kumar教授的研究兴趣主要集中在数据挖掘、生物信息学和高性能计算领域。他提出了评估并行算法可扩展性的恒等效率度量指标,并研发了多款稀疏矩阵分解(PSPASES)和图剖分(METIS,ParMctis, hMetis)的高效并行算法及软件。他发表了200多篇研究论文,合编合著了9本学术专著,包括被广泛使用的教科书Introduction to Parallel Computing和Introduction to Data Mining,者5由Addison-Wesley出版。Kumar是众数据挖掘和多并行计算领域的学术会议、专题研讨会的主席或共同主席,女口IEEE International Con ference on Data Mining(2002)、International Parallel and Distributed Processing Symposium(2001)和SIAM International Con ference on Data Mining(2001).Kumar是SIAM International Conference on Data Mining指导委员会共同主席,IEEE International Conference on Data Mining和IEEE International Conference on Bioinformatics and Biomedicine指导委员会委员。Kumar是Journal of Statistical Analysis and Data Mining的创始主编之——,IEEE Intelligent In ormatics Bulletin主编和Data Mining and Knowledge Discovery系列图书(由CRC Press/Chapman Hall出版)的编辑。Kumar还担任很多其他学术刊物的编辑,如Data Mining and Kno-wledge Discovery、KnowLedge and Information Systems、IEEE Computational Inteltigence Bulletin、Annual Review of Inteltigent In formatics、Parallel Com puting、Journal of Parallel and Distributed Computing、IEEE Transactions of Data and Kno-wledge Engineering(1993-1997)、IEEE Concurrency(1997-2000)和IEEE ParalleL and Distributed Technology(1995-1997)等。他是ACM会士、IEEE会士、AAAS会士和SIAM会员。Kumar由于在并行算法设计、图剖分和数据挖掘领域的杰出贡献,获得了2005 IEEE Computer Society的技术成就奖。
第1章 C4.5
1.1 引言
1.2 算法描述
1.3 算法特性
1.3.1 决策树剪枝
1.3.2 连续型属性
1.3.3 缺失值处理
1.3.4 规则集诱导
1.4 软件实现
1.5 示例
1.5.1 Golf数据集
1.5.2 Soybean数据集
1.6 高级主题
1.6.1 二级存储
1.6.2 斜决策树
1.6.3 特征选择
1.6.4 集成方法
1.6.5 分类规则
1.6.6 模型重述
1.7 习题
参考文献
第2章 k-means
2.1 引言
2.2 算法描述
2.3 可用软件
2.4 示例
2.5 高级主题
2.6 小结
2.7 习题
参考文献
第3章 SVM:支持向量机
3.1 支持向量分类器
3.2 支持向量分类器的软间隔优化
3.3 核技巧
3.4 理论基础
3.5 支持向量回归器
3.6 软件实现
3.7 当前和未来的研究
3.7.1 计算效率
3.7.2 核的选择
3.7.3 泛化分析
3.7.4 结构化支持向量机的学习
3.8 习题
参考文献
第4章 Apriori
4.1 引言
4.2 算法描述
4.2.1 挖掘频繁模式和关联规则
4.2.2 挖掘序列模式
4.2.3 讨论
4.3 软件实现
4.4 示例
4.4.1 可行示例
4.4.2 性能评估
4.5 高级主题
4.5.1 改进Apriori类型的频繁模式挖掘
4.5.2 无候选的频繁模式挖掘
4.5.3 增量式方法
4.5.4 稠密表示:闭合模式和最大模式
4.5.5 量化的关联规则
4.5.6 其他的重要性/兴趣度度量方法
4.5.7 类别关联规则
4.5.8 使用更丰富的形式:序列、树和图
4.6 小结
4.7 习题
参考文献
第5章 EM
5.1 引言
5.2 算法描述
……
第6章 PageRank
第7章 AdaBoost
第8章 kNN!k-最近邻
第9章 Naive Bayes
第10章 CART:分类和回归树
在香港举办的2006年度IEEE数据挖掘国际会议上,与会专家遴选出了十个最具影响力的数据挖掘算法,也就是本书所列的十个算法:C4.5、k-means、SVM、Apriori、EM、PageRank、AdaBoost、kNN、Naive Bayes和CART。
遴选过程第一步,在2006年9月,我们邀请ACM KDD创新奖得主和IEEE ICDM研究贡献奖得主每人推荐十个最著名的数据挖掘算法,并提供以下信息:
(a)算法名称;
(b)算法简介;
(c)代表文献。
我们还要求每个被提名的算法都应被数据挖掘领域的学者广泛引述和使用,每位推荐人提名的算法集应能代表数据挖掘的不同领域。除一人外其他所有专家都给予了回复。
遴选过程第二步,在2006年10月,我们用Google Scholar对每项提名进行了验证,去除了引用数低于50的提名,将保留下的所有提名(共18个)分成十个主题:关联分析、分类、聚类、统计学习、装袋推举、序列模式、集成挖掘、粗糙集、链接挖掘和图挖掘。对于某些算法,如k-means,不要求提供发明该算法的原始文献,但需要提供阐述该算法重要性的近期论文。这些代表性文献。
遴选过程第三步,我们动员了研究社区的很多人参与,其中包括KDD-06 (the 2006 ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)、ICDM'06 (the 2006 IEEE International Conference on Data Mining)和SDM'06 (the 2006 SIAM International Conference on Data Mining)的程序委员会的全体委员,以及ACM KDD创新奖得主和IEEE ICDM研究贡献奖得主。请每位参与人员从18个候选算法中选出不超过10个最知名算法,结果在ICDM'06的“数据挖掘十大算法”专题研讨会上公布。
2006年12月21日,在ICDM'06的一个专题讨论会上,邀请145名与会专家对这18个候选算法公开投票,从中选出十个得票最高的算法,得到和上面遴选第三步完全一致的结果。这个3小时的专题研讨会是ICDM'06的一个环节,在同一地点并行召开的还有Web Intelligence(WI'06)和Intelligent Agent Technology(IAT'06)的共7个论文展示环节,共吸
引到了145名学者参与。
在ICDM'06之后,我们邀请了这十大算法的原创作者和专题研讨会部分发言人共同撰
写了一篇期刊论文对每个算法的内容、影响进行介绍,对其现状和未来趋势加以评述。这篇期刊论文于2008年1月发表在Knowledge and Information Systems上。本书是该期刊论文的扩展,每章介绍一个算法,内容包括算法描述、可用软件、示例应用、高级主题和习题等部分。
本书的每一章都邀请两位独立审稿人和本书的一位编辑来审核,有的章节在此基础上要在最终定稿前再重审一遍。
我们希望这十个算法的遴选能有助于在世界范围推动数据挖掘的应用,激励更多数据挖掘领域的学者去扩大这些算法的影响,探索新的研究内容。这十个算法覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题,也对数据挖掘、机器学习和人工智能等学科的课程设计有指导意义。
专业书籍,要慢慢学习,感觉不错。其实网上也能查到相关算法。书籍更系统,更方便一些。
评分物美价廉 实惠 好用 好评
评分内容很全,基本的都讲到了,电子版的流传也很广,可见书的出名
评分书非常非常的好,质量不错
评分不错,菜鸟的好选择
评分书很好,正在看,应该会很有收获
评分这书就是一篇论文翻译过来的 没啥水平 我写都比他好得多
评分详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。
评分入门书籍,挺好的,快递服务很快
世界著名计算机教材精选:数据挖掘十大算法 [The Top the Algorithms in Data Mining] pdf epub mobi txt 电子书 下载