内容简介
     《科学计量大数据及其应用》把握当今信息时代数字化、互联网、大数据三大技术特征,着眼于当代科学活动及科学文本的大数据引领科学计量学深刻变革的理念,从理论基础和应用两个方面介绍科学计量大数据的新进展。
  理论基础部分,从科学计量的大数据基础的角度,论述了数字出版、互联网与科学计量数据,面向科学-计量的数据体系,科学论文的使用数据和论文使用数据的开放获取优势;应用部分,分别探讨了科学家的工作时间表,科学论文在社交网络中的传播机制,实时追索论文使用数据呈现的研究热点与研究前沿,以及基于使用、引用等多重指标的单篇论文评价、体系。
  《科学计量大数据及其应用》可供科学计量学、图书馆学、情报学领域的工作者和研究者,以及从事科技评价、科技管理的工作者阅读参考。     
作者简介
     王贤文,大连理工大学副教授、博士生导师,主要从事科学计量、科技政策与管理研究,担任英文国际期刊Frontiers in Research Metrics and Analytics副主编,以及JAS/ST、Scientometrics、Research Evaluation等SSCI期刊的评审专家。主持课题10余项,其中国家自然,社会科学基金项目3项。在国内外期刊发表学术论文70余篇,其中SSCI论文18篇,CSSCI论文49篇。研究成果曾多次引起Nature关注,被Nature、光明B报、法兰克福汇报、德国广播电台、澳大利亚广播公司、中国科学报等全球数十家主流媒体专文报道,在国内外产生较大影响。     
内页插图
          目录
   序 大数据时代的科学计量学新方向
前言
第1章 数字出版、互联网与科学计量大数据
1.1 科学论文出版:从纸质出版到数字出版
1.2 应运而生的科学计量大数据
1.3 历史上IT技术引领科学计量学的大变革
1.4 新的变革正在科学计量学领域悄然发生
1.5 本章小结
第2章 科学论文的科学计量分析:数据、方法与用途的整合框架
2.1 科学计量学的研究数据体系:四大数据对象
2.2 四大数据对象的比较
2.3 科学计量学研究方法与各数据对象的针对性使用
2.4 本章小结
第3章 科学论文的使用数据
3.1 数字出版、互联网与科学论文使用数据的形成
3.2 使用数据的相关研究
3.3 使用数据的产生机制
3.4 使用数据的获取来源
3.5 本章小结
第4章 科学论文使用数据的开放获取优势
4.1 开放获取运动的洪流
4.2 关于开放获取优势的争论
4.3 研究设计
4.4 基于相关生分析的多重指标抽取
4.5 开放获取论文的优势对比分析
4.6 分学科领域的开放获取优势对比分析
4.7 本章小结
第5章 探索科学家的工作时间表
5.1 基于科学家下载论文的大规模时间数据分析
5.2 各国科学家工作时间表的共性与地区差异
5.3 美国、德国、中国大陆的深入比较分析
5.4 本章小结
第6章 科学论文在社交网络中的传播机制研究
6.1 网络时代科学论文的传播
6.2 科学论文在社交网络中的传播机理
6.3 案例分析
6.4 本章小结
第7章 研究热点与研究前沿的实时挖掘
7.1 科研新趋势的探测
7.2 基于论文的使用数据实时捕捉科学家的研究想法
7.3 理论与方法体系
7.4 基于DIKW体系的计算神经学领域的研究趋势挖掘
7.5 本章小结
第8章 连续、动态和复合的单篇论文评价体系构建研究
8.1 科学论文的学术影响力与社会影响力综合评价
8.2 单篇论文评价的时机已经成熟
8.3 构建单篇论文评价体系的必要性
8.4 单篇论文评价体系的构建与实证研究
8.5 本章小结
参考文献
附录 来自全世界的关注
附录1 Nature——实验室生活:平衡的艺术
附录2 法兰克福汇报——自由时问?科学家有空闲时间吗?
附录3 中国科学报——-个考察科研人员生存状态的独特视角发现
彩图      
前言/序言
     大数据时代的科学计量学新方向
  科学家的一天,似乎与常人不同,但既非不食人间烟火,也无什么惊人之举。后者,迄今科学史上仅有一例,1869年3月1日这一天,俄罗斯化学家门捷列夫(1834-1907)发现了化学元素周期律,史称“伟大发现的一天”。业经手稿、档案的严密考证,确认了门捷列夫一天内编制出完整的元素周期表,同时又查明之前他在写作《化学原理》的过程中对元素分类进行了坚持不懈的探索和尝试①。平时积累,成就一天。正如科学计量学之父普赖斯(Derek John de Solla Price,1922-1983)的一句名言所说:“科学如今清楚地表明,巨大进步集成于各种方式的小步之中。”②当然,一项巨大进步未必集中在一天。
  普赖斯的这句名言再次为最近的一项研究结果所印证。该项研究通过实时追踪世界各地科学家借助互联网每天从数字文档数据库中下载科学论文的大数据分析,获得每天0~24小时论文下载量波动的周期曲线,证实了科学家群体的每一天确非平常,平时熬夜、周末加班系工作常态。这项研究以“探索科学家的工作时间表”为题在国际期刊《信息计量学学报》(Journal of Informetrics)公开发表后,引起强烈反响,国内外媒体纷纷加以转发、报道或评论。
  现在,作者王贤文博士在《科学计量大数据及其应用》这部专著中,披露了那篇论文的机缘、由来与传播盛况。这项有趣的研究,不独直观地展现出科学家夜以继日探赜索隐的不倦努力,并暗示科研成果源于“积小步,成大步”所铸就,而且初露当今数字化、互联网、大数据时代的科学计量学新方向。
  正是取代纸质出版物的数字文档,才使得科学论文可以被不断下载而不会像纸质论文那样被不断消耗,我们也才有了计量和分析的新对象;正是有了遍及全球的互联网,才使得宏大的数字文档数据库吸引遍布世界各地的科学家前来搜索、浏览和下载所需的论著,我们也才有了监测和追踪科学家网上活动的有效手段。显而易见,仅仅监测和记录论文下载的少量数据,不足以显现科学家下载论文的世界空间分布特征与时间分布周期规律,因此这是一项需要大数据且能够产生大数据的计量研究。
  在这本著作中,作者敏锐地把握住当今信息时代数字化、互联网、大数据三大技术特征,着眼于当代科学活动及科学文本的大数据引领科学计量学深刻变革的理念,将全书分为两大部分。第一部分为科学计量的大数据基础,分四章先后论述了数字出版、互联网与科学计量大数据,面向科学计量的数据体系,科学论文的使用数据和论文使用数据的开放获取优势;第二部分为论文大数据在科学计量中的应用,分四章分别探讨科学家的工作时间表,科学论文在社交网络中的传播机制,实时追索论文使用数据呈现的研究热点与研究前沿,以及基于使用、引用等多重指标的单篇论文评价体系。    
				
 
				
				
					现代社会中的数据驱动决策与创新:基于信息科学与管理科学的跨学科前沿探索  图书名称:《现代社会中的数据驱动决策与创新:基于信息科学与管理科学的跨学科前沿探索》  内容简介  在信息爆炸的时代背景下,如何有效地从海量、异构的数据中提取洞察力,并将其转化为实际的决策支持和创新动力,已成为驱动现代社会进步的核心议题。本书旨在深入剖析信息科学与管理科学交叉融合的前沿领域,聚焦于数据驱动的决策制定过程、复杂系统分析以及新兴技术在组织管理中的应用,为研究人员、政策制定者和企业管理者提供一套系统而深刻的理论框架与实践指南。  本书并非简单地罗列技术工具,而是立足于信息哲学基础,探讨数据、信息、知识到智慧(DIKW)的转化路径。我们着重探讨了在快速变化的商业环境和公共政策领域中,如何构建稳健的数据治理体系,确保数据质量、合规性与伦理使用。  第一部分:信息时代的理论基石与方法论革新  本部分奠定了全书的理论基础。我们首先回顾了信息论在现代管理学中的演进,讨论了认知负荷理论在信息系统设计中的应用,并引入了复杂性科学的视角来理解组织信息流的动态特性。     数据、知识与智能的哲学辨析: 深入探讨了数据的本体论地位,区分了“大数据”的描述性特质与“高价值信息”的预测性潜力。重点分析了知识发现(KDD)过程中的关键挑战,尤其是在处理非结构化文本和时间序列数据时,如何避免“数据沼泽”陷阱。    跨学科分析框架的构建: 提出了一个整合了系统动力学、决策树分析和贝叶斯推理的混合模型框架,用于模拟和预测社会经济系统的长期行为。此框架特别强调了对不确定性的量化处理,这在面临突发事件(如供应链中断或市场剧烈波动)时尤为关键。    信息过载与决策效率的悖论: 研究了信息冗余如何损害人类的认知处理能力。探讨了信息可视化设计原则,特别是如何通过精炼的图形化界面,将复杂的分析结果以最直观的方式呈现给高层决策者,从而缩短“洞察到行动”的延迟。  第二部分:面向组织的深度分析技术与模型  本部分聚焦于具体的数据分析技术,并将其转化为可操作的管理工具,特别关注那些超越传统统计范畴的先进方法。     高级文本挖掘与情感分析在市场情报中的应用: 详细阐述了基于Transformer架构的自然语言处理(NLP)模型如何从社交媒体、客户反馈和行业报告中实时提取细粒度的市场情绪、竞争对手战略意图以及新兴技术趋势。内容涵盖了主题建模(如LDA和NMF)的高级变体,以及如何校准模型以应对特定行业术语的歧义性。    复杂网络分析在供应链与组织结构优化中的作用: 运用图论和网络科学的原理,分析了企业内部沟通网络、外部合作关系以及全球供应链的韧性。探讨了如何通过识别网络中的“关键节点”和“信息瓶颈”,设计更具弹性的组织架构和物流路径,以最小化风险敞口。    因果推断的实践: 区别于传统的相关性分析,本章重点介绍了反事实分析(Counterfactual Analysis)和结构方程模型(SEM)在评估管理干预措施(如新的激励机制或技术投资)的真实因果效应中的应用。这对于量化投资回报率(ROI)至关重要。  第三部分:数据驱动的创新管理与未来展望  本部分将视角投向宏观层面,探讨数据和信息流如何驱动组织边界的突破、流程的再造以及可持续发展目标的实现。     流程挖掘(Process Mining)与业务流程再造(BPR): 利用事件日志数据,精确地映射现实世界中的业务流程,识别隐藏的瓶颈、非标准操作(Shadow IT)和合规性漏洞。本书提供了一套将流程模型转化为可执行的优化建议的实用流程。    数据伦理、隐私保护与可信赖人工智能(Trustworthy AI): 在数据驱动的决策日益依赖自动化系统的背景下,本章深入讨论了偏见传播(Bias Propagation)、模型可解释性(XAI)和数据主权问题。探讨了如差分隐私(Differential Privacy)等技术在保障数据效用的同时,如何满足日益严格的全球数据保护法规(如GDPR的精神要求)。    数据生态系统与平台战略: 研究了现代组织如何通过构建数据共享生态系统来增强竞争优势。这包括如何设计激励机制以吸引外部数据提供者,以及如何通过API和数据产品化策略,将内部数据资产转化为外部可交易的价值流。  本书的结构设计强调理论深度与工程实践的紧密结合,通过丰富的案例研究(涵盖金融服务、智慧城市规划和高科技制造等领域),向读者展示如何系统地将信息科学的工具箱应用于解决管理科学中的棘手难题,从而真正实现数据驱动的、面向未来的创新管理。本书适合于高级管理人员、数据科学家、信息系统专业人员以及对信息管理领域有深入研究兴趣的学者阅读。