内容简介
当前生物信息学研究重点是对基因组序列、蛋白质组学和数组技术所产生的大量数据的计算分析。《生物信息学:序列与基因组分析(第2版)/国外生命科学优秀教材》对DNA、RNA和蛋白质数据的计算提供了丰富的演算方法,并指出了在解决生物学问题中这些方法的优缺点及应用策略。
《生物信息学:序列与基因组分析(第2版)/国外生命科学优秀教材》的第1版是在Mount博士讲稿的基础上进行整理出版的,在全球范围内用作教材。第二版对内容进行了全面的修订,由专业教师提供导读,很大程度地适用本科生和研究生教学。
《生物信息学:序列与基因组分析(第2版)/国外生命科学优秀教材》为高等院校生物信息学专业本科生和研究生提供理想的学习材料。同时,《生物信息学:序列与基因组分析(第2版)/国外生命科学优秀教材》也适宜科研人员、信息专家自学使用。
内页插图
目录
CHAPTER 1
历史简介和概论
CHAPTER 2
Collecting and Storing Sequences in the Laboratory
CHAPTER 3
Alignment of Pairs of Sequences
CHAPTER 4
Introduction to Probability and Statistical Analysis of Sequence Alignments
CHAPTER 5
Multiple Sequence Alignment
CHAPTER 6
Sequence Database Searching for Similar Sequences
CHAPTER 7
Phylogenetic Prediction
CHAPTER 8
Prediction of RNA Secondary Structure
CHAPTER 9
Cene Prediction and Regulation
CHAPTER 10
Protein Classification and Structure Prediction
CHAPTER 11
Genome Analysis
CHAPTER 12
Bioinformatics Programming Using Perl and Perl Modules
CHAPTER 13
Analysis of Microarrays
Index
前言/序言
第二版的生物信息学(序列与基因组分析)比第一版的读者更广泛,它不仅面向想学计算和统计方法的生物学家,而且也适用于想学生物学的、尤其是遗传学和基因组学的计算生物学家。章节指南介绍了每一章所需的基本计算学(统计学)和生物学背景,接着是本章要学习内容的提纲,后面提供网络资源(表格和正文中仍会显示相关URL),习题部分用于强化本章概念和相关技术。最后,所有网络资料都均用文字形式表述出来,放在一处。所有原来的章节都经过了相应的更新、修改和重写。
第二版里增加了三章新的内容。原来第三章里的序列比对的概率和统计分析现在单列为第四章,并增添了以序列分析为基础的假设检验和预测准确性检验。第12章和第13章涵盖了原来没有的Perl语言编程和芯片分析。这些比较高级的内容需要读者有一定的专业背景,但可增加各生物信息学最相关内容。增添的内容代表了国际前沿进展,是本书第二版宝贵的补充。在此,我非常感谢Arizona大学的同事们贡献了这些章节的内容。一遍遍修改润色非常耗时、艰苦,可他们总是非常合作,不吝时间。
第12章由Nirav Merchant和Susan Miller提供,他们是经验丰富的计算机系统和软件专家。本章具体叙述了使用和编写Perl脚本和模块满足不同任务,也包含了数据格式和建立关系数据库等内容。这章里列举的许多Perl脚本例子都可以从此书网站上直接下载作为项目模板使用。我们希望第12章可以作为很多实用Perl程序的起点以支持大规模基因组项目。
第13章由统计学家David Henderson博士提供。他擅长QTL分析、试验设计和统计分析,并在芯片试验方面具有丰富的经验。本章旨在帮助生物学家从芯片的基因表达数据中提取重要的信息。通常生物学家不习惯于设计涉及大量数据的试验以及从这些试验中提取信息。芯片试验麻烦的原因有两种:一是表达数据有各种来源的背景噪音,在复杂噪音中寻找哪个基因表达有差异是很困难的事;二是芯片试验的结果往往是一长串混乱的难以分类的基因。我们为解决这两种问题提供思路:一是为去除噪音达到特定科研目标来设计试验提供指导;二是叙述了寻找显著性表达差异基因的方法;三是介绍了相关分析方法,包括基于不同标准寻找、验证不同分类标志(生物标志)的聚类方法。最后提供了实现这些目标的程序资源。基于这些背景知识,第13章旨在指导试验设计使其产出尽可能多的有用信息。
大家对第一版的建设性评论也有益于第二版的改进。第一个是日本的Yasushi Okazaki先生,他在将此书译成日文的同时提了很多建议和修改意见。在不同场合提供帮助的还有John Clark,Gabriel Dorado,Dan Flath,Toni Kusalik和Etsuko Moriyama。
此书离不开我生物信息学的同事Ritu Pandey和Rob Klein的支持以及Arizona大学的经济支持,尤其是Vicki Chandler,Gene Gerner RichHoff。谢谢Walt Klimecki在图11.2提供的帮助和Roger Miesfeld在图9.13A的协助。我也很感激Beck Nickerson给许多章节提出的批评和建议。Pick WeilLau帮助我们校对了图片库,Eric Shen从本书网站上收集整理了意见。
最后,要感谢冷泉港实验室出版社的员工的支持。没有他们的努力此项工作不可能如此成功。Judy Cuddihy改进了章节的格式,对全文做了极其有益的建议,并给予了大量的鼓励、支持使此书能按时完成。Mary Cozza指导我整理了参考书目。
好的,这是一本关于“生物信息学:序列与基因组分析(第2版)”以外的图书简介,内容详尽且旨在避免任何人工智能痕迹的痕迹,字数控制在1500字左右。 --- 书籍简介:复杂系统中的信息动力学与网络建模 副标题:从生物网络到社会计算的跨学科视角 导言:理解复杂性背后的信息流 在现代科学的诸多前沿领域中,理解和量化“复杂性”是核心挑战之一。从生态系统的物种互动、神经元集群的放电模式,到全球供应链的风险传导,再到社交媒体上的信息扩散,我们面对的都是由大量相互关联的元素构成的动态系统。这些系统并非简单元素的堆砌,其整体行为源于元素间的信息交换与交互结构。 本书《复杂系统中的信息动力学与网络建模》正是立足于这一前沿交汇点,它聚焦于如何运用信息论、图论和非线性动力学工具,对这些相互连接的复杂系统进行系统性的建模、分析与预测。本书旨在为研究人员、高级本科生及研究生提供一套坚实的理论框架和实用的计算方法,以揭示复杂系统在不同尺度上信息如何产生、传播、演化并最终塑造系统功能和鲁棒性的内在规律。 第一部分:复杂网络的基础架构与信息拓扑 本书的开篇部分,我们将奠定理解复杂系统的基石——网络科学。但我们关注的重点并非停留在静态的网络结构描述,而是侧重于结构如何决定信息传输的效率与质量。 第一章:网络表示与信息度量 本章系统梳理了描述复杂系统的基本数学工具。我们深入探讨了加权网络、有向图以及多层网络的表示方法。关键在于引入信息论视角下的拓扑度量:例如,基于熵的概念来量化网络中的信息不确定性;使用互信息(Mutual Information)来衡量节点间的功能连接强度,而非仅仅依赖传统的距离或中心性指标。我们将分析不同网络模型(如随机图、小世界网络、无标度网络)在信息熵和信息流压缩方面的差异。 第二章:结构与连通性的信息瓶颈 一个网络如何有效地传输信息,往往受制于其“瓶颈”结构。本章将分析网络中的最大流-最小割定理在信息传输中的应用。我们探讨了信息流在网络中的局部拓扑结构(如高阶连通子图、团簇系数)的影响。重点将放在识别系统中的关键信息枢纽(Hubs)及其对网络鲁棒性的影响,尤其是在信息饱和和拥塞情境下。 第二部分:信息动力学与系统演化 网络结构是“硬件”,而信息动力学则是运行在硬件上的“软件”。本书的第二部分深入探讨了信息在这些结构上如何流动、改变以及驱动系统的整体行为。 第三章:基于代理的(Agent-Based)信息传播模型 我们聚焦于模拟信息(如意见、疾病、谣言或新技术采纳)在网络节点间的传播过程。本章详细介绍并比较了诸如SIR模型(易感-感染-康复)在网络化环境下的扩展形式,以及更复杂的阈值模型(Threshold Models)和基于学习动态的传播模型。我们将分析传播速度、最终的饱和状态,以及“关键意见领袖”(KOLs)在不同网络结构下的有效性。 第四章:非线性动力学与集体行为的涌现 复杂系统的标志性特征是涌现性——系统整体行为无法简单地从个体行为中推导出来。本章将网络动力学与非线性微分方程(或离散映射)相结合。我们将分析振荡、同步现象(如神经元的集群同步或电力系统中的相位锁定)的形成机制。重点考察时滞效应对信息反馈回路稳定性的影响,并引入混沌理论的概念来描述高度敏感的系统状态。 第五章:信息反馈、稳定性和控制 在许多实际系统中,输出信号会反馈到输入端,形成复杂的反馈回路。本章研究如何通过改变网络结构(例如,在特定节点添加或移除连接)或调节信息传输的参数,来控制系统的动态行为,使其趋向于预定的稳定状态或周期性振荡。我们将介绍控制理论在复杂网络系统中的应用,如最小控制集和反馈控制的稳定性分析。 第三部分:跨界应用与前沿挑战 本书的最后一部分将理论框架应用于具体的跨学科领域,并展望未来研究方向。 第六章:生物系统中的信息拓扑 本章探讨信息动力学在生物学中的体现。我们将分析基因调控网络(GRN)的拓扑结构如何保证基因表达的稳健性(即抵抗随机扰动)。此外,我们将讨论神经科学中的连接组(Connectome),及其如何通过特定的信息编码和信息瓶颈来支持高级认知功能。分析重点是生物系统如何通过演化压力,优化其网络结构以实现特定的信息处理效率和抗损性。 第七章:社会计算与信息生态 在社会科学领域,网络模型提供了量化人类互动的强大工具。本章侧重于意见极化和信息茧房的形成机制。通过分析信息共享和冲突解决过程中的网络结构依赖性,我们探讨了如何设计更具韧性的信息传播策略,以促进跨群体理解和协作。这包括对“结构平衡理论”在大型社交网络中的检验。 第八章:前沿挑战与未来方向 本书在总结部分提出了当前研究面临的重大挑战,包括:如何有效地处理高维异构信息(即不同类型信息在同一网络上传播);如何将量子信息的概念融入传统复杂系统分析;以及如何开发更具可解释性的因果推断方法,来区分网络中的相关性与真正的因果驱动力。 结论:超越数据,洞察结构 《复杂系统中的信息动力学与网络建模》致力于搭建一座桥梁,连接纯粹的数学理论与真实的、动态的复杂现象。它强调的不是单个数据点的分析,而是信息在结构中的行为。通过掌握这些工具,读者将能够从根本上理解任何连接系统的鲁棒性、脆弱性、适应性以及其内在的演化驱动力。本书提供的是一种看待世界的全新范式——一个以信息流和相互作用为核心的动力学视角。