生物计算:生物序列的分析方法与应用

生物计算:生物序列的分析方法与应用 pdf epub mobi txt 电子书 下载 2025

杨晶 等 著
图书标签:
  • 生物计算
  • 生物信息学
  • 序列分析
  • 基因组学
  • 算法
  • 数据挖掘
  • 生物统计学
  • Python
  • R语言
  • 计算生物学
想要找书就要到 静流书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030263933
版次:1
商品编码:10005907
包装:精装
丛书名: 数学与现代科学技术丛书2
开本:16开
出版时间:2010-03-01
用纸:胶版纸
页数:361
字数:456000
正文语种:中文

具体描述

内容简介

  《生物计算:生物序列的分析方法与应用》介绍生物计算中的几种主要方法,如序列比对、系统发育分析、蛋白质序列的语义分析与结构预测、基因识别与生物芯片的数据分析等,给出它们的基本问题与有关的方法及应用。全书由三部分组成。一部分介绍这些问题的由来与主要内容,给出它们的基本原理、计算与分析方法及应用意义,同时介绍一些国际上较为通用的软件包。第二部分是生物学备忘录,介绍有关生物学的基础知识。第三部分是数学备忘录,介绍与这些生物计算有关的数学理论与方法。
  《生物计算:生物序列的分析方法与应用》可作为数学、生物、医学、化学等专业的本科生或研究生教材,其中一部分内容可作为各专业的公共部分,而第二、三部分内容可供各专业适当选用。

内页插图

目录

《数学与现代科学技术丛书》序
前言
第一部分 基本方法
第1章 生物序列突变与比对分析
1.1 生物序列突变与比对问题
1.1.1 生物序列的类型与结构
1.1.2 生物序列突变与比对问题的意义与应用
1.1.3 生物序列比对的原理与方法
1.2 二重序列比对的有关算法
1.2.1 关于动态规划算法的一些说明
1.2.2 动态规划算法
1.2.3 统计判决算法的基本思想
1.2.4 BLAST软件的使用
1.3 多重序列的比对问题
1.3.1 MSA的意义与概况
1.3.2 MSA的定义与优化准则
1.4 MSA算法与计算
1.4.1 MSA算法的基本概念
1.4.2 MSA的算法步骤
1.4.3 ClustalW软件的使用
1.4.4 关于MSA的几点说明
1.4.5 几个多重序列比对应用例子
1.5 SPA算法的原理与计算
1.5.1 SPA算法的基本原理
1.5.2 SPA算法的基本步骤
1.5.3 SPA算法源码
1.5.4 SPA算法的有关问题讨论
1.5.5 SPA算法的一个实例计算
习题与思考

第2章 系统发育分析
2.1 分子系统发育分析的基本概念
2.2 基于距离的方法
2.2.1 非加权分组平均法
2.2.2 邻接法
2.3 基于特征的方法
2.4 极大似然和Bayes方法
2.4.1 进化的概率论模型
2.4.2 构建进化树的极大似然方法
2.4.3 构建进化树的Bayes方法
2.5 构建进化树软件简介
习题与思考

第3章 蛋白质一级结构的语义分析
3.1 蛋白质一级结构的信息与统计分析法
3.1.1 蛋白质一级结构的语义分析简介
3.1.2 信息、统计分析法的要素与要点
3.1.3 局部词的定义与判定
3.1.4 蛋白质一级结构的语义分析
3.2 蛋白质序列语义结构的组合分析法
3.2.1 关于组合图论的有关记号
3.2.2 数据库的复杂度
3.2.3 数据库的关键词与核心词
3.2.4 关于组合分析的若干应用问题
习题与思考

第4章 蛋白质结构预测
4.1 蛋白质二级结构预测
4.1.1 蛋白质二级结构预测的评价体系
4.1.2 Chou-Fasman方法
4.1.3 GOR方法
4.1.4 FHD方法
4.2 蛋白质空间结构预测
4.2.1 同源序列搜索
4.2.2 折叠识别方法
4.2.3 从头预测方法
4.3 蛋白质结构预测软件简介
4.3.1 PHD软件使用简介
4.3.2 使用nnpredict.软件预测蛋白质二级结构
4.3.3 PSIPRED软件使用简介
习题与思考

第5章 基因识别
5.1 绪论
5.1.1 原核基因识别
5.1.2 真核基因识别
5.1.3 常用模式基因组简介
5.2 基因序列特征分析
5.2.1 内含子与外显子
5.2.2 CpG岛
5.2.3 密码子使用偏性
5.3 开放阅读框识别
5.3.1 开放阅读框特性
5.3.2 开放阅读框识别原理
5.3.3 开放阅读框识别软件使用
5.4 Markov模型基因识别方法
5.4.1 隐Markov模型
5.4.2 GENSCAN隐Markov模型方法和原理
5.4.3 GENSCAN软件使用
5.4.4 基因识别方法评价
5.5 其他基因识别方法简介
5.5.1 神经网络方法
5.5.2 z曲线方法
习题与思考

第6章 基因表达数据分析
6.1 基因表达序列标签数据分析简介
6.1.1 基因表达序列标签的概念
6.1.2 基因表达序列标签数据的获取
6.1.3 基因表达序列标签数据聚类分析
6.1.4 基因表达序列标签的应用
6.2 基因芯片数据的获取
6.2.1 基本概念
6.2.2 基因芯片实验过程
6.2.3 基因芯片数据获取
6.2.4 基因芯片数据内容
6.3 基因芯片数据分析
6.3.1 基因表达谱芯片数据标准化
6.3.2 基因表达谱芯片数据散点图分析
6.3.3 基因表达差异显著性分析
6.4 基因芯片数据聚类分析
6.4.1 基本概念
6.4.2 特征描述
6.4.3 分层聚类方法
6.4.4 模糊聚类方法
6.5 其他基因芯片数据分析方法简介
6.5.1 支持向量机方法
6.5.2 K均值聚类
6.5.3 自组织映射图聚类
6.6 基因芯片数据分析软件简介
习题与思考

第二部分 生物学备忘录
第7章 核酸与DNA
7.1 细胞与染色体
7.1.1 细胞
7.1.2 染色体概念
7.1.3 染色体特征
7.2 核酸分子与DNA结构
7.2.1 核酸分子
7.2.2 DNA分子结构
7.3 RNA结构与分类
7.3.1 RNA结构
7.3.2 RNA分类

第8章 氨基酸与蛋白质
8.1 氨基酸
8.1.1 氨基酸组成
8.1.2 氨基酸符号表示
8.1.3 氨基酸分类
8.2 肽链
……
第9章 基因与基因组
第10章 生物信息数据库

第三部分 数学备忘录
第11章 智能计算理论与算法
第12章 概率、信息与统计
第13章 随机过程
参考文献
索引

精彩书摘

  (2)重复序列与基因交叉问题。由人类基因组与各种不同类型生物体基因组的测定发现,在同一生物体(尤其是在高等生物体)的基因组中,存在大量基因的重复与交叉问题。所谓重复序列,就是在同一基因组中一些DNA片段重复出现,这些片段有长有短,较长的片段长达数百万,有的片段虽短,但可能重复出现数百万次。这种重复不是简单一致定义下的相同,而是在一定相似率定义下的重复,因此必须通过序列的比对才能发现并确定这些重复序列。
  基因的交叉就是同一基因在基因组中往往由多条不同的DNA片段组成,在生物学中称这些组成基因的不同片段为外显子,中间间隔部分称为内含子,在基因编码成蛋白质时,内含子被切除,部分外显子排列的次序会发生重叠或颠倒,生物学中称这种现象为基因交叉,这种交叉结构的分析同样需要序列的比对计算。

前言/序言

  生物计算中的理论、方法与应用越来越被生物、医学及其他医务工作者所需要与关注,特别是在人类基因组计划实施以来,该学科的发展与研究更凸显出重要的作用。基因、基因组、蛋白质、蛋白质组等生物学信息的数据采集、储存与分析及其生物学意义,是生物计算乃至生物、医学与医药的重点研究内容之一。因此在国内外的许多医科院校均被作为重要课程,与生物信息学和生物计算相关内容的课程不仅是研究生的必修课程或选修课程,也是多个专业本科生的专业必修课程或选修课程。我们先后用了近三年的时间,在开展教学和研究工作的同时编写了本书,目的是为生物学和医学相关专业的本科生与研究生提供一本既通俗易懂,同时又可深入了解相关内容的教材,为该学科的建设与发展服务。
  自2004年以来,本人有幸多次参加南开大学数学科学学院沈世镒教授主持的“生物信息学”讨论班。在讨论与学习过程中,不仅掌握了一些解决生物序列分析与计算的具体算法,更重要的是学到了解决生物序列分析的一些新方法和新思想。如生物序列的多种比对算法、数据结构中的语义分析及其在蛋白质结构分析中的应用等。这些方法从不同角度对生物计算中的有关问题进行研究与探讨,并在许多方面得到了很好的应用。在学习过程中,与南开大学数学科学学院胡刚、王奎博士等合作,对生物计算中的算法以及相关软件包的使用等问题有了更深入与确切的理解,使本书得以顺利完成。我们希望能将该领域中的主要内容与方法介绍给读者。
  “生物计算”与“生物信息学”在本质上无大的区别,国内外的许多院校均把它们看作同一领域的学科。在本书中,我们把“生物计算”看作较偏重于原理与方法,同时注重它们的实现与应用,在介绍国外先进与常用算法的同时,增加了相应软件包的使用与分析等内容。
好的,以下是一本关于生物信息学和计算生物学中核心主题的图书简介,旨在涵盖与您提供的书名主题相近但又不完全重叠的领域。 --- 图书名称:《计算生物学:从基因组到蛋白质结构解析》 简介: 在分子生物学、遗传学以及系统生物学飞速发展的今天,数据的爆炸性增长已成为科研前沿的显著特征。理解和解读这些复杂、高维的数据,需要强大的计算工具和理论框架。《计算生物学:从基因组到蛋白质结构解析》旨在为研究生、科研人员及资深从业者提供一套系统而深入的指南,聚焦于现代生物信息学领域中那些至关重要的计算方法论,尤其关注基因组学数据的处理、蛋白质结构预测与功能分析,以及代谢网络建模等核心议题。 本书摒弃了对基础生物学概念的冗余介绍,直接切入计算挑战和解决方案。全书内容组织严谨,兼顾理论深度与实践指导,力求构建一座连接生物学问题与计算科学工具的坚实桥梁。 第一部分:基因组测序与组装的高级计算策略 现代高通量测序技术(如Illumina、PacBio和Oxford Nanopore)产生了海量的短读长和长读长序列数据。本部分详细阐述了从原始数据质量控制到完整基因组组装的复杂计算流程。 1. 序列质量评估与预处理: 探讨了Phred质量值的统计学意义、错误模型的识别以及高效的过滤算法(如基于K-mer的方法)。重点分析了如何处理不同测序平台产生的系统性误差,包括碱基错误率、插入缺失(Indel)和嵌合序列的识别与校正。 2. 从头组装(De Novo Assembly)的拓扑学基础: 深入解析了基于De Bruijn图和Overlapping Layout Consensus (OLC) 两种主要组装策略的数学原理。着重讨论了图论在处理重复序列、解决组装歧义性中的核心作用。书中详细比较了A-Bruijn、MEGAHIT等现代组装器的内部机制,并提供了优化参数以应对复杂基因组(如多倍体和高度重复区域)的实操经验。 3. 基因组精细化与结构变异检测: 组装完成后,如何通过比对和纠错技术(Polishing)提高准确性是关键。本章涵盖了基于参考序列的重比对技术,以及利用多种数据类型(如光学图谱、Hi-C数据)辅助识别大片段的结构变异(如拷贝数变异、倒位和易位)。我们将详细介绍Paired-end和Mate-pair信息在解析复杂结构变异边界方面的计算优势。 第二部分:蛋白质结构预测与功能推断的计算前沿 蛋白质是生命活动的执行者,其三维结构决定了其功能。本部分聚焦于从序列到结构和功能的计算转化过程,反映了该领域近年来最引人注目的突破。 1. 序列比对与同源性搜索的进阶: 超越基础的BLAST,本书详细考察了隐马尔可夫模型(HMMs)在构建蛋白质家族数据库(如Pfam)中的应用。讨论了PSI-BLAST和JackHMMER等迭代比对算法的统计学稳健性,以及在低同源性序列中提取生物学信号的技巧。 2. 蛋白质结构预测的深度学习革命: 深度学习,尤其是AlphaFold2及其后续模型的出现,彻底改变了结构生物学。本章深入剖析了这些模型的核心架构——如Attention机制和几何深度学习的应用。我们将解析如何利用共进化信息(Co-evolutionary signals)来推断残基间的空间距离约束,并探讨如何评估预测模型的置信度(如pLDDT分数)及其局限性。 3. 结构比较、动力学模拟与功能注释: 预测出的结构需要通过比较来理解其生物学意义。本节讲解了结构比对算法(如TM-score和RMSD的局限性),以及分子动力学(MD)模拟在探索蛋白质柔性和构象变化中的作用。同时,本书也介绍了基于结构域(Domain)和拓扑图的自动化功能注释流程。 第三部分:系统生物学中的网络建模与数据整合 生物系统并非孤立组件的简单集合,而是相互作用的复杂网络。本部分侧重于如何利用计算方法对这些交互网络进行建模、分析和推断。 1. 代谢网络(Metabolic Network)的拓扑分析: 介绍如何构建和表示生化反应网络,并深入讲解约束性基础代谢模型(FBA)的原理。重点讨论了如何通过优化方法预测细胞的最大生长率,以及如何利用FBA进行基因敲除或环境扰动下的系统响应分析。 2. 蛋白质-蛋白质相互作用网络(PPI Network)的挖掘: 讲解了大规模PPI数据的整合,包括从实验数据(酵母双杂交、Pull-down)和计算预测(文本挖掘)中提取可靠交互信息的方法。本章强调了网络拓扑分析工具(如中心性指标、模块检测算法)在识别关键调控蛋白和信号通路中的实际应用。 3. 多组学数据的整合分析框架: 现代系统研究往往涉及基因组学、转录组学、蛋白质组学等多层次数据。本书提出了一种通用的计算框架,用于校准、规范化和集成这些异构数据源。讨论了基于稀疏主成分分析(Sparse PCA)和多视图学习(Multi-view Learning)方法,以期揭示跨层级的生物学关联。 结语 《计算生物学:从基因组到蛋白质结构解析》是一本面向深度应用和方法论探索的参考书。它要求读者具备一定的编程基础(如Python或R)以及对离散数学和线性代数的基本理解。通过对这些前沿计算工具的透彻解析,本书旨在培养读者独立解决复杂生物学问题的能力,推动计算方法在生命科学研究中的创新应用。

用户评价

评分

最近我一直在关注生物医药领域的发展,尤其是基因疗法和精准医疗。在了解相关信息时,我发现生物序列分析在其中扮演着至关重要的角色。《生物计算:生物序列的分析方法与应用》这本书,为我提供了一个绝佳的切入点。它不仅仅是一本技术手册,更像是一部生物计算领域的百科全书。书中详细介绍了如何从海量的基因组、转录组、蛋白质组数据中提取关键信息,例如如何识别疾病相关的基因变异,如何预测药物靶点,以及如何设计新的蛋白质。我特别被书中关于“同源性搜索”和“多序列比对”的章节所吸引,它们为理解基因和蛋白质的进化关系以及功能保守性提供了坚实的基础。此外,书中对于“基因组注释”和“系统生物学”的讲解,也让我对生物体内部复杂的调控网络有了更深刻的认识。这本书的深度和广度都令人称赞,它不仅适合生物信息学的专业人士,也能够帮助其他领域的科研人员和学生,快速了解生物序列分析的核心技术和前沿应用,为他们的研究提供新的思路和方法。

评分

我是一名业余的生物爱好者,一直对生命科学的奥秘充满好奇。最近我接触到《生物计算:生物序列的分析方法与应用》这本书,它让我对生物学有了全新的认识。这本书用一种非常生动有趣的方式,将复杂的生物序列分析技术变得触手可及。我之前总觉得生物信息学离我很遥远,充满了各种高深的数学和计算机知识,但这本书通过丰富的图表和通俗易懂的语言,让我看到了生物序列分析的魅力所在。它不仅讲解了各种分析工具和算法,还结合了大量的生物学案例,比如如何通过分析DNA序列来追溯人类的迁徙历史,如何利用蛋白质序列来设计更有效的抗体药物。我最喜欢的部分是书中关于“生物网络分析”的章节,它展示了如何构建复杂的生物分子相互作用网络,并从中发现关键的调控节点。这本书让我意识到,即使没有深厚的专业背景,我也可以通过学习生物计算,来探索生命世界的奥秘。它鼓励我去思考,去提问,去发现数据背后隐藏的故事。

评分

这本《生物计算:生物序列的分析方法与应用》对我来说,简直就像是打开了一扇通往未知世界的大门。在此之前,我一直觉得生物学是一门充满魅力的学科,但接触到如此海量的生物数据时,我感到一阵无力。基因组测序、蛋白质组学、转录组学……这些名词听起来就让人头疼,更别提如何从中提取有价值的信息了。这本书就像一位经验丰富的向导,它循序渐进地介绍了各种生物计算的工具和技术,从最基础的序列比对到复杂的网络构建,都有详尽的解释。我尤其欣赏书中对实际案例的分析,它并没有停留在理论层面,而是通过具体的例子,展示了这些方法是如何被应用于解决真实的生物学难题的。比如,书中对于利用生物计算方法预测蛋白质结构的功能,以及通过分析基因序列来理解疾病的发生机制,都有非常精彩的阐述。阅读过程中,我仿佛置身于一个生物信息学的实验室,亲手操作着各种软件,探索着数据的奥秘。这本书不仅让我掌握了分析生物序列的技能,更重要的是,它激发了我对生物计算领域更深层次的探索欲望。它让我明白,在这个大数据时代,生物计算已经不再是可有可无的辅助工具,而是推动生命科学研究向前发展的核心驱动力。

评分

作为一名对生物学充满好奇心的在校学生,我一直在寻找一本能够系统地梳理生物序列分析方法并展示其应用的书籍。《生物计算:生物序列的分析方法与应用》这本书,恰好满足了我的需求,甚至超出了我的预期。这本书的结构非常清晰,先是介绍了生物序列的基本概念和各种数据格式,然后逐步深入到各种常用的分析算法,如隐马尔可夫模型、支持向量机等,并详细讲解了它们在基因识别、功能预测、进化关系推断等方面的应用。我特别喜欢书中对算法原理的深入剖析,它并没有止步于“如何使用”的层面,而是追溯到“为什么这样工作”,这对于理解方法的局限性和优势至关重要。同时,书中还涵盖了生物序列分析的最新进展,例如机器学习和深度学习在生物信息学领域的应用,这让我看到了这个学科广阔的发展前景。更值得一提的是,书中提供了大量的代码示例和参考文献,这对于想要动手实践的读者来说,无疑是一份宝贵的资源。这本书的语言风格非常严谨又不失通俗易懂,即使是初学者也能较快地掌握其中的核心概念。

评分

我一直对生物分子之间的相互作用以及它们如何协同工作来维持生命活动感到着迷。因此,我寻找一本能够深入探讨生物序列分析技术并展示其在理解这些复杂过程中的作用的书籍。《生物计算:生物序列的分析方法与应用》恰好提供了这样的视角。书中对各种算法的介绍,如聚类分析、模式识别等,以及它们在功能基因组学、蛋白质组学等领域的应用,让我受益匪浅。我特别欣赏书中对“序列特征提取”和“机器学习模型构建”的详细讲解,这为我理解如何从原始的生物序列数据中提取有意义的信息,并将其转化为可用于预测和分类的模型奠定了基础。书中关于“比较基因组学”和“系统生物学”的章节,更是让我看到了生物计算在揭示生命演化规律和理解复杂生物系统方面的强大能力。这本书的深度和广度,以及其严谨的科学态度,都让我对生物计算领域产生了浓厚的兴趣,并为我未来的学术研究方向提供了重要的指引。

评分

公司建图书室用 还没看精心挑的应该不错

评分

价格有些太贵了。

评分

内容还算凑合,但实际内容只有一百多页。写的不够深入,比较肤浅。

评分

后面全是什么生物或者数学背景知识介绍。没意思。

评分

这本书的内容,主要偏向于数学的,讲解了统计公式的原理,关于生物学的知识比较肤浅。

评分

后面全是什么生物或者数学背景知识介绍。没意思。

评分

比较全面

评分

价格有些太贵了。

评分

比较全面,挺好本书。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.coffeedeals.club All Rights Reserved. 静流书站 版权所有