《生物信息学基础教程》根据两位作者张洛欣、马斌多年的教学与科研经验创作而成,兼顾学科基础和研究前沿。全书着重于生物信息学的基础理论和主要软件,覆盖该学科几乎所有的主要方面:双序列的比较、快速比对和序列数据库的查询方法、多序列比较、DNA序列中的信号元素、分子进化树分析、基因组重组、蛋白质组学中的质谱分析等。书中配有大量习题,其难易程度用星号标注,其中个别未解决问题特别注明,可以作为研究生的研究课题。
本书不仅适合作为高年级本科生和研究生开设生物信息学或计算生物学的教材,也可供希望了解生物信息理论和工具的生命科学、数学和计算机等方向的科研人员阅读参考。
第一章 生物序列比对
§1.1 DNA、RNA和蛋白质
§1.1.1 DNA分子
§1.1.2 蛋白质分子
§1.1.3 RNA分子
§1.1.4 从基因到蛋白质的信息传递
§1.2 比对:序列比较的模型
§1.3 比对图
§1.3.1 定义
§1.3.2 双序列之间比对的总数目
§1.4 比对的记分法则
§1.5 全序列比对:动态规划算法
§1.5.1 基本算法
§1.5.2 使用仿射空位罚分的算法
§1.5.3 *全序列比对的C语言程序 第一章 生物序列比对
§1.1 DNA、RNA和蛋白质
§1.1.1 DNA分子
§1.1.2 蛋白质分子
§1.1.3 RNA分子
§1.1.4 从基因到蛋白质的信息传递
§1.2 比对:序列比较的模型
§1.3 比对图
§1.3.1 定义
§1.3.2 双序列之间比对的总数目
§1.4 比对的记分法则
§1.5 全序列比对:动态规划算法
§1.5.1 基本算法
§1.5.2 使用仿射空位罚分的算法
§1.5.3 *全序列比对的C语言程序
§1.6 局部比对:Smith-Waterman算法
§1.6.1 Smith-Waterman算法
§1.6.2 *局部比对的C语言程序
§1.7 最优占用空间的比对算法
§1.8 比对蛋白质序列所使用的打分矩阵
§1.8.1 打分的统计基础
§1.8.2 BLOSUM矩阵系列
参考文献
练习题
第二章 快速比对方法
§2.1 同源序列查询和数据库搜索
§2.2 序列中的字分布
§2.2.1 DNA序列的随机模型I:一致独立分布
§2.2.2 DNA序列的随机模型II:马尔可夫链.
§2.3 字匹配的散列表方法
§2.4 点阵法
§2.5 *FASTA程序
§2.6 BLAST程序
§2.6.1 基本算法:连续核的概念
§2.6.2 E-值的计算公式
§2.6.3 BLAsT程序系列
§2.7 散核方法
§2.7.1 散核模型
§2.7.2 散核的优化
§2.7.3 基于散核的相似性查找的程序实现
§2.7.4 多散核
§2.7.5 *其他有关散核的研究
参考文献
练习题
第三章 多序列比对
§3.1 为什么需要比对多个生物序列?
§3.2 模体、谱、共识序列
§3.3 Logo:一个序列保守区域的可视化方法
§3.4 多序列比对的SP分数
§3.5 多序列比对的复杂性
§3.5.1 动态规划算法
§3.5.2 NP-难解性
§3.6 渐进式比对
§3.6.1 渐进式的基本策略
§3.6.2 Feng-Doolittle比对算法
§3.7 近似算法
§3.7.1 序列编辑距离
§3.7.2 星型比对算法
§3.8 多序列比对实用程序
§3.8.1 ClustalW
§3.8.2 MUSCLE
§3.8.3 其他多序列比对程序
§3.9 基因组的比对
参考文献
练习题
第四章 隐马尔可夫模型及基因序列的识别
§4.1 隐马尔可夫模型
§4.1.1 隐马尔可夫模型的定义
§4.1.2 隐马尔可夫模型的基本问题
§4.2 基本算法
§4.2.1 前向算法和后向算法
§4.2.2 viterbi算法
§4.2.3 建模算法
§4.3 蛋白质簇的隐马尔可夫链模型
§4.3.1 谱HMM
§4.3.2 从多序列比对到谱HMM
§4.3.3 从谱HMM到多序列比对
§4.3.4 Pfam数据库
§4.4 GENSCAN:预测人基因组中的全基因结构程序
§4.4.1 真核生物基因的结构
§4.4.2 半HMM
§4.4.3 基因的Burge-Karlin模型
§4.4.4 自动识别人基因组中的基因序列
参考文献
练习题
第五章 分子进化树分析
§5.1 达尔文的进化树
§5.2 进化树的数学性质
§5.2.1 基本概念
§5.2.2 进化树的个数
§5.2.3 常见的无根进化树变换
§5.2.4 进化树之间的距离
§5.2.5 二叉树和多叉树
§5.3 构建分子进化树I:Parsimony方法
§5.3.1 Fitch算法
§5.3.2 寻找简约进化树
§5.4 构建分子进化树II:基于距离的方法
§5.4.1 加权进化树和距离矩阵
§5.4.2 计算序列间的距离
§5.4.3 Neighbor-Joining算法
§5.4.4 UPGMA算法
§5.5 构建分子进化树III:最大似然法和贝叶斯方法
§5.5.1 最大似然法
§5.5.2 *贝叶斯方法
§5.6 *构建分子进化树的两个实际问题
§5.6.1 一致性和长分支相吸现象
§5.6.2 Bootstrap分析
§5.7 祖先状态的推断
§5.7.1 问题的定义
§5.7.2 sankoff算法
§5.7.3 最大似然法
§5.7.4 推断方法的准确率
§5.8 基因树和物种树的融合
§5.8.1 基因簇和基因树
§5.8.2 基因树和物种树的融合的定义
§5.8.3 推断基因复制事件
参考文献
练习题
第六章 计算蛋白质组学
§6.1 基础知识
§6.1.1 氨基酸和肽的质量
§6.1.2 质谱仪和质谱
§6.1.3 同位素峰、误差和噪音
§6.1.4 连续质谱
§6.1.5 复杂蛋白样本的处理
§6.1.6 肽鉴定的基本方式
§6.2 肽从头测序
§6.2.1 打分函数
§6.2.2 PEAKS算法
§6.2.3 谱图算法
§6.3 搜库及其统计学验证
§6.3.1 打分函数
§6.3.2 对结果的质控
§6.4 翻译后修饰
§6.5 其他研究课题
§6.5.1 定量分析
§6.5.2 糖鉴定
§6.5.3 新型肽鉴定方法
§6.5.4 其他分子的鉴定
参考文献
练习题
索引
英汉术语对照