內容簡介
《普通高等教育“十二五”規劃教材·名校名師係列:化學信息學(第3版)》介紹瞭Intcrnet上化學資源的使用方法,並對化學信息學方法及其在化學、生物化學、藥物化學等領域中的應用進行瞭詳細論述。本書共10章,包括聯機文獻檢索、網絡圖書與網絡期刊、數據庫資源、化學信息資源查詢、化學信息的計算機錶示與建模、計算機輔助結構解析與閤成設計、分子模擬、進化計算與優化算法、小波分析、多元校正與因子分析。
本書可供高等學校化學、化工、生物化學、藥物化學以及相關專業的師生和廣大科技工作者參考閱讀。
內頁插圖
目錄
第三版前言
第二版前言
第一版前言
第1章 聯機文獻檢索
1.1 美國化學文摘
1.1.1 美國化學文摘和SciFinder簡介
1.1.2 SciFinder的著錄內容與格式
1.1.3 SciFinder的功能與使用方法
1.2 web of Science
1.2.1 Web of Science簡介
1.2.2 Web of Science的著錄內容與格式
1.2.3 Web of Science的功能與使用方法
1.2.4 ISI WebofKnowledge的其他功能
1.3 Ei Village
1.3.1 Ei Village簡介
1.3.2 Ei Village的著錄內容與格式
1.3.3 Ei Village的功能與使用方法
1.4 期刊全文數據庫
1.4.1 Science Direct
1.4.2 ACS Publications
1.4.3 RSC Publishing
1.4.4 Springer link
1.4.5 Wi1ey Online library
1.5 國內學術期刊數據庫
1.5.1 CNKI
1.5.2 中文科技期刊數據庫
1.5.3 萬方數據知識服務平颱
1.6 其他文獻檢索係統簡介
1.7 專利文獻查詢
1.7.1 專利文獻數據庫
1.7.2 專利文獻檢索
上機訓練與習題
第2章 網絡圖書與網絡期刊
2.1 網上圖書館
2.1.1 圖書館主頁
2.1.2 www虛擬圖書館
2.2 網上書店
2.3 網絡期刊
2.4 數字化圖書
2.5 齣版商主頁
上機訓練與習題
第3章 數據庫資源
3.1 晶體結構數據庫
3.1.1 劍橋結構數據庫
3.1.2 蛋白質數據庫
3.1.3 核酸數據庫
3.2 波譜數據庫
3.2.1 NIST Chemislry Web Book
3.2.2 化閤物譜圖數據庫
3.3 網上化學手冊
3.3.1 化學元素周期錶
3.3.2 化閤物基本性質數據庫
3.3.3 物理化學常數
上機訓練與習題
第4章 化學信息資源查詢
4.1 查詢
4.2 導航
4.3 ChIN簡介
4.4 商業信息
4.5 化學機構信息
上機訓練與習題
第5章 化學信息的計算機錶示與建模
5.1 化閤物結構編碼
……
第6章 計算機輔助結構解析與閤成設計
第7章 分子模擬
第8章 進化計算域優化算法
第9章 曉波分析
第10章 多元化正與因子分析
主要參考文獻
精彩書摘
第1章 聯機文獻檢索
通過Internet進行文獻聯機檢索是指通過聯機方式,根據用戶提供的信息(關鍵詞、作者等)給齣相關的文獻信息,如論文題目、期刊名稱、捲、頁、摘要甚至全文。 目前已有許多文獻檢索係統,如web of Science、美國化學文摘(CA)以及一些專業性更強的專業文獻係統。
訪問這些文獻係統一般有兩種方式,即遠程登錄和www瀏覽,目前主要以www方式為主。對於免費係統,可從Internet或通過其他途徑得到有關信息,自由地使用;但對於收費係統,隻有在交費後得到有關的賬號和密碼纔能獲得使用權限。目前一般是由所在單位統一訂閱供本單位的用戶使用。
1.1 美國化學文摘
1.1.1 美國化學文摘和SciFinder簡介
美國化學文摘(Chemical Abstract,簡稱CA)是由美國化學會(American Chemical Society)化學文摘服務社(Chemical Abstract Service,簡稱CAS)於1907年創辦的文摘係統。開始以印刷版齣版發行,1967年以前,每半月一期,每年一捲,後來改為每周一期,每年兩捲。隨著計算機和Internet的發展,逐步形成瞭光盤版(CA on CD)和網絡版。
CA的主要特點是它的文摘詳細、客觀地報道化學化工文獻,文摘質量高,不加任何評論,報道的內容包括文獻的研究目的和範圍,新化學反應、化閤物、材料、工藝、程序、工具和資源,新知識的應用,以及觀察的結果和作者的解釋與結論;收錄的範圍廣泛,係統、全麵地收錄世界上化學化工方麵98%的文獻,其中7。%的文獻來自美國以外的國傢和地區,共收錄15。多個國傢或國際組織的56種文字齣版的14000餘種齣版物,包括期刊文獻、會議文獻、專利文獻、學位論文、圖書文獻和科技報告等;另外,CA的使用非常方便,在印刷版中有各種捲索引、五年纍積索引、十年纍計索引、八十年纍積索引等。CA的全部文獻分為5部分8。類,其中生物化學部分為1-20類,有機化學部分為21-34類,大分子部分為35-46類,應用化學與化學工程部分為47-64類,物理化學、無機化學和分析化學部分為65-80類。所收錄的文摘按類彆編排,每一個文摘擁有一個文摘號。
CA的電子齣版物始於1969年,當時的計算機發展水平還比較落後,采用磁帶作為記錄載體,但實現瞭化學文獻的自動、高效檢索,推動瞭文獻檢索的發展。隨著計算機水平的提高,采用瞭光盤作為記錄材料,形成瞭CA的光盤版,即CA On CD。CA的網絡版則是隨著Internet的發展而建立起來的新的文獻檢索方式,先後開發瞭基於客戶端軟件的SCiFinder Scholar和基於網絡訪問的SciFinder web版。2012年底,SciFinder Scholar的客戶端服務已經停止,目前主要是通過SciFinder Web版進行服務。光盤版和網絡版的使用給化學文獻的檢索提供瞭更為方便的方式,不僅檢索方式靈活多樣。
……
前言/序言
化學生物信息學導論:整閤基因組學與蛋白質組學前沿研究 本書概述: 本教材聚焦於當前生命科學研究中最具活力和前沿性的交叉學科領域——化學生物信息學(Chemical Biology Informatics)。它係統性地梳理瞭從基礎的化學結構信息處理到復雜的生物大分子(蛋白質、核酸)數據挖掘、再到高通量篩選和藥物設計等核心應用的全貌。本書旨在為學習者提供一套堅實的理論框架和實用的計算工具箱,使其能夠有效地整閤化學信息學與係統生物學、基因組學及蛋白質組學的最新進展。全書內容深度與廣度兼顧,側重於如何利用先進的計算方法解決生命科學研究中的實際瓶頸問題。 第一部分:化學信息學基礎與數據錶示 第一章:化學信息學的基石與發展脈絡 本章首先闡述化學生物信息學的定義、學科範疇及其在現代生物醫學研究中的戰略地位。我們將迴顧該領域從早期的分子結構數據庫構建到如今基於人工智能的復雜係統建模的發展曆程。重點討論化學信息學與計算化學、生物信息學的交叉融閤點,特彆是其在藥物發現流程中的核心價值體現。 第二章:分子錶示與描述符的構建 精確的分子錶示是後續計算分析的前提。本章深入探討分子結構的三維(3D)與拓撲(2D)錶示方法。內容涵蓋: 1. 結構化數據格式: 詳細介紹 SMILES(Simplified Molecular Input Line Entry System)、InChI(International Chemical Identifier)以及 MOLfile 等標準格式的編碼原理、優缺點及相互轉換機製。 2. 分子指紋(Molecular Fingerprints): 詳述基於結構片段的指紋(如 Path/Circular Fingerprints)和基於物理化學性質的描述符(如 Mismatch/Topological Indices)。闡釋如何設計和選擇最適閤特定預測任務的描述符集閤。 3. 三維結構描述: 討論如何通過幾何描述符(如距離矩陣、扭轉角)和能量學描述符來捕捉分子構象信息,並介紹描述符的降維處理技術(如 PCA)。 第三章:化學數據庫的組織與檢索 本章側重於大規模化學數據的管理與高效訪問技術。我們將分析商業數據庫(如 Reaxys, SciFinder)和公共資源(如 PubChem, ChEMBL)的結構特點,並探討構建定製化化學信息學知識庫的策略。重點內容包括: 1. 數據庫索引技術: 介紹子結構搜索(Substructure Searching)、相似性搜索(Similarity Searching)和全結構匹配的算法實現(如基於樹的索引和簽名方法)。 2. 數據質量控製(DQC): 討論如何識彆和清洗化學結構數據中的錯誤、冗餘和不一緻性條目,確保輸入數據的可靠性。 第二部分:生物大分子數據處理與分析 第四章:序列信息學基礎:從DNA到蛋白質 本部分將視角轉嚮生命科學核心——生物大分子。本章係統介紹生物序列數據的獲取、存儲和基本操作。 1. 序列比對算法: 深入解析全局比對(Needleman-Wunsch)和局部比對(Smith-Waterman)算法的動態規劃原理,以及BLAST等啓發式搜索工具的應用。 2. 統計模型: 介紹隱馬爾可夫模型(HMM)在蛋白質傢族識彆和序列預測中的應用,重點講解如何構建和訓練HMM。 3. 序列特徵提取: 討論如何從氨基酸序列中提取氨基酸組成、疏水性分布等特徵,作為後續機器學習模型的輸入。 第五章:蛋白質結構信息學與建模 蛋白質的三維結構決定其功能,本章集中討論結構信息的計算處理。 1. 結構預測方法概述: 比較同源建模(Homology Modeling)、摺疊識彆(Fold Recognition)和從頭計算(Ab Initio)的理論基礎和適用範圍。 2. 結構比對與相似性: 講解蛋白質結構比對的指標(如RMSD)和算法(如TM-score),以及如何通過結構域(Domain)分析揭示進化關係。 3. 結構驗證與可視化: 介紹評估蛋白質模型質量的標準(如 Ramachandran 圖分析)和常用分子可視化軟件的操作要點。 第六章:基因組與轉錄組數據整閤分析 本章探討化學生物信息學如何與高通量組學數據(特彆是基因組學和轉錄組學)相結閤,以理解化學實體(藥物、小分子)與生物靶點間的相互作用。 1. 基因功能注釋與通路分析: 介紹 GO (Gene Ontology) 和 KEGG Pathway 等知識庫的應用,以及如何利用富集分析(Enrichment Analysis)來解釋高通量實驗結果。 2. 差異錶達分析(RNA-seq): 討論從原始測序數據到差異基因集的生物信息學流程,重點關注如何將差異錶達的基因集映射到已知的化學作用網絡中。 第三部分:化學生物學前沿計算應用 第七章:定量構效關係(QSAR)與機器學習 QSAR 是連接分子結構與生物活性的橋梁。本章是本書的實踐核心。 1. 經典QSAR模型構建: 詳細介紹Hansch分析、Free-Wilson分析的原理和步驟,以及多重綫性迴歸在構建預測模型中的應用。 2. 現代機器學習方法: 重點講解支持嚮量機(SVM)、隨機森林(Random Forest)和人工神經網絡(ANN)在化閤物活性、毒性預測中的應用。探討特徵工程在提升模型性能中的關鍵作用。 3. 深度學習在化學信息學中的興起: 介紹捲積神經網絡(CNN)和循環神經網絡(RNN)在處理分子圖結構和序列數據方麵的最新進展。 第八章:分子對接與虛擬篩選技術 本章聚焦於藥物發現流程中至關重要的虛擬篩選(Virtual Screening, VS)技術。 1. 分子對接原理: 深入分析分子對接算法的核心——構象搜索(Sampling)和評分函數(Scoring Functions)。區分基於配體的對接(Ligand-based)和基於結構的對接(Structure-based)。 2. 評分函數的分類與局限性: 詳細討論基於物理、基於知識和基於學習的評分函數的優缺點,以及如何校準評分函數以提高預測精度。 3. 高通量虛擬篩選(HTVS)的流程設計: 闡述如何使用自動化腳本和並行計算資源高效地篩選數百萬化閤物。 第九章:藥物代謝與毒性預測(ADMET/Tox Informatics) 預測化閤物的藥代動力學特性和潛在毒性是降低藥物研發風險的關鍵環節。 1. ADMET 描述符與模型: 介紹血漿蛋白結閤、滲透性(如Caco-2, BBB穿透)等關鍵藥代動力學參數的預測模型。 2. 毒性預測(Tox Informatics): 討論預測遺傳毒性、肝毒性等終端毒性的計算方法,特彆是利用結構警示基團(Structural Alerts)和多重模型集成(Ensemble Methods)來提高安全性評估的可靠性。 結論:化學生物信息學的未來展望 本書最後一部分總結瞭當前計算方法的瓶頸(如數據稀疏性、模型可解釋性差),並展望瞭未來研究方嚮,包括量子化學計算的整閤、動態模擬(如分子動力學)與機器學習的結閤,以及利用自動化和機器人技術實現“自驅動”的化學實驗設計。本書強調,隻有深入理解化學、生物學和計算科學的內在聯係,纔能在未來的生命科學前沿研究中取得突破。