基于統(tǒng)計建模方法的蛋白質結構預測研究.pdf_第1頁
已閱讀1頁,還剩112頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、從20世紀80年代末開始,生物信息學(Bioinformatics)逐漸興起并開始蓬勃發(fā)展。生物信息學是以計算機為工具對生物信息進行儲存、檢索和分析的科學,它不僅是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一。生物信息學的發(fā)展將會對生命科學帶來革命性的變革,它不僅會對相關基礎學科起巨大的推動作用,還會對農業(yè)、醫(yī)藥、衛(wèi)生、食品等產業(yè)產生巨大的影響。當前生物信息學研究的一個主要方向是發(fā)展基于統(tǒng)計建模的預

2、測方法,例如隱馬爾科夫模型、支持向量機、k近鄰等方法。相對于傳統(tǒng)的方法,這些方法具有速度快、自動化程度高的優(yōu)點,尤其適用于高通量大規(guī)模序列數據的分析。本文主要以蛋白質的結構和功能的預測為應用背景,對上述這幾種基于統(tǒng)計建模的預測方法進行了較深入的研究,旨在提高它們在特定的預測應用中的精度和效率。 本文主要在以下幾個方面進行了有成效和有特色的研究:1.跨膜螺旋是蛋白質家屬中極為重要的一種類型,在幾乎所有的活細胞和信號傳輸中都起著重要

3、作用,人類基因組中相當一部分蛋白質編碼為螺旋連接的跨膜段的形式。因此,對跨膜段的正確預測是實現蛋白質功能預測的重要步驟。本文針對跨膜蛋白序列的生物學特征,提出了一種新的隱馬爾科夫模型分段訓練算法,對跨膜螺旋的分段位點以及螺旋方向等特征進行了建模和預測。同標準訓練算法相比,該算法具有時間復雜度低、預測精度高等優(yōu)點。對于包含160條跨膜螺旋的蛋白序列進行10次交叉驗證的測試,結果使用該訓練算法的預測準確率達到96.98%,正確定位精度為91

4、.25%,高于其他預測方法對該數據集的預測結果,驗證了該算法的合理性和有效性。 2.蛋白質可溶性表征蛋白質殘基在三級結構中與溶劑接觸的程度,是反映蛋白質三級結構以及功能位點的主要特征。按照蛋白序列中殘基的相對可溶性,將其分為兩類(表面/內部)和三類(表面/中間/內部)進行預測。采用Markov鏈模型,選擇不同窗寬和參數對數據進行訓練和預測,以確保得到最好的分類效果,并同其他已有方法進行了比較。對同一數據集不同分類閾值的預測結果顯

5、示,Markov鏈方法對蛋白可溶性的整體預測結果好于基于神經網絡和信息論的方法。其中,對兩類數據的最優(yōu)分類結果達到78.9%,對三類數據的最優(yōu)分類結果達到67.7%,表明高階Markov鏈模型(MCM)是蛋白殘基可溶性預測的一種有效方法。 3.蛋白質要參與正常的生命活動,必須處于特定的細胞內區(qū)域(如細胞核、線粒體、細胞質等),而預測蛋白質的亞細胞定位信息對于了解其功能有重要的意義。本文選擇了氨基酸組成、氨基酸對組成、位置特異性打

6、分矩陣等不同特征以及模糊k近鄰和支持向量機兩種分類方法,對預測結果進行了比較和分析。結果表明位置特異性打分矩陣能提高對不同亞細胞位點的可區(qū)分性,是一種非常有效的分類特征,而支持向量機可以更好地利用位置特異性打分矩陣特征進行預測,因此采用氨基酸組成和位置特異性打分矩陣兩種特征,并結合支持向量機,是一種有效的亞細胞定位預測方法。此外,還在此基礎上提出了一種能進一步提高預測精度的基于ensemble技術(多分類器投票表決)的亞定位預測方法。

7、 4.蛋白質磷酸化作為一種最常見的蛋白翻譯后修飾(PTM)過程,在一系列生物細胞活動中起著重要的作用。目前對蛋白質激酶底物的實驗測定方法通常非常費時,而且會受多種實驗條件的限制。通過機器學習的方法,利用蛋白質的序列信息對不同激酶家族作用的磷酸化位點進行預測,不僅具有快速、自動等優(yōu)點,還可以對相應的實驗測定進行指導。本文提出了一種基于Euclidean距離的改進k近鄰算法,特征向量由基于BLOSUM62矩陣的平均分值構成。對多個磷酸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論