基于集成神經(jīng)網(wǎng)絡的蛋白質相互作用研究.pdf_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質相互作用在新陳代謝、信號傳導與識別、細胞周期調整、復雜蛋白復合物的形成、癌癥發(fā)生等方面都發(fā)揮著至關重要的作用。因此,研究蛋白質間的相互作用不僅有助于全面了解生命過程,而且對于發(fā)病機制的探索、新藥物的研發(fā)和尋找藥物靶標等方面都具有重要意義。
   當前隨著高通量實驗技術的發(fā)展,大量的蛋白質序列信息被測出,如何從海量的蛋白質序列信息中判定哪些蛋白質間是發(fā)生相互作用的,哪些是不會發(fā)生相互作用的,相互作用的蛋白質作用位點在哪些氨基

2、酸殘基上等都是目前亟待突破的問題。由于蛋白質相互作用網(wǎng)絡十分復雜,同時相互作用的數(shù)據(jù)呈現(xiàn)規(guī)模大、噪聲高等特點,這給生物信息學的研究帶來了前所未有的挑戰(zhàn)。本文從蛋白質一級序列信息出發(fā),利用智能算法,對蛋白質間的相互作用進行預測研究,所做的主要工作和創(chuàng)新點有以下幾個方面:
   (1)在蛋白質相互作用位點預測方面,提出了基于組合特征集成的預測方法。蛋白質相互作用位點預測的研究對象是單個的氨基酸殘基,通過提取氨基酸殘基的某些生物特征來

3、判定其是否是相互作用位點是直接有效的方式。本文中在提取了蛋白質氨基酸殘基的序列譜信息、熵值和溶劑可及表面積三種特征的基礎上,對其進行了不同方式組合,組成了四組樣本集,分別用四組樣本集訓練基本RBF神經(jīng)網(wǎng)絡分類器,最后采用GASEN集成方法對四種基本本分類器進行集成學習。實驗結果表明不同的特征組合方式對分類器預測結果有影響,在氨基酸基本特征序列普的基礎上增加溶劑可及表面積比增加熵值對分類器預測精度的提高更有效。同時使用不同特征組合樣本集訓

4、練的基本分類器在訓練集上就增大了基本分類器間的結構差異性,以這種方式進行最后的集成使預測精度由只有序列譜輸入時候的66.79%大幅度上升到了81.37%,證明這種基于組合特征集成的預測方法是有效的。
   (2)在蛋白質-蛋白質相互作用預測方面主要進行了基于不同編碼方式的BP神經(jīng)網(wǎng)絡集成和基于不同負樣本集的RBF神經(jīng)網(wǎng)絡集成的預測方式。針對不同的蛋白質對編碼方式不同可導致不同的預測結果,文中主要創(chuàng)建了三種不同編碼方式的樣本集,分

5、別是向量加、向量減和直接連接的編碼方式,通過比較證明直接相連的編碼方式效果最好?;诓煌幋a方式訓練的基本分類器用GASEN集成方法進行集成,結果表明這種方式的集成也能較大幅度的提升預測精度。
   (3)針對當前在蛋白質,蛋白質相互作用研究中沒有標準的非相互作用集的現(xiàn)狀,使用不同的方法創(chuàng)建了四組蛋白質非相互作用樣本集即負樣本集,在四組不同的樣本集上分別進行RBF神經(jīng)網(wǎng)絡學習,結果表明在生物體內,距離越遠的負樣本集預測效果越好,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論