基于DNA序列特征分析的固有無序蛋白分類研究.pdf_第1頁
已閱讀1頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、固有無序蛋白(IDPs,Intrinsic Disordered Proteins)是近些年發(fā)現(xiàn)的一類普遍存在且缺乏穩(wěn)定三維結構的天然蛋白,在多種生理與病理過程中行使重要的生物學功能。由于結構柔性大,實驗研究IDPs難度很大。目前IDPs的許多生物機理還不清楚,基于生物信息學方法發(fā)展IDPs預測分析算法為IDPs的研究提供了重要研究工具。自固有無序蛋白被發(fā)現(xiàn)以來,研究人員發(fā)展了多個IDPs預測算法,然而多數(shù)預測算法效率不高,不同預測算法

2、之間的預測結果具有很大差異,還需要更加全面、深入挖掘IDPs固有序列結構特征。已有的IDPs預測算法都是基于蛋白質序列特征構建而成,因此為了揭示IDPs更深層次序列結構特征,本文系統(tǒng)研究了IDPs中有序區(qū)和無序區(qū)對應在DNA序列層次的差異特征,在此基礎上發(fā)展了IDPs有序區(qū)/無序區(qū)預測分類算法,為今后IDPs預測提供了新思路,論文主要工作如下。
  1.基于DNA水平的IDPs有序區(qū)/無序區(qū)序列特征分析
  以最新版本的ID

3、Ps數(shù)據(jù)庫DisProt6.02中的注釋信息為基礎,本文首先從EMBL核酸數(shù)據(jù)庫獲取了IDPs對應原始基因組中的DNA序列,經(jīng)過去冗余等環(huán)節(jié),最終構建了包含1063條有序區(qū)和499條無序區(qū)數(shù)據(jù)集?;谠摂?shù)據(jù)集,本文借助序列分析CGR(Chaos Game Representation)模型、密碼子偏好分析等方法,深入研究了有序區(qū)和無序區(qū)序列的特征差異,結果表明有序區(qū)和無序區(qū)在單堿基、二聯(lián)體核苷酸、密碼子使用等方面存在不同程度的差異,具有

4、一定的偏好性。進一步分析表明無序區(qū)有更寬的密碼子使用范圍,密碼子用法差異較大,具有相似密碼子用法的基因數(shù)量少,而有序區(qū)密碼子用法相似。對密碼子各位點GC相對含量、嘌呤與嘧啶的含量差分析結果表明有序區(qū)和無序區(qū)存在一定的特征差異。無序區(qū)G+C含量差異較大,無序區(qū)密碼子第三位位點偏好使用嘌呤而有序區(qū)偏好使用嘧啶。此外,本文對有序區(qū)和無序區(qū)連接位點區(qū)域的序列特征進行了比較分析,結果發(fā)現(xiàn)無序區(qū)具有相對保守的序列特征。因此,上述研究表明了IDPs有

5、序區(qū)和無序區(qū)在DNA層次展現(xiàn)了不同程度的序列特征,為IDPs預測奠定了理論基礎。
  2.融合蛋白質及DNA序列特征的IDPs有序區(qū)/無序區(qū)分類方法
  為了能夠定量刻畫IDPs有序區(qū)和無序區(qū)的差異特征,本文分別選取了三種特征參數(shù)作為IDPs分類算法的輸入?yún)?shù):第一種特征對應DNA序列單堿基、二聯(lián)體核苷酸、三聯(lián)體核苷酸使用頻率;第二種特征引入了基于TN曲線和Z曲線提出的75個特征參數(shù)來描述三聯(lián)體核苷酸的組成及排列信息;第三種

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論