蛋白質組學技術_第1頁
已閱讀1頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質組學技術,李 明臨床生物化學教研室,一、前言,人類基因組序列圖譜初稿的公布,在揭示基因組的精細結構的同時,也凸現(xiàn)出基因數(shù)量有限性和基因結構的相對穩(wěn)定性,這與生命現(xiàn)象的復雜性和多變性之間存在著巨大反差。這種反差促使人們認識到:基因只是遺傳信息的載體。要研究生命現(xiàn)象,闡釋生命活動的規(guī)律,只了解基因組的結構是遠遠不夠的,這也使得人們對于生命活動的直接執(zhí)行者——蛋白質的重要性有了更深刻的理解,因此,對蛋白質的數(shù)量、結構、性質、相互

2、關系和生物學功能進行全面和深入的研究,成為生命科學研究的追切需要和重要任,務。一個以“蛋白質組” (proteome)為研究重點的生命科學新時代已悄然到來。二、蛋白質組學的概念及其發(fā)展史隨著后基因組時代的到來,蛋白質組研究越來越受到國內(nèi)外科學工作者的密切關注,并以其特有的思維方法和技術手段在解決生物學重大問題上開始顯示出強大威力??梢韵嘈?,隨著蛋白質組研究的不斷深入,它在揭示生長、發(fā)育、凋亡、分化、信號傳導和代謝調控等生命活動的規(guī)律

3、上將會有新突破,對探討重大疾病的發(fā)生機制、疾病的診斷防治和新藥開發(fā)將提供重要的理論基礎。,(一)蛋白質組學的概念“蛋白質組”一詞的英文是PROTEOME,它由PROTEins和genOME兩個詞組合而成,意思是proteins expressed by a genome,即基因組表達的蛋白質。廣義上講,蛋白質組(proteome)是指“一個細胞或一個組織基因組所表達的全部蛋白質”。它是對應于一個基因組的所有蛋白質構成的整體,而不是局限

4、于一個或幾個蛋白質。由于同一基因組在不同細胞、不同組織中的表達情況各不相同,即使是同一細胞,在不同的發(fā)育階段、不同的生理條件甚至不同的環(huán)境影響下,其蛋白質的存在狀態(tài)也不盡相同。因此,蛋白質組是一個在空間和時間上動態(tài)變化著的整體。,蛋白質組學(proteomics)是指應用各種技術手段來研究蛋白質組的一門新興學科,其目的是從整體的角度分析細胞內(nèi)動態(tài)變化的蛋白質組成成分、表達水平與修飾狀態(tài),了解蛋白質之間的相互作用與聯(lián)系,提示蛋白質功能與細

5、胞生命活動規(guī)律。要對“全部蛋白質”進行研究是非常困難的,“功能蛋白組學(functional proteomics)”的提出解決了這一難題,其研究對象是功能蛋白質組,即細胞在一定階段或與某一生理現(xiàn)象相關的所有蛋白質,它是介于對個別蛋白質的傳統(tǒng)蛋白質化學研究和以全部蛋白質為研究對象的蛋白質組學研究之間的層次,并把目標定位在蛋白質,群體上,這一群體可大可小,從局部入手研究蛋白質組的各個功能亞群體,以便將來把多個亞群體組合起來,逐步描繪出接近

6、于生命細胞的“全部蛋白質”的蛋白質組圖譜。功能蛋白質組學的研究為實際運作帶來方便,人們可利用現(xiàn)有的技術手段來研究蛋白質組這一極限群體中的各蛋白質功能亞群,從理論和技術上使以“全部蛋白質”為研究對象的蛋白質組學這一抽象概念具體化,使研究者們更易于從時、空、量效方面動態(tài)、整體、深入地研究生理狀態(tài)下同一組織細胞在不同發(fā)育階段或同一組織細胞在不同個體間或同一基因組在不同組織細胞間,以及病理情況下同一,疾病的不同發(fā)展階段的蛋白質表達模式和功能模式

7、的變化,揭示一些重要的生命現(xiàn)象和一些重大疾病的發(fā)生發(fā)展規(guī)律。狹義上講,蛋白質組是指不同條件下細胞內(nèi)蛋白質的變化,比如正常細胞和異常細胞之間,細胞用藥和不用藥之間的蛋白質表達譜的差別,這在疾病研究和藥物篩選上很有意義,是目前蛋白質組學在應用研究方面最具前景的領域。當然,隨著蛋白質組研究的不斷發(fā)展,蛋白質組學的概念也將不斷發(fā)展和深化。(二)蛋白質組學的產(chǎn)生與發(fā)展20世紀中期以來,隨著DNA雙螺旋結構的提出和蛋白質空,間結構的X射線解析,

8、開始了分子生物學時代,對遺傳信息載體DNA和生命功能的主要體現(xiàn)者蛋白質的研究,成為生命科學研究的主要內(nèi)容。20世紀90年代初期,美國生物學家提出并實施了人類基因組計劃,經(jīng)過各國科學家多年的努力,人類基因組計劃取得了巨大成績,一些低等生物的DNA序列已被闡明,人類DNA序列的框架圖已經(jīng)測定,迄今已測定的表達序列標簽(EST)幾乎覆蓋了人類所有基因。在這樣的形勢下,生命科學已進入了后基因組時代。在后基因組時代,生物學研究的重點已從揭示生物所

9、有遺傳信息轉移到在整體水平上對生物功能的研究。這種轉向,的第一個標志就是產(chǎn)生了一門稱為功能基因組學的新學科。功能基因組學的主要任務是解析和綜合大量的遺傳信息,闡明基因遺傳信息與人類生命活動之間的聯(lián)系?;虻墓δ苁峭ㄟ^其產(chǎn)物mRNA和蛋白質來體現(xiàn)的。近年來利用基因表達連續(xù)分析(SAGE)、微陣列(microarray)和DNA芯片(chip)等新技術研究mRNA水平上的基因活動規(guī)律取得了較大進展。但mRNA水平的基因表達狀況并不能完全代表

10、蛋白質水平的狀況, mRNA與蛋白質間的相關系數(shù)僅為0.4-0.5,蛋白質才是生命功能的主要執(zhí)行者,由于它存在著翻譯后的加工修飾、轉移定位、構象變化、,蛋白質與蛋白質及蛋白質與其他生物大分子相互作用等自身特點,因此難以從DNA和mRNA水平得到解答,從而促使人們從組織或細胞內(nèi)整體蛋白質的組成、表達和功能模式去研究生命活動的基本規(guī)律。自1994年澳大利亞學者Williams和Wilkins首先提出與基因組相對應的“蛋白質組”概念,并開始從

11、整體蛋白質水平研究生命現(xiàn)象以來,蛋白質組研究在國際上進展十分迅速,不論是基礎理論,還是技術方法,都在不斷地進步和完善。許多種細胞的蛋白質組數(shù)據(jù)庫已經(jīng)建立,相應的國際互聯(lián)網(wǎng)站也層不出窮,眾多的制藥廠和公司在巨大財力的支持和商業(yè)利益的誘惑下,紛紛加入蛋白質組研究領域,蛋白質組研究的文章每年成倍增長。1996年澳大利亞建立了世界上第一個蛋白質組研究中心(Australia proteome analysis facility, APAF)。在

12、政府部門的大力支持下,丹麥、加拿大也先后成立了蛋白質組研究中心。1997年召開了第一次國際“蛋白質組學”會議,預測21世紀生命科學的重心將從基因組學轉移到蛋白質組學,為生命科學和醫(yī)藥學領域的研究帶來了新的生機。1998年在美國舊金山召開了第二屆國際蛋白質組學會議,參加者大都來自各大藥廠和公司。1999年1月在英國倫敦舉行了應用蛋白質組會議。1999年5月在日本召開的,國際電泳會議上,約1/3的文章與蛋白質組有關。目前,中國國家自然科學基

13、金委員會關于蛋白質組重大項目的研究已啟動,腫瘤蛋白質組研究也已列入我國973和863項目。中國科學院上海生物化學研究所、中國軍事醫(yī)學科學院、湖南師范大學、中南大學湘雅醫(yī)學院等單位相繼開展了蛋白質組學研究。1998年在中國科學院上海生物化學研究所舉辦了兩次全國性的蛋白質組學研討會,并在此基礎上,提出了功能蛋白質組學的研究戰(zhàn)略??梢韵嘈旁诓痪玫膶恚叭祟惖鞍踪|組計劃”必將啟動,而且規(guī)模比“人類基因組計劃”更大,產(chǎn)生的影響更久遠,將是繼基因

14、組研究之后的又一“大科學”。,三、蛋白質組學技術方法概述蛋白質組學主要涉及有兩方面的內(nèi)容:一是研究蛋白質組的組成成份,即蛋白質組表達模式的研究;二是研究蛋白質組的功能,即蛋白質組功能模式的研究,目前主要集中在蛋白質組表達模式方面。蛋白質組表達模式研究的支撐技術主要有雙向凝膠電泳和以質譜為代表的蛋白質鑒定技術及生物信息學。雙向凝膠電泳(2-DE)技術于1975年由O’Farrell等創(chuàng)立,其原理是第一向在高壓電場下對蛋白質進行等電聚焦

15、(IEF),再在第一向垂直方向上進行第二向SDS-聚丙烯,酰胺凝膠電泳(SDS-PAGE)。等電聚焦電泳由最初的載體兩性電解質管膠電泳發(fā)展到目前的固相pH梯度(IPG)凝膠電泳,由于采用了IPG膠條從而避免了因載體兩性電解質引起的聚焦時間延長、pH梯度不穩(wěn)定、陰極漂移等現(xiàn)象。目前IPG雙向凝膠電泳的分辨率達到了1萬多個蛋白質點,但對過于偏酸或偏堿、高分子質量、極微量蛋白質以及難溶性蛋白質的分辨仍感困難。由于雙向凝膠電泳對批量蛋白質可實現(xiàn)

16、一次性分離,具有高靈敏度的高分辨率、便于計算機進行圖像分析處理、可以很好地與質譜分析等鑒定方法匹配的優(yōu)點,因而成為目前分離蛋白質組分的核心技術。此外,雙向高效柱層析、毛細管電泳也是分,離蛋白質組分的有效技術。對分離的蛋白質進行鑒定是蛋白質表達模式研究的又一重要內(nèi)容,通常采用的有蛋白質微量測序、氨基酸組成分析等傳統(tǒng)的蛋白質鑒定方法,但這些方法費時、費力、不易實現(xiàn)高通量分析。因此一種新的蛋白質鑒定技術——質譜(MS)法受到了人們的重視和應

17、用,其基本原理是樣品分子離子化后,根據(jù)離子間質荷比(m/z)的差異來分離并確定樣品的分子質量。質譜在20世紀初就已經(jīng)產(chǎn)生,多用于無機物或小分子有機物的鑒定,直到80年代末隨著“軟電離”技術的出現(xiàn)而進入生物大分子(如蛋白質)的鑒,定領域。所謂“軟電離”是指樣品分子電離時保留整個分子的完整性,不會形成碎片離子。軟電離質譜用于大分子的鑒定,主要有以下特點:靈敏度高、快速、能同時提供樣品的精確分子質量和結構信息、既可定性又可定量、并能有效地與各

18、種色譜聯(lián)用,如用HPLC/MS來分析復雜體系。目前用于蛋白質鑒定的質譜主要有兩種:電噴霧質譜(ESI-MS)和基質輔助激光解吸/電離飛行時間質譜(MALDI-TOF-MS)。但要精確鑒定某一蛋白質通常還得聯(lián)合幾種鑒定技術。最近,國處建立了一種將MALDI-MS技術直接用于組織切片或印片的方法(Pierre C et al, 1999),即組織切片或印片原位質譜分析技術,取得了較,滿意的結果。生物信息學是隨著人類基因組計劃、計算機技術、

19、網(wǎng)絡技術的發(fā)展而誕生的一門新興學科,是蛋白質組學的一個重要的技術平臺。生物信息學是蛋白質組學研究的一個不可缺少的部分,其在蛋白質組學中的研究有兩個重要應用:一是構建和分析雙向凝膠電泳圖譜,二是數(shù)據(jù)庫的搜索與構建。目前應用最普遍的數(shù)據(jù)庫是NRDB和dbEST數(shù)據(jù)庫。NRDB由SWISS-PROT和GENPETP等幾個數(shù)據(jù)庫組成。蛋白質功能模式的研究是蛋白質組研究的最終目標,其主要研究目標是要揭示蛋白質組成員間的相互作用、相互協(xié),調的關系

20、。并深入了解蛋白質的結構與功能的相互關系,以及基因結構與蛋白質結構功能的關系。目前,蛋白質功能模式研究的主要技術有酵母雙雜交系統(tǒng)、噬菌體展示、生物傳感芯片質譜、基因工程和蛋白質工程中的突變表達分析、磁共振成像、X線晶體衍射分析、蛋白質芯片技術等。四、蛋白質樣品制備技術蛋白質組是指某種細胞或組織中基因組表達的全部蛋白質。實踐中更多的情況是研究功能蛋白質組,即細胞在某一特定階段或某一生理狀態(tài)下基因表達的所有蛋白質。由于蛋白質組研究是對不

21、同時間和不同空間發(fā)揮功能的蛋白質整體的研究,因此如何從細胞組織中盡可能完整地將蛋白質以溶解狀態(tài)提取出來,是蛋白質組研究的首要步驟。,(一)蛋白質制備常用技術在蛋白質制備中主要包括細胞組織的破碎裂解;蛋白質增溶溶解以破壞蛋白質與蛋白質分子之間,蛋白質與非蛋白質之間的共價與非共價相互作用;變性及還原;去除非蛋白質組分,如核酸、脂類等。為了達到這一目的,在蛋白質制備過程中需使用表面活性劑、還原劑及離液劑。離液劑、還原劑及表面活性劑的選擇

22、(1)離液劑(chaotropes)最普遍的離液劑是脲,脲的作用主要是改變或破壞氫鍵等次級鍵的結構,使蛋白質的肽鏈伸展開來,充分暴露疏水,中心,降低接近疏水殘基的能量域,但通常當脲和表面活性劑CHAPS聯(lián)合使用時,會使某些蛋白質吸附在固相pH梯度凝膠中而丟失。因此,近年常將一種新的離液劑硫脲和脲聯(lián)合使用,以增加蛋白質在IPG膠中的溶解性。硫脲的使用大大改善了蛋白質的溶解性能,特別是改善了膜蛋白的提取。但硫脲在水中溶解性差,需用高濃度的

23、脲助溶。(2)表面活性劑蛋白質在去折疊后,會暴露出大量疏水性殘基,因此常需使用表面活性劑破壞蛋白質分子之間的疏水相互作用。常使用的表面活性劑有陰離子去污劑SDS,非離子去污劑,Triton X-100和NP-40,兩性離子去污劑CHAPS等。(3)還原劑在蛋白質制備中常需要斷裂蛋白質分子中的二硫鍵,以利于肽鏈的分離,因此樣品還原的好壞也會影響到蛋白質的分離效果。一般使用β-疏基乙醇和二硫蘇糖醇(DTT)作還原劑,但DTT本身帶有

24、電荷,在等電聚焦時,常常會遷移到pH范圍以外,從而使某些蛋白質的二硫鍵重新配對,使溶解度降低而重新沉淀下來。采用非離子型還原劑如三丁基膦(TBP)可大大增加蛋白質的溶解性,并可幫助蛋白質從第一向轉移到第二向。,(二)腫瘤樣品蛋白質的抽提腫瘤蛋白質組學研究主要是為了建立腫瘤細胞和組織的蛋白質表達譜及研究腫瘤細胞和組織與正常細胞和組織之間差異表達的蛋白質,以期發(fā)現(xiàn)用于腫瘤診斷、預后和治療的分子標志物。如何制備優(yōu)良的腫瘤樣品蛋白質是腫瘤蛋白

25、質組學研究的首要問題。由于蛋白質在類型和特性上均存在著很大的差異,因此不同的蛋白質樣品的抽提方法也各異。但無論何種抽提方法最終都是使蛋白質能充分溶解、解聚、變性和還原,使期能得到更好的分離和鑒定。常用的組織裂解液配方(用于雙向電泳)為9.8mol/L脲、,2%(W/V)NP-40、1%(V/V)TritonX-100、100mmol/L DTT、0.5mmol/L PMSF、4% CHAPS、0.5mmol/L EDTA、40mmol

26、/L Tris、1μg/mL aprotinin、10μg/mL chymostatin、2%(V/V)pharmalyte。腫瘤組織蛋白質抽提的一般步驟:(1)將已經(jīng)處理過的樣品從-80℃冰箱中取出,各自稱重(濕重30-80mg),于液氮中充分研磨至粉末狀。(2)組織研磨后置于400μL裂解液中,充分旋渦混勻。(3)懸液置于37 ℃孵育1h。(4)懸液取出后再充分旋渦,于低溫冷凍離心機12000g、,離心15min(溫度控制

27、在8-12℃)。(5)吸取上清液即為組織的總蛋白質。(6)進行蛋白質的定量檢測,確定上樣量。五、蛋白質組雙向凝膠電泳分離技術蛋白質組學研究技術主要由雙向凝膠電泳(two-dimensional electrophoresis, 2-DE)、微量蛋白質化學及生物信息學三個部分組成。1975年O’Farrell等建立了雙向凝膠電泳技術(O‘Farrell, 1975),第一向是等電聚焦(isoelectric focusing, I

28、EF),第二向是SDS聚丙烯酰胺凝膠電泳(SDS-PAGE)。第一向的IEF電泳,經(jīng)歷了從,最初的載體兩性電解質pH 梯度等電聚焦電泳到20世紀80年代固相pH梯度等電聚焦電泳(immobilized pH gradient, IPG)的發(fā)展過程。盡管傳統(tǒng)的O’Farrell系統(tǒng)雙向電泳有較高的分辨率,曾報道可以分離到約1000多種蛋白質,但這種系統(tǒng)仍存在不少問題,如重復性差,特別是第一向因陰極漂移而丟失堿性蛋白質,載體兩性電解質pH梯

29、度不穩(wěn)定,受電場和時間影響大,脲在低溫下容易在毛細管中析出影響聚合及蛋白質分離等。1982年由Bjellgvist等發(fā)展并完善了固相pH梯度等電聚焦技術,Goeg(1997)等成功地將之應用于雙向電泳的第一向分離,從而解決了以上,存在的問題,大大提高了雙向電泳的分辨率及重復性。在一張雙向電泳圖譜上已可以分離到近萬個蛋白質點,這是目前分離蛋白質的最好方法,因此已成為蛋白質組學研究不可缺少的核心技術。目前Pharmacia公司推出2DE-M

30、S自動化系統(tǒng)以及大通量的2-DE技術,在第二向電泳中發(fā)展了6-12塊膠同時電泳的Ettan系統(tǒng),從而加快電泳速度和電泳的重復性,并推出了自動取點、酶解,以使2-DE膠上所有樣品的酶解和轉移能平行化進行。亞蛋白質組陣列重疊群技術:由于蛋白質溶解性、豐度等的差異,要在單一2-D膠上展現(xiàn)所有的蛋白質仍存在困難。,為了研究整個蛋白質組,必須采用亞蛋白質組陣列策略。該策略以重疊群技術為基礎。即首先將組織細胞分成不同的亞細胞組分或順序分級抽提具有

31、不同溶解度范圍的蛋白質亞群,用寬pH范圍的2-D膠檢測樣品的復雜性,再用一套具有交叉重疊的高分辨、高上樣量的窄pH范圍IPG等電聚焦和用不同濃度的SDS-PAGE膠進行分離,最后在計算機上根據(jù)重疊群的原理進行拼接和分析,從而顯示蛋白質組中幾乎所有的組分,這類方法能有效分離低豐度蛋白質,pI與分子質量非常接近的蛋白質,并能大致確定分離蛋白質的亞細胞定位。,(一)固相 pH梯度-SDS雙向凝膠電泳(IPG-DALT)方法1、固相pH梯度等

32、電聚焦凝膠電泳(第一向)①準備膠條架②樣品處理③放置IPG膠條④水化及聚焦電泳⑤平衡2、SDS聚丙烯酰胺凝膠電泳(第二向)①凝膠配制及灌膠,②第一向膠條的轉移③電泳④脫膠⑤染色六、雙向凝膠電泳圖像分析PDQUEST分析2-D圖像的基本流程:獲取圖像→切割與定位圖像→蛋白質斑點檢測→蛋白質斑點匹配→數(shù)據(jù)分析。七、蛋白質鑒定技術(一)概述,蛋白質組研究中對于通過雙向電泳或其他方法分離的蛋白質樣品進行鑒定(iden

33、tification)或稱注釋(annotation)是蛋白質組研究中最為關鍵的一步。分析鑒定蛋白質的方法從20世紀早期Stein和Moore開創(chuàng)的氨基酸組成分析算起,經(jīng)過了大半個世紀的發(fā)展,建立了一系列方法技術包括蛋白質N端、C端序列測定,等電點,分子質量的測定,肽譜分析鑒定技術等。但目前蛋白質組學研究中的蛋白質鑒定技術與傳統(tǒng)方法相比,至少有以下三個特點:其一,蛋白質組學研究中對鑒定方法的靈敏度比傳統(tǒng)方法有更高的要求,一個雙向凝膠上的

34、蛋白質點的量通常只有幾,個或不到一個皮摩爾(pmol),鑒定方法的靈敏度必須高于這一要求。其二,傳統(tǒng)方法通常都是對個別和幾個蛋白質進行分析鑒定,而蛋白質組研究中要求同時對幾十個、幾百個甚至上千個蛋白質進行鑒定,因而對鑒定方法的通量和速度的要求要大大超過傳統(tǒng)方法。目前蛋白質組學研究中的蛋白質鑒定技術的第三個特點是將實驗結果與數(shù)據(jù)庫查尋緊密關聯(lián)。隨著人類基因組計劃而建立起來的人類基因組數(shù)據(jù)庫和相關蛋白質數(shù)據(jù)庫及相應的分析查尋軟件,是目前人類

35、疾病相關的蛋白質組研究必不可少的手段。所謂對蛋白質組研究中展現(xiàn)的蛋白質進行鑒定或注釋,就,是把展現(xiàn)的某個蛋白質點或一個組分的名稱和它在數(shù)據(jù)庫中的進入名碼(accession code)確定下來,或者鑒定出其是否為數(shù)據(jù)庫中未曾鑒定過的新蛋白質。某種意義上說,注釋和鑒定是將蛋白質氨基酸序列與基因的DNA序列聯(lián)系起來。如果該種基因編碼的蛋白質有已知的確定的功能,那么注釋和鑒定則可把蛋白質氨基酸序列與其生物學活性聯(lián)系起來,這也是蛋白質組研究最

36、重要的目的之一。(二)質譜技術質譜儀一般由進樣器、離子化源、質量分析器、離子檢測器、控制電腦及數(shù)據(jù)分析系統(tǒng)組成,其中離子化源和質量,分析器是兩個關鍵的部件,用于生物大分子研究的質譜儀的離子化源主要是電噴霧(ESI)和基質輔助激光解吸附離子化源(MALDI),而質量分析器則主要有四級桿,離子肼和飛行時間三種。當前市面上質譜儀中ESI源多與四級桿,離子肼質量分析器相匹配,而MALDI源常與飛行時間質量分析器相匹配。當前在蛋白質組研究中

37、用質譜技術鑒定和注釋蛋白質主要通過兩種路線,一種是通過肽質譜指紋圖(peptide mass fingerprinting)和數(shù)據(jù)庫搜尋匹配的路線,進行這種分析的質譜儀首選是MALDI-TOF質譜儀;另一種是通過測出,樣品中部分肽段二級質譜信息或氨基酸序列標簽與數(shù)據(jù)庫搜尋匹配的路線,適合于進行這種分析的儀器主要是電噴霧串聯(lián)質譜儀。由于當前蛋白質組研究中2-D膠電泳仍然是分離蛋白質的主導技術,對2-D膠上蛋白質點的鑒定,目前普遍認為MA

38、LDI-TOF質譜儀進行肽質譜指紋圖(PMF)分析是合適的第一步。而MALDI-TOF質譜儀由于其靈敏度高(可達fmol),分析速度快,譜圖易于解析以及受緩沖液/鹽分的干擾小等諸多優(yōu)點,非常適合于進行PMF分析。然而單靠PMF路線來鑒定蛋白質并非總能獲得成功,經(jīng)常,有獲得的肽質譜指紋圖在數(shù)據(jù)庫中得不到可靠的匹配的情況。其可能的原因有:①由于樣品量太少,PMF圖的信噪比太低、因而輸入庫中搜尋的數(shù)據(jù)質量不好。②2-D膠上所取的一個蛋白質點

39、并非單一蛋白質,所獲得的PMF圖實際上是兩個以上蛋白質PMF圖的混合圖。③操作中角蛋白或其他蛋白質的污染。④該蛋白質發(fā)生了較多的轉譯后修飾,數(shù)據(jù)庫中未有記載。⑤所用胰蛋白酶質量不夠好,蛋白酶自融片段多。⑥所分析的蛋白質是一個數(shù)據(jù)庫中沒有的未知的新蛋白質。⑦有些生物材料的蛋白質數(shù)據(jù)庫規(guī)模太小。在上述情況下PMF方法未能鑒定的蛋白質可通過其,他質譜技術獲得該蛋白質一段或數(shù)段多肽的串聯(lián)質譜信息或序列標簽(Sequence tag)并將其輸入數(shù)

40、據(jù)庫中進行搜尋來鑒定該蛋白質。(三)基質輔助激光解吸電離技術(MALDI)在質譜分析中,為了測定待測物分子的質量,首先必須在系統(tǒng)中導入能量,而能量的導入必須滿足以下兩點要求:第一,能量能有效并受控制地轉換到樣品中以使樣品分子充分地解吸附并離子化;第二,為避免熱不穩(wěn)定性物質的熱降解,能量必須在非常短的時間內(nèi)導入。激光具有脈沖短、靈敏度高的特點,是一種較理想的能量導入方式。早,在20世紀60年代初期,激光就被科學工作者用來在質譜分析中產(chǎn)

41、生離子,他們將具有不同波長和不同脈沖寬度的激光與各種不同類型的質譜結合進行研究。20世紀70年代初期首次用激光產(chǎn)生有機分子離子,但在20年以后,激光才用于大分子物質的解吸和電離。這一突破性的進展關鍵在于基質輔助激光解吸離子化技術的創(chuàng)立。在基質輔助激光解吸電離技術中,采用了一種小分子物質即基質幫助大分子物質進入氣相。當基質以較高的比例與樣品混合后,高分子待測樣品便以單分子狀態(tài)均勻地分散于基質中,在所采用的激光波長下,由于基質對激光有較,

42、強的吸收,而待測物只吸收很弱的激光,故不會造成大分子物質的破壞和降解。當大量被激發(fā)的基質分子由于熱釋放而揮發(fā)時,會同時將非揮發(fā)性的大分子待測物質帶入氣相?;|的加入使得除待測物基質以外的分子之間的相互作用減少,因而降低了解吸能,解決了大分子物質的汽化問題?;|在MALDI-TOF-MS方法中的作用主要包括三個方面:第一,從激光光源吸收能量以防止被測大分子物質的分解;第二,使被測物分子分離成單分子狀態(tài)以防止它們聚集;第三,在被測物離子化

43、過程中充當質子化試劑。第一,條作用要求基質對激光光源有很強的吸收,到目前為止文獻報道的基質化合物均為含苯環(huán)的有機化合物;第二條作用要求基質與被測分子物質具有很好的相容性,同時不能有分子間的相互作用;第三條作用要求基質為酸性物質?;|化合物視其物理狀態(tài)的不同可分為固態(tài)基質和液態(tài)基質兩 大類,其中固態(tài)基質用于大分子分析時具有較好的分辨率,而液態(tài)基質用于大分子分析時需要用較高強度的激光來產(chǎn)生離子,容易導致碎片離子的產(chǎn)生,因此一般不用于大分子

44、質量物質的測定。鑒于以上三條要求,基質化合物通常選用固體狀態(tài)的弱有機酸,常用的基質化合物有,2,5-二羥基苯甲酸(DHB),α-氰基-4-羥基肉桂酸(CCA),3,5-二甲氧基-4-羥基肉桂酸或稱芥子酸(SA)等。對于不同物質的測定,合適基質的選擇是至關重要的,因為不同的物質其氣化能力有所不同,而基質的吸熱能力也有強弱之分。DHB適合于蛋白質、多肽、低聚糖、脂以及合成多聚物的測定,CCA適合于分子質量較小的蛋白質和多肽的測定,SA則一般

45、用于分子質量較大的蛋白質的測定。(四)飛行時間質譜(TOF- MS)飛行時間質譜主要由離子源(ion source),質量分析器,(mass analyzer)以及離子檢測器(ion detector)組成。1、離子源①MALDI離子源包括激光脈沖發(fā)生器、可調衰減器、聚焦調節(jié)光學系統(tǒng)等三個主要部分。②離子源中用來完成基質輔助激光解吸電離最關鍵的參數(shù)是激光打在樣品上的照射強度,蛋白質樣品產(chǎn)生離子的最小值(閾值)大約為1MW/cm

46、2。2、質量分析器飛行時間分析器是最簡單的質量分析裝置之一,它是基于對一套離子施加能量使其到達檢測器來測定它們到達的時,間。離子到達檢測器的時間(t)與其在分析器中的飛行速度(v)密切相關(t=v/d),由于飛行距離(d)是一定的,因而飛行時間t取決于它們的飛行速度(v)。而飛行速度又與離子質量(m)所帶電荷(e)以及動力學能量(E)有關,由于動力學能量E=1/2mv2,故v=(2E/m)1/2,這即表明當具有不同質量(m)的離子被

47、施加同樣的能量(E)時,質量小的離子飛行速度會快一些,而質量大的離子飛行速度則慢一些,因而不同質量的離子到達檢測器的時間就會出現(xiàn)不同。這個過程類似于某個人用同樣的力量向同一個目標拋設兩個相同體積的鐵球和塑料球,結果塑料球由于質量較小,速度較快將會先于鐵球到達目的地。,3、離子檢測器由基質輔助激光解吸電離產(chǎn)生的高質量的離子必須在轉換電板上轉換成電子或低質量的離子才能得到檢測。 (五)MALDI-TOF質譜測定肽質量指紋圖(PMF)每

48、種蛋白質或肽都有著自身特定的一級結構,即氨基酸序列,蛋白質或肽被酶解后所產(chǎn)生的肽片段也各具特性。因此,當?shù)鞍踪|或肽被特異性的酶如Trpysin, Lys-C等酶切后再進行肽混合物質量測定,會得到一套具有特征性的肽質量圖,稱為肽質量指紋圖(peptide mass fingerprinting, PMF)。正如人的指紋能辨明一個人的身份,肽質量指紋,圖也能鑒定該蛋白到底屬于哪一種蛋白質。具體來說,要鑒定一個2-D膠上蛋白質點一般需要經(jīng)過

49、:蛋白質原位酶解,MALDI-TOF肽質量指紋圖測定,蛋白質鑒定數(shù)據(jù)庫搜尋三個主要步驟。1、蛋白質原位酶解①取點與脫色②還原和烷基化③酶解與萃取2、MALDI-TOF肽質量指紋圖①基質的選擇與制備,②樣品盤的清洗與樣品制備③質譜測定制備好的樣品可使用各公司生產(chǎn)的不同類型的MALDI-TOF質譜來進地肽質量指紋圖測定。儀器操作時一般需要選擇下列參數(shù):線性或反射模式,離子源加速電壓及導出電壓,紫外或紅外激光波長,離子延遲抽取

50、時間,飛行管道達到的真空度,質譜信號單次掃描累加次數(shù),正離子或負離子譜測定。④數(shù)據(jù)校正3、蛋白質鑒定數(shù)據(jù)庫搜尋,當獲得蛋白質點的準確肽質量指紋數(shù)據(jù)后,接下來的工作就是將該套肽片段數(shù)據(jù)輸入數(shù)據(jù)庫進行搜尋以確定蛋白質的最后歸屬。由于蛋白質組研究已日趨國際化,通過因特網(wǎng)可以方便、快捷、有效地交換和共享信息資源。目前因特網(wǎng)上有很多專門用于生命科學研究領域的WWW服務網(wǎng)站,其中ExPASY(蛋白質分析專家系統(tǒng))是蛋白質組研究經(jīng)常訪問的一個網(wǎng)站

51、,從它可以鏈接到各種相關數(shù)據(jù)庫。八、生物信息學與蛋白質組信息學,生物信息學是生命科學和信息科學以及數(shù)學等學科交叉、結合的產(chǎn)物,它的誕生極大地推動了生命科學研究的進展。諾貝爾獎獲得者W.Gilbert在1991年曾經(jīng)指出:“傳統(tǒng)生物學解決問題的方式是實驗的。現(xiàn)在,基于全部基因都將知曉,并以電子操作的方式駐留在數(shù)據(jù)庫中,新的生物學研究模式的出發(fā)點應是理論的。一個科學家將從理論推測出發(fā),再回到實驗中去,追蹤或驗證這些理論假設。”因此,在未來

52、的科研工作中,科學家,們可能首先是從生物信息學的角度入手尋找自己感興趣的生物學對象,然后回過頭來進行實驗操作以證明已有的科學知識或發(fā)現(xiàn)新的科研領域。隨著人類基因計劃的順利實施,人們的注意力已從基因組測序轉向對基因組表達的功能產(chǎn)物進行分析,即對蛋白質組進行結構與功能的分析,因此蛋白質組信息學已成為當前生物信息學面臨的主要課題。(一) 生物信息學概述,隨著人類基因組計劃的快速推進,生物信息學逐漸受到人們的重視。這主要有兩個原因:首先是

53、計算機科學本身的快速發(fā)展,導致了計算能力的迅速提高;另一個則是隨著人類基因組研究逐漸深入,核酸和蛋白質數(shù)據(jù)的快速積累,導致對生物信息學的渴望急驟增加,目前這一領域內(nèi)集中了來自數(shù)學、生物學、計算機專業(yè)等方面的人才。在此,對生物信息學的定義、工作方式及其誕生等做一簡單介紹。,1、生物信息學的定義20世紀90年代初,美籍學者林華安(Hwa A.Lim)首先創(chuàng)造和使用了生物信息學(bioinformatics)一詞。對于生物信息學的定義,不同

54、領域內(nèi)的人有不同的提法,因此至今尚無一個明確、簡單的定義。目前比較多的學者認為生物信息學是由于生命科學和計算機科學的迅速發(fā)展、相互交叉融合而衍生出來的一門新興的邊緣學科。它通過對生物學的實驗數(shù)據(jù)進行獲取、加工、存儲、檢,索與分析,進而達到揭示數(shù)據(jù)中所蘊含的生物學意義的目的。雖然生物信息學這一名詞創(chuàng)立于20世紀90年代初期,但其萌芽最早可追溯至20世紀60年代。早在1956年,便有人在美國田納西州召開了名為“生物學中的信息理論討論會”,而

55、就其發(fā)展而言,卻是一門相當年輕的學科。因此,無論從理論上來講還是從現(xiàn)實情況來看,它的誕生和發(fā)展都是應時代所需,是歷史的必然。2、生物信息學的誕生,20世紀后半葉,生命科學與分子生物學研究取得重要進展,特別是DNA測序技術的進步、人類基因組計劃(human genome project, HGP)的實施,人類迅速積累了大量的DNA序列數(shù)據(jù)。對此,傳統(tǒng)的研究方法難以快速消化這些數(shù)據(jù)產(chǎn)生新的知識。在這種強大的數(shù)據(jù)壓力之下,人們開始探索采用新

56、的數(shù)據(jù)分析方法來解決這一難題。與此同時,計算機技術的網(wǎng)絡技術進入了快速發(fā)展階段,人類的計算能力、信息傳遞與交互能,力得到了極大的提高,為解決這一難題提供了基本條件。人們的注意力逐漸聚焦到生物信息學,即通過計算機、網(wǎng)絡技術來解決生物學中的信息問題。3、生物信息學的工作方式生物信息學既然主要是利用計算機的網(wǎng)絡開展工作,當然其工作方法離不開計算機的內(nèi)容,比如數(shù)據(jù)庫、軟件、算法、分部式計算等等。數(shù)據(jù)庫,顧名思義就是數(shù)據(jù)的集合,也是生物信息學

57、工作的起點。目前,多數(shù)人,都是通過互聯(lián)網(wǎng)來訪問遠程數(shù)據(jù)庫系統(tǒng)。隨著數(shù)據(jù)庫的界面越來越友好,已能夠很容易地進行數(shù)據(jù)庫查詢等操作。軟件則是用戶面臨的主要操作對象,一般生物信息學軟件的獲得主要有以下幾種方法:①利用現(xiàn)有的免費或商業(yè)軟件,安裝在本地計算機上進行使用。免費軟件通??梢栽诨ヂ?lián)網(wǎng)上找到,并且下載,但服務上不及商業(yè)軟件那樣及時、便利。商業(yè)軟件的好處是有相應的安裝與維護,使用時有相應的說明可以參照進行,但,費用比較昂貴。對于免費軟件,在安

58、裝使用之前最好先閱讀軟件作者編寫的幫助文檔或使用說明之類的文件,以免安裝使用過程中走彎路。②通過互聯(lián)網(wǎng)瀏覽器程序、軟件客戶端程序或E-mail電子郵件程序向遠程服務器發(fā)送計算請求,軟件服務器端程序將在遠程服務器上進行計算,然后將計算結果返回至互聯(lián)網(wǎng)瀏覽器程序或者軟件客戶端程序,以及通過電子郵件方式返回服務器端運算結果。③自己動手編制程序。真正在研究工作,中,會發(fā)現(xiàn)任何現(xiàn)成的軟件都會有這樣或那樣的不足。這時可以自己動手,或者與計算機工作人

59、員進行合作,開發(fā)新的軟件以彌補現(xiàn)有軟件的不足。算法,顧名思義就是解決問題的計算方法,由于它比較抽象、枯燥,而且是隱含在軟件之中,一般人并不關心,在此不做詳細討論。(二)蛋白質組信息學概述由于蛋白質組學是從蛋白質的整體水平進行研究,這就決定了蛋白質組研究產(chǎn)生的數(shù)據(jù),具有高信息量的特點,比如那“滿天星”似的雙向凝膠電泳圖譜。為了有效而快速地對研究數(shù)據(jù)進行分析,生物信息學正在成為人們解決問題的希望所在。因此,蛋白質組學與生物信息學的相互交

60、叉、融合就顯得格外引人注目。本節(jié)介紹蛋白質組信息學的興起,其主要研究內(nèi)容以及未來的發(fā)展趨勢。1、蛋白質組信息學的興起前已述及,人類基因的計劃是生物信息學產(chǎn)生的主要動力之一。因此,通常談及的生物,信息學指的是其狹義概念,即基因組信息學。目前基因信息學的研究領域主要集中在以下幾個方面:大規(guī)?;蚪M測序中的信息分析;新基因和新SNP的發(fā)現(xiàn)與鑒定;非編碼區(qū)信息結構分析;遺傳密碼起源與生物進化的研究;完整基因組的比較研究;生物大分子的結構模擬

61、與藥物設計;生物信息學分析方法的研究等。隨著人類基因組計劃接近尾聲,生命科學已步入了后基因組時代。蛋白質組研究正是后基因組計劃中的一個重要,組成部分,由于蛋白質組研究高信息量的特點,其對生物信息學的渴望正在不斷加大,故圍繞蛋白質組研究而展開的生物信息學研究也正在逐漸興起,包括對蛋白質組研究的實驗數(shù)據(jù)進行獲取、加工、存貯、檢索與分析等。另外對蛋白質組研究的分析也導致了新的方法學問題,從數(shù)學角度來看并不是簡單的NP問題、動力系統(tǒng)問題或不確定

62、問題,而是基因表達的網(wǎng)絡問題,故需要發(fā)展新的方法和工具。因此,圍繞蛋白質組研究而開,展的蛋白質組信息學可視為生物信息學的一個新的分支。2、蛋白質組信息學的研究內(nèi)容目前蛋白質組研究采用的實驗方法,主要有雙向電泳、質譜、蛋白質微量測序、酵母雙雜交等。因為生物信息學是通過對生物學的實驗數(shù)據(jù)進行獲取、加工、存貯、檢索與分析,進而達到揭示數(shù)據(jù)中所蘊含的生物學意義的目的,故生物信息學在蛋白質組研究中的應用將主要圍繞雙向電泳、蛋白質測序等,實驗技

63、術進行生物信息的獲取、加工等。具體而言,大致有以下幾個方面:對雙向電泳結果進行圖像分析,從中尋找出疾病與生理狀態(tài)下表達有差異的蛋白質斑點、構建雙向電泳圖譜數(shù)據(jù)庫;參與對雙向電泳凝膠中的蛋白質斑點的鑒定,包括單獨或綜合運用質譜數(shù)據(jù)、氨基酸測序結果、氨基酸組成分析結果等數(shù)據(jù)查詢數(shù)據(jù)庫以鑒定蛋白質;輔助大規(guī)模的酵母雙雜交技術分析蛋白質之間的相互作用,包括構建細胞內(nèi)巨大的蛋白質相,互作用網(wǎng)絡(huge protein network)以及對蛋白

64、質相互作用進行功能分析(functionanalysis)等;對蛋白質結構與功能進行大規(guī)模的分析,有人稱之為計算蛋白質組學(computational proteomics)是蛋白質組信息學的又一重要內(nèi)容。3、蛋白質組生物信息學展望隨著蛋白質組研究的不斷深入,蛋白質組研究已出現(xiàn)技術平臺與信息處理一體化趨勢,例如早期蛋白質組研究采用的雙向凝膠電泳,、圖像分析、蛋白質鑒定等技術都是分開的。目前已有多家公司推出了整合實驗和信息處理一體化的

65、平臺,如Invertigator、Rosetta、Netgenics等。同時蛋白質組研究對生物信息學的要求正在不斷提高。隨著數(shù)據(jù)量的迅猛增加,數(shù)據(jù)庫容量正在不斷加大,造成數(shù)據(jù)庫維護成本不斷攀升;數(shù)據(jù)量快速增長同時導致數(shù)據(jù)分析任務的急劇加重,需要開發(fā)出功能越來越強大而使用越來越簡單的分析軟件,這些都使得個人、單個,的研究所和大學力不從心。為此,蛋白質組生物信息學出現(xiàn)了產(chǎn)業(yè)化的趨勢,越來越多的免費軟件轉化為商業(yè)化軟件;同時越來越多的計算機制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論