傳統(tǒng)的蛋白鑒定方法,如免疫印跡法、內(nèi)肽的化學(xué)測序、已知或未知蛋白的comigration分析,或者在一個有機體中有意義的基因的過表達通常耗時、耗力,不適合高流通量的篩選。 目前,所選用的技術(shù)包括對于蛋白鑒定的圖象分析、微量測序、進一步對肽片段進行鑒定的氨基酸組分分析和與質(zhì)譜相關(guān)的技術(shù)。
1 圖象分析技術(shù)(Image analysis)
“滿天星”式的2-DE圖譜分析不能依靠本能的直覺,每一個圖象上斑點的上調(diào)、下調(diào)及出現(xiàn)、消失,都可能在生理和病理狀態(tài)下產(chǎn)生,必須依靠計算機為基礎(chǔ)的數(shù)據(jù)處理,進行定量分析。 在一系列高質(zhì)量的2-DE凝膠產(chǎn)生(低背景染色,高度的重復(fù)性)的前提下,圖象分析包括斑點檢測、背景消減、斑點配比和數(shù)據(jù)庫構(gòu)建。 首先,采集圖象通常所用的系統(tǒng)是電荷耦合CCD(charge coupled device)照相機;激光密度儀(laser densitometers)和Phospho或Fluoroimagers,對圖象進行數(shù)字化。 并成為以象素(pixels)為基礎(chǔ)的空間和網(wǎng)格。 其次,在圖象灰度水平上過濾和變形,進行圖象加工,以進行斑點檢測。 利用Laplacian,Gaussian,DOG(difference of Gaussians) opreator使有意義的區(qū)域與背景分離,精q限定斑點的強度、面積、周長和方向。
圖象分析檢測的斑點須與肉眼觀測的斑點一致。 在這一原則下,多數(shù)系統(tǒng)以控制斑點的重心或z高峰來分析,邊緣檢測的軟件可精q描述斑點外觀,并進行邊緣檢測和鄰近分析,以增加精q度。 通過閾值分析、邊緣檢測、銷蝕和擴大斑點檢測的基本工具還可恢復(fù)共遷移的斑點邊界。 以PC機為基礎(chǔ)的軟件Phoretix-2D正挑戰(zhàn)古老的Unix為基礎(chǔ)的2-D分析軟件包。 第三,一旦2-DE圖象上的斑點被檢測,許多圖象需要分析比較、增加、消減或均值化。 由于在2-DE中出現(xiàn)100%的重復(fù)性是很困難的,由此凝膠間的蛋白質(zhì)的配比對于圖象分析系統(tǒng)是一個挑戰(zhàn)。 IPG技術(shù)的出現(xiàn)已使斑點配比變得容易。 因此,較大程度的相似性可通過斑點配比向量算法在長度和平行度觀測。 用來配比的著名軟件系統(tǒng)包括Quest,Lips,Hermes,Gemini等,計算機方法如相似性、聚類分析、等級分類和主要因素分析已被采用,而神經(jīng)網(wǎng)絡(luò)、子波變換和實用分析在未來可被采用。 配比通常由一個人操作,其手工設(shè)定大約50個突出的斑點作為“路標(biāo)”,進行交叉配比。 之后,擴展至整個膠。
例如:精que的PI和MW(分子量)的估計通過參考圖上20個或更多的已知蛋白所組成的標(biāo)準(zhǔn)曲線來計算未知蛋白的PI和MW。 在凝膠圖象分析系統(tǒng)依據(jù)已知蛋白質(zhì)的pI值產(chǎn)生PI網(wǎng)絡(luò),使得凝膠上其它蛋白的PI按此分配。 所估計的j度大大依賴于所建網(wǎng)格的結(jié)構(gòu)及標(biāo)本的類型。 已知的未被修飾的大蛋白應(yīng)該作為標(biāo)志,變性的修飾的蛋白的PI估計約在±0。25個單位。 同理,已知蛋白的理論分子量可以從數(shù)據(jù)庫中計算,利用產(chǎn)生的表觀分子量的網(wǎng)格來估計蛋白的分子量。 未被修飾的小蛋白的錯誤率大約30%,而翻譯后蛋白的出入更大。 故需聯(lián)合其他的技術(shù)完成鑒定。
2 微量測序(microsequencing)
蛋白質(zhì)的微量測序已成為蛋白質(zhì)分析和鑒定的基石,可以提供足夠的信息。 盡管氨基酸組分分析和肽質(zhì)指紋譜(PMF)可鑒定由2-DE分離的蛋白,但普通的N-末端Edman降解仍然是進行鑒定的主要技術(shù)。 目前已實現(xiàn)蛋白質(zhì)微量測序的自動化。 首先使經(jīng)凝膠分離的蛋白質(zhì)直接印跡在PVDF膜或玻璃纖維膜上,染色、切割,然后直接置于測序儀中,可用于subpicomole水平的蛋白質(zhì)的鑒定。 但有幾點需注意:Edman降解很緩慢,序列以每40 min 1個氨基酸的速率產(chǎn)生;與質(zhì)譜相比,Edman降解消耗大;試劑昂貴,每個氨基酸花費3~4$。 這都說明泛化的Edman降解蛋白質(zhì)不適合分析成百上千的蛋白質(zhì)。 然而,如果在一個凝膠上僅有幾個有意義的蛋白質(zhì),或者如果其他技術(shù)無法測定而克隆其基因是必需的,則需要進行泛化的Edman降解測序。
近來,應(yīng)用自動化的Edman降解可產(chǎn)生短的N-末端序列標(biāo)簽,這是將質(zhì)譜的序列標(biāo)簽概念用于Edman降解,業(yè)已成為一種強有力的蛋白質(zhì)鑒定。 當(dāng)對Edman的硬件進行簡單改進,以迅速產(chǎn)生N-末端序列標(biāo)簽達10~20個/d,序列檢簽將適于在較小的蛋白質(zhì)組中進行鑒定。若聯(lián)合其他的蛋白質(zhì)屬性,如氨基酸組分分析、肽質(zhì)質(zhì)量、表現(xiàn)蛋白質(zhì)分子量、等電點,可以更加可信地鑒定蛋白質(zhì)。 選擇BLAST程序,可與數(shù)據(jù)庫相配比。 目前,采用一種Tagldent的檢索程序,還可以進行種間比較鑒定,又提高了其在蛋白質(zhì)組研究中的作用。
3 與質(zhì)譜(mass spectrometry)相關(guān)的技術(shù)
質(zhì)譜已成為連接蛋白質(zhì)與基因的重要技術(shù),開啟了大規(guī)模自動化的蛋白質(zhì)鑒定之門。 用來分析蛋白質(zhì)或多肽的質(zhì)譜有兩個主要的部分,1)樣品入機的離子源,2)測量被介入離子的分子量的裝置。 首先是基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜(MALDI-TOF)為一脈沖式的離子化技術(shù)。 它從固相標(biāo)本中產(chǎn)生離子,并在飛行管中測其分子量。 其次是電噴霧質(zhì)譜(ESI-MS),是一連續(xù)離子化的方法,從液相中產(chǎn)生離子,聯(lián)合四極質(zhì)譜或在飛行時間檢測器中測其分子量。 近年來,質(zhì)譜的裝置和技術(shù)有了長足的進展。
在MALDI-TOF中,重要的進步是離子反射器(ion reflectron)和延遲提?。╠elayed ion extraction),可達相當(dāng)精que的分子量。 在ESI-MS中,納米級電霧源(nano-electrospray source)的出現(xiàn)使得微升級的樣品在30~40 min內(nèi)分析成為可能。
將反相液相色譜和串聯(lián)質(zhì)譜(tandem MS)聯(lián)用,可在數(shù)十個picomole的水平檢測;若利用毛細管色譜與串聯(lián)質(zhì)譜聯(lián)用,則可在低picomole到高femtomole水平檢測;當(dāng)利用毛細管電泳與串聯(lián)質(zhì)譜連用時,可在小于femtomole的水平檢測。 甚至可在attomole水平進行。 目前多為酶解、液相色譜分離、串聯(lián)質(zhì)譜及計算機算法的聯(lián)合應(yīng)用鑒定蛋白質(zhì)。 下面以肽質(zhì)指紋術(shù)和肽片段的測序來說明怎樣通過質(zhì)譜來鑒定蛋白質(zhì)。
(1)肽質(zhì)指紋術(shù)(peptide mass fingerprint, PMF)
由Henzel等人于1993年提出。 用酶(z常用的是胰酶)對由2-DE分離的蛋白在膠上或在膜上于精氨酸或賴氨酸的C-末端處進行斷裂,斷裂所產(chǎn)生的精que的分子量通過質(zhì)譜來測量(MALDI-TOF-MS,或為ESI-MS),這一技術(shù)能夠完成的肽質(zhì)量可精que到0。1個分子量單位。 所有的肽質(zhì)量z后與數(shù)據(jù)庫中理論肽質(zhì)量相配比(理論肽是由實驗所用的酶來“斷裂”蛋白所產(chǎn)生的)。 配比的結(jié)果是按照數(shù)據(jù)庫中肽片段與未知蛋白共有的肽片段數(shù)目作一排行榜,“”肽片段可能代表一個未知蛋白。若冠亞軍之間的肽片段存在較大差異,且這個蛋白可與實驗所示的肽片段覆蓋良好,則說明正確鑒定的可能性較大。
(2)肽片段(peptide fragment)的部分測序
肽質(zhì)指紋術(shù)對其自身而言,不能揭示所衍生的肽片段或蛋白質(zhì)。 為進一步鑒定蛋白質(zhì),出現(xiàn)了一系列的質(zhì)譜方法用來描述肽片段。 用酶或化學(xué)方法從N-或C-末端按順序除去氨基酸,形成梯形肽片段(ladder peptide)。 首先以一種可控制的化學(xué)模式從N-末端降解,可產(chǎn)生大小不同的一系列的梯形肽片段,所得一定數(shù)目的肽質(zhì)量由MALDI-TOF-MS測量。 另一種方法涉及羧基肽酶的應(yīng)用,從C-末端除去不同數(shù)目的氨基酸形成肽片段。 化學(xué)法和酶法可產(chǎn)生相對較長的序列,其分子量精que至以區(qū)別賴氨酸(128。09)和谷氨酰胺(128。06)。 或者,在質(zhì)譜儀內(nèi)應(yīng)用源后衰變(post-source decay, PSD)和碰撞誘導(dǎo)解離(collision-induced dissociation, CID),目的是產(chǎn)生包含有僅異于一個氨基酸殘基質(zhì)量的一系列肽峰的質(zhì)譜。 因此,允許推斷肽片段序列。 肽片段PSD的分析在MALDI反應(yīng)器上能產(chǎn)生部分序列信息。 首先進行肽質(zhì)指紋鑒定。 之后,一個有意義的肽片段在質(zhì)譜儀被選作“母離子”,在飛行至離子反應(yīng)器的過程中降解為“子離子”。 在反應(yīng)器中,用逐漸降低的電壓可測量至檢測器的不同大小的片段。 但經(jīng)常產(chǎn)生不*的片段。 現(xiàn)在用肽片段來測序的方法始于70年代末的CID,可以一個三聯(lián)四極質(zhì)譜ESI-MS或MALDI-TOF-MS聯(lián)合碰撞器內(nèi)來完成。 在ESI-MS中,由電霧源產(chǎn)生的肽離子在質(zhì)譜儀的d一個四極質(zhì)譜中測量,有意義的肽片段被送至第二個四極質(zhì)譜中,惰性氣體轟擊使其成為碎片,所得產(chǎn)物在第三個四極質(zhì)譜中測量。 與MALDI-PSD相比,CID穩(wěn)定、強健、普遍,肽離子片段基本沿著酰胺鍵的主架被轟擊產(chǎn)生梯形序列。 連續(xù)的片段間差異決定此序列在那一點的氨基酸的質(zhì)量。 由此,序列可被推測。 由CID圖譜還可獲得的幾個序列的殘基,叫做“肽序列標(biāo)簽”。 這樣,聯(lián)合肽片段母離子的分子量和肽片段距N- C端的距離將足以鑒定一個蛋白質(zhì)。
4 氨基酸組分分析
1977年*作為鑒定蛋白質(zhì)的一種工具,是一種*的“腳印”技術(shù)。 利用蛋白質(zhì)異質(zhì)性的氨基酸組分特征,成為一種獨立于序列的屬性,不同于肽質(zhì)量或序列標(biāo)簽。 Latter*表明氨基酸組分的數(shù)據(jù)能用于從2-DE凝膠上鑒定蛋白質(zhì)。 通過放射標(biāo)記的氨基酸來測定蛋白質(zhì)的組分,或者將蛋白質(zhì)印跡到PVDF膜上,在155℃進行酸性水解1 h,通過這一簡單步驟的氨基酸的提取,每一樣品的氨基酸在40min內(nèi)自動衍生并由色譜分離,常規(guī)分析為100個蛋白質(zhì)/周。 依據(jù)代表兩組分間數(shù)目差異的分數(shù),對數(shù)據(jù)庫中的蛋白質(zhì)進行排榜,“”蛋白質(zhì)具有與未知蛋白質(zhì)相近的組分,考慮冠亞軍蛋白質(zhì)分數(shù)之間的差異,僅處于的蛋白質(zhì)的可信度大。 Internet上存在多個程序可用于氨基酸組分分析,如AACompIdent,ASA,F(xiàn)INDER,AAC-PI,PROP-SEARCH等,其中,在PROP-SEARCH中,組分、序列和氨基酸的位置被用來檢索同源蛋白質(zhì)。 但仍存在一些缺點,如由于不足的酸性水解或者部分降解會產(chǎn)生氨基酸的變異。 故應(yīng)聯(lián)合其他的蛋白質(zhì)屬性進行鑒定。