由于蛋白標簽可能會干擾目標蛋白質的正常功能,所以在完成其促進溶解或親和純化的作用后,標簽的去除對于生物學和功能研究很有幫助,對 GST 或 MBP 這樣的大標簽尤其如此,盡管有一些例子顯示融合了標簽的蛋白質更易結晶 (Smythetal.,2003)。
大多數用來向目標蛋白質添加標簽的商業化表達載體也引入了具有特殊序列的切割位點,使用重組的蛋白內切酶可以去除標簽。融合蛋白的親和純化完成后,可以使用蛋白內切酶來處理樣品以切掉標簽,再過一遍親和柱后標簽與重組蛋白會被分開,收集流穿液就會得到目標蛋白質。重組蛋白內切酶通常也會帶有親和標簽,這樣就可以在酶切反應完成后將其輕松去除。
表 16.3 列出了一些常用的蛋白內切酶。因為腸激酶和因子 Xa 在識別位點的 C 端進行切割,這樣就可以將標簽和識別位點序列完整去除,因此它們對去除 N 端的標簽非常有用。但是,這兩種酶有時特異性不是很強, 會在位于其他堿性殘基處的次級切割位點進行切割。凝血酶 (thrombin) 是另一個用于去除標簽的蛋白酶,它也具有相似的次級切割位點(JennyetaL,2003;LiewetaL,2005)。用凝血酶這樣的蛋白酶去除標簽,尤其是對于大規模的蛋白質制備, 與其他高特異性的酶相比,它的好處在于價格低廉且效率更高。
PreScission 蛋白酶是一種具有更長的、更嚴謹識別序列的特異性更高的蛋白酶。它由來自于人鼻病毒-14(humanrhinovirus-14) 的蛋白酶 3C(3Cpro) 和 GS 丁標簽組成,GST 標簽的存在使得該酶對于移除 GST 標簽非常有用。另外一種非常特異且受歡迎的蛋白酶是煙草蝕紋病毒蛋白酶(Kapustetal.,2001), 該酶切割位點后的第一個氨基酸傾向于甘氨酸 (表 16.3), 但也能夠容忍其他氨基酸殘基,只是切割活性會有少許下降。這使得該酶很多時候都能夠將 N 端標簽完整去除,在目標蛋白質上不會留下任何多余的殘基 (KapustetaL,2002)。可以很容易地自己制備大量的煙草蝕紋病毒蛋白酶,通常該酶會帶有一個組氨酸標簽以易于純化及在切割反應完成后將其除去(Tropeaetal.,2009)。
商業公司出售很多類型的煙草蝕紋病毒蛋白酶,它們有的帶有別的親和標簽,有的具有更高的活性及穩定性。
煙草蝕紋病毒蛋白酶的一個變種是煙草脈絡斑點病毒蛋白酶,其具有不同的識別序列 (Nallamsettyetal.,2004),能夠切開位于兩個不同標簽之間的切割位點(圖 16.1C)。
外切蛋白酶也可以用來去除 N 端標簽,如 TAGzyme 系統 (Arnauetal.,2006a,可從 Qiagen 公司購買)。這個方法使用/二肽氨基肽酶 I(dipeptideaminopeptidaseI,DAPase) 來逐步消化 N 端的標簽直至一個二肽的終止點。已經設計出了多種類似的系統用于處理不同的序列(Arnauetal.,2006b;2008)。
完整去除 C 端的標簽是比較困難的,因為大多數蛋白內切酶只在識別序列的 C 端進行切割。如果有必要完全去除標簽,可以設計更加特異的酶切位點,這些位點的識別是以結構為基礎的 (如 SUM? 蛋白酶;Malakhovetal.,2004)。或者利用自催化蛋白自剪接兀件(autocatalyticproteinself-splicingelement)(Inteins;SalehandPerler,2006)。這兩種切割系統都加上了親和純化標簽—SUM? 融合系統(Buttetal.,2005;Leeetal.,2008): 包括蛋白質內含子-幾丁質結合結構域 (chitin-bindingdomain,CBD; 由 NewEnglandBiolabs 公司將其作為商品化的 IMPACT 系統;Chongetal.,1997) 或蛋白質內含子-聚經基丁酸醋結合蛋白(polyhydroxybutyratebinding) 和類似的蛋白質純化系統 (Gilliesetal…?2008)。
在一些情況下,標簽也可以用化學方法去除。盡管化學切割方法所用試劑價格低廉并且非常有效,但是這些反應需要劇烈的溶劑及導致變性的條件, 所以通常只用于小肽的制備。溴化氰 (CNBr) 可切割甲硫氨酸,當融合蛋白能夠被設計成只有一個甲硫氨酸且位于標簽和目標肽段之間,可以使用這種試劑 (D6belietal.,1998;FairlieetaL,2002)。另外一種化學切割試劑,羥胺(hydroxylamine),能夠切割天冬酰胺與甘氨酸之間的肽鍵 (Huetal.,2008) 〇實際應用中需要考慮的問題: 盡管在標簽和目標蛋白質之間設計特異性的切割位點相對比較簡單,然而標簽的有效切割并不會總是發生且也難以預測。對于每一個表達構建體都要用實驗檢測切割效率。當使用特異性不強的酶時,還要檢測可能發生在次級切割位點的切割。通常酶的用量和孵育時間需要摸索以使其最優化。切割效率的最大化對于寡聚蛋白質尤其重要,為了目標蛋白質的高產量,必須去除每一個單體上的標簽 (Kenigetal.,2006)。需要切割的序列也需要在空間上能夠讓蛋白酶接觸得到,并且相對地沒有形成復雜結構; 在識別序列和目標蛋白質之間引入數個殘基的間隔序列或接頭序列,或者將不可能形成二級結構的序列放置在切割位點附近, 有時這都可以克服切割效率低下的問題。對于沒有親和標簽的蛋白酶來說,柱上切割 (將蛋白酶注入結合有融合蛋白的親和柱)比批式反應 (batchreaction) 更加有效。
很多種蛋白質標簽都可以用于促進重組蛋白的表達和純化。但是,即使有如此龐大的標簽庫, 結構基因組學的蛋白質制備機構得到可溶性純蛋白質的成功率也低于 50%(StructuralGenomicsConsortiumetal.,2008)。盡管這些大規模的研究項目設計出/許多很好的策略, 考慮到蛋白質折疊的多樣性及它們之間不同的生物化學性質,并沒有一套通用的可溶性或者親和標簽適用于所有蛋白質。標簽的選擇在很大程度上還是依賴于需要表達的蛋白質以及制備蛋白質的目的。在此,我們已經評述了大部分的有效的蛋白質表達標簽以及與它們使用相關的問題。