上回說到如何尋找保守序列,經過隆地熊我一番羅嗦,七七八八也該知道了些。當然,要想做到爐火純青,各位小白還得勤加練習。本回隆地熊我就要進入正題了,不然對不起這圖文題目。在做PCR引物設計前,首先得了解引物設計的基本原則。根據網上資料匯總(主要來自生物谷、生物秀、小木蟲、百度文庫等,特此一并感謝,具體不再詳細注明,如有異議,請聯系號主更改或刪除,隆地熊我不負任何責任,坑死你個懶鬼號主)和個人心得,現一并總結如下。
PCR引物設計基本原則:
1. 設計PCR引物前要明白三個設計初衷:
(1)引物要跟模板緊密結合;
(2)引物與引物之間不能有穩定的二聚體或發夾結構存在
(3)引物不能在別的非目的位點引起DNA聚合反應(即錯配)。
為實現這三個初衷,設計引物需要考慮很多因素,如引物長度(primerlength)、產物長度(productlength)、序列Tm值(meltingtemperature)、ΔG值(internalstability)、引物二聚體及發夾結構(duplexformation and hairpin)、錯誤引發位點(falsepriming site)、引物及產物GC 含量(composition),有時還要對引物進行修飾,如增加限制酶切點,引進突變等。
2. 以使用Oligo 軟件分析設計引物為例(個人認為Oligo軟件是最為專業的PCR引物設計軟件),進行PCR引物設計時應遵循的基本原則有:
引物的長度一般為15-30bp,常用的是18-27bp,但不能大于38,因為過長會導至其延伸溫度大于74℃,即Taq 酶的最適延伸溫度。
引物3’端的序列要比5’端重要。引物3’端的堿基一般不用A(3’端堿基序列最好是G、C、CG、GC),因為A在錯誤引發位點的引發效率相對比較高。另外引物間3’端的互補、二聚體或發夾結構也可能導至PCR反應失敗。5’端序列對PCR 影響不大,因此常用來引進修飾位點或標記物。
引物的GC含量一般為40-60%,以45-55%為宜,過高或過低都不利于引發反應。有一些模板本身的GC 含量偏低或偏高,導至引物的GC含量不能在上述范圍內,這時應盡量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火溫度的選擇。如果G-C比例超出,則在引物的5’端增加多個A或T;而如果A-T比例過高,則同樣在5’端增加多個G或C。完全沒有必要復雜地去計算產物和引物的解鏈溫度,PCR引物的GC/AT比率應當等于或高于所要放大的模板的GC/AT比。
引物所對應模板序列的Tm 值最好在72℃左右。(Tm 值曲線以選取72℃附近為佳,5’到3’的下降形狀也有利于引物引發聚合反應),至少要在55-80℃之間。
ΔG值(自由能)反映了引物與模板結合的強弱程度。一般情況下,引物的ΔG值最好呈正弦曲線形狀,即5’端和中間ΔG值較高,而3’端ΔG值相對較低,且不要超過9(ΔG值為負值,這里取絕對值),如此則有利于正確引發反應而可防止錯誤引發。3′末端雙鏈的ΔG是0~ -2kcal/mol時,PCR產量幾乎達到百分之百,隨著其絕對值的增加產量逐漸下降,在-6時只有40%、到-8時少于20%、而-10時接近于0。
可能的錯誤引發位點決定于引物序列組成與模板序列組成的相似性,相似性高則錯誤引發率高,錯誤引發的引發率一般不要高過100,如此可保證不出現非目的產物的假帶。但對于特定的模板序列,還應結合比較其在正確位點的引發效率。如果兩者相差很大,比如在正確位點的引發效率為450以上,而在錯誤位點的引發效率為130,并且不好找其他更合適的引物,那么這對引物也是可以接受的。
Frq 曲線為Oligo6新引進的一個指標,揭示了序列片斷存在的重復機率大小。選取引物時,宜選用Frq 值相對較低的片斷。
引物二聚體及發夾結構的能量一般不要超過4.5,否則容易產生引物二聚體帶而且會降低引物濃度從而導至PCR 正常反應不能進行,與二聚體相關的一個參數是堿基的分布,3’端的連續GGG或CCC 會導至錯誤引發。二聚體形成的能值越高越穩定,越不符合要求。與二聚體相同,發夾結構的能值越低越好。雖然有些帶有發夾環,其ΔG為-3 kcal/mol的自身互補引物也可以得到不錯的結果,但是如果它的3′末端被發夾環占據時就很麻煩,即會引發引物內部的延伸反應,減少了參與正式反應引物的數量。當然,如果發夾環在5′末端對反應就沒有多大的影響了。
以公式(4×G/C + 2×A/T-5)計算Tm值,即退火溫度。選擇較低Tm值的引物的退火溫度為反應的退火溫度。4-6℃的差別似乎對PCR產量影響不大。最好,保證每個引物的Tm值相匹配,且在70-75℃范圍內。
要知道,更重要的因素是模板與穩定性較小的引物之間解鏈溫度的差異。差異越小,PCR的效率越高。因為DNA的解鏈溫度也取決于它的長度,所以有的研究者喜歡設計很長,而不求它很穩定的引物。可是,引物太長就難以避免形成二聚體和自身互補,因此,一般還是不用為好。如果期待的產物長度等于或小于500 bp,選用短的(16~18 mer)的引物;若產物長5 kb,則用24 mer的引物。有人用20~23 mer引物得到40 kb的產物。
在DNA測序和PCR中最好用5′末端穩定(如GC含量較多),而3′末端不太穩定(如AT含量較多)的引物,這種引物的結構可以有效地消除假引發反應。這就是基于引物內部穩定性的經驗之談。其3′末端穩定性低的引物在這些反應中能起好作用的原因在于,接近或在3′末端上的堿基與非靶位點堿基所形成的配對的穩定程度還不足以引發DNA合成,所以不會產生假產物。因此,為了有效地引發反應,引物的5′末端和中央部分必須與靶DNA也形成雙鏈。與此相反,帶有穩定的、GC豐富的3′末端的寡核苷酸不需要其所有的核苷酸序列都與靶序列配對,只憑借其3′末端與靶序列任何位點的牢固配合就可以引發反應,產生非專一產物。無論如何,寡核苷酸3′末端最后5個核苷酸的穩定性小于-9kcal/mol的,通常就是專一性的探針或引物。寡核苷酸3′末端越不穩定,假引發的可能性越低。
如果用3′末端低穩定性的引物,反應的最適退火溫度范圍會不尋常的寬。這就可以不經過事先的最佳化實驗就能在最佳條件下進行反應。
引物的唯一性:為了放大單個的、專一性DNA片段,選用的引物序列就應當是唯一的,即在模板中沒有重復序列。如果用哺乳動物基因組序列作為模板,可以用Alu序列或其他短重復元件來核對想用的引物的互補性。由此也可知,應當避免使用同寡聚物(如-AAAAAA-)和二核苷酸重復(如-ATATAT-)。
引物和產物的Tm值不要相差太大,20攝氏度范圍內較好。定下引物的Tm值范圍之后即可定下引物的長度范圍。
對引物的修飾一般是增加酶切位點,應參考載體的限制酶識別序列確定,常常對上下游引物修飾的序列選用不同限制酶的識別序列,以有利于以后的工作。值得一提的是,各種模板的引物設計難度不一。有的模板本身條件較差,比如GC含量偏高或偏低,導至找不到各種指標都十分合適的引物;有時PCR產物要作為克隆對象插入到載體中表達,因此PCR引物設計的可選擇度很低。遇到這種情況只能退而求其次,盡量去滿足條件,這時,使用自動搜索引物及正確地評價引物可使研究人員對實驗心中有數。在設計克隆PCR引物時,引物兩端一般都添加酶切點,必然存在發夾結構,而且能值不會太低,這種PCR需要靈活調控退火溫度以達到最好效果,對引物的發夾結構的檢測就不應要求太高。
上述十四條原則值得你細細評味,如果都能理會并用于實踐的話,設計高手就一定會是你。能設計出一對效果非常好的PCR引物,仍然是能找到好工作的。比如說羅氏的PCR診斷試劑盒,少則數千,多則上萬,靠的是什么?明白人一看就知道是引物。乖乖,你買任何一種病原診斷試劑盒,能看得到引物序列嗎?不能,所以嘛,小白們,這就是未來的價值所在哦。好好去鉆研吧。