簡(jiǎn)并引物設(shè)計(jì)方法(實(shí)際操作步驟)
更新時(shí)間:2012-06-10 點(diǎn)擊次數(shù):4006
http://www.genecool.com/?fromuid=102401
自己做過(guò)一些簡(jiǎn)并引物,現(xiàn)將我利用生物信息學(xué)資源設(shè)計(jì)簡(jiǎn)并引物的各個(gè)步驟作一個(gè)總結(jié),各位戰(zhàn)友可將各自的心得體會(huì)寫下,以便大家交流?。?!
一、利用ncbi搜索不同物種中同一目的基因的蛋白或cDNA編碼的氨基酸序列
因?yàn)槊艽a子的關(guān)系,不同的核酸序列可能表達(dá)的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。首先利用NCBI的Entrez檢索系統(tǒng),查找到一條相關(guān)序列即可。隨后利用這一序列使用BLASTp(通過(guò)蛋白查蛋白),在整個(gè)Nr數(shù)據(jù)庫(kù)中中查找與之相似的氨基酸序列。
二、對(duì)所找到的序列進(jìn)行多序列比對(duì)
將搜索到的同一基因的不同氨基酸序列進(jìn)行多序列比對(duì),可選工具有Clustal W,也可在線分析[url][/url]http://www.ebi.ac.uk/clustalw/ 。其結(jié)果入下圖所示,所有序列的共有部分將會(huì)顯示出來(lái)。“*”表示保守,“:”表示次保守。
三、確定合適的保守區(qū)域
設(shè)計(jì)簡(jiǎn)并引物至少需要上下游各有一個(gè)保守區(qū)域,且兩個(gè)保守區(qū)域相距50~ 400個(gè)aa為宜,使得pcr產(chǎn)物在150~1200bp之間,zui重要的是每一個(gè)保守區(qū)域至少有6個(gè)aa殘基,因?yàn)槊織l引物至少18bp左右。若比對(duì)結(jié)果保守性不是很強(qiáng)很可能找不到6個(gè)aa的保守區(qū)域,這時(shí)可以根據(jù)物種的親緣關(guān)系,選擇親緣相近的物種進(jìn)行二次比對(duì),若保守性仍達(dá)不到要求,則需進(jìn)行三次比對(duì)??傊?,究竟要選多少序列來(lái)比對(duì),要根據(jù)前一次比對(duì)的結(jié)果反復(fù)調(diào)整。zui終目的就是有兩個(gè)6個(gè)aa且兩者間距離合適的保守區(qū)域。
四、利用軟件設(shè)計(jì)引物
當(dāng)?shù)玫奖J貐^(qū)域后,就可以利用專業(yè)的軟件來(lái)設(shè)計(jì)引物了,其中pp5支持簡(jiǎn)并引物的設(shè)計(jì)(關(guān)于其的使用請(qǐng)見筆者的另一個(gè)帖子http://www.dxy.cn/bbs/post/view?bid=67&id=8798113&sty=1),將參與多序列比對(duì)的序列中的任一條導(dǎo)入pp5中,再將其翻譯成核苷酸序列,有密碼子簡(jiǎn)并性,其結(jié)果是有n多條彼此只相差以個(gè)核苷酸的序列群,該群可用一條有簡(jiǎn)并性的核苷酸鏈來(lái)表示(其中R=A/G,Y=C/T,M=A/C,K=G/T,S=C/G,W= A/T,H= A/C/T,B= C/G/T,V=A/C/G, D=A/G /T,N=A/C/G/T),該具有簡(jiǎn)并性的核苷酸鏈必然包含上一步中找到的氨基酸保守區(qū)域的對(duì)應(yīng)部分,在pp5中修改參數(shù),令其在兩個(gè)距離合適的保守的nt區(qū)域內(nèi)尋找引物對(duì),總之要保證上下游引物都落在該簡(jiǎn)并鏈的保守區(qū)域內(nèi),結(jié)果會(huì)有數(shù)對(duì),分?jǐn)?shù)越高越好。
五、對(duì)引物的修飾
若得到的引物為:
5-NAGSGNGCDTTANCABK-3
則其簡(jiǎn)并度=4×2×4×3×4×3×2=2304,很明顯該條引物的簡(jiǎn)并度多高不利于pcr。我們可以通過(guò)用次黃嘌呤代替N(因?yàn)榇吸S嘌呤能很好的和4種堿基配對(duì))和根據(jù)物種密碼子偏好這兩種方法來(lái)降低簡(jiǎn)并度(有個(gè)查密碼子偏好的數(shù)據(jù)庫(kù)我以前發(fā)過(guò)大家搜索一下把)。
zui后,這樣子設(shè)計(jì)出來(lái)簡(jiǎn)并引物對(duì),適用于用于比對(duì)的氨基酸序列所屬物種及與這些物種分類地位相同的其他物種。