DNAMAN中文网站 > 新手入门 > DNAMAN怎么导入测序峰图 DNAMAN峰图杂峰过多怎么校正
DNAMAN怎么导入测序峰图 DNAMAN峰图杂峰过多怎么校正
发布时间:2026/06/29 13:35:23

  当从测序公司拿回数据时,除了seq格式的序列文件,一般还会附上ab1、abi或scf这些峰图文件,要用好DNAMAN,先得弄清楚两件事情:怎么把这些测序峰图正确地导进去,以及万一峰图上杂峰太多,又能用什么办法来校正,处理时的要点是,不能光看那一排排碱基字母,而要回到色谱峰图上去,看一看每个位置上读出来的结果到底可不可靠。在Sanger测序得到的峰图文件里,其实打包了原始的峰形、电泳信号、碱基识别结果和相关的质量数据,ab1和scf都是很常见的trace文件格式。

  一、DNAMAN怎么导入测序峰图

 

  打算导入之前,最好先确认一下手头文件的格式,因为DNAMAN这个软件,比较擅长做序列分析、比对、引物设计和质粒图等等,万一当前这个版本没办法直接打开峰图,有一条变通的路子:先用测序仪附带的软件或者别的峰图查看工具,把序列导出成FASTA格式,然后再放进DNAMAN里做比对,DNAMAN本身是一款集成了多序列比对、限制性酶切和引物设计这些功能的分子生物学序列分析软件。

 

  1、先试着把峰图文件打开

 

  在DNAMAN里面,可以顺着菜单点【File】→【Open】,去选测序公司给过来的ab1、abi或者scf文件,如果软件认识这些格式,它会打开一个同时带着峰形曲线和碱基序列的窗口;要是打不开,就别在这里硬耗,先换其他能看峰图的软件把文件打开,再把碱基序列部分导出成纯文本。

 

  2、接着导入序列文件

 

  假如拿到的是seq、txt或者FASTA这类纯序列文件,直接通过【File】→【Open】导进去就好,导入完成以后,花一点时间检查一下序列的方向有没有反掉、长度是否正常,还有文件名里有没有标清楚是正向还是反向测序,免得把正反两股序列弄混了。

 

  3、与参考序列进行比对

 

  把测序结果和早就准备好的参考序列一起打开,然后执行序列比对,DNAMAN既能比对DNA序列,也能比对蛋白质序列,在比对前还可以按需圈出目标区域,并且微调一下比对参数,让出来的结果更有针对性。

 

  4、把可疑的位点找出来

 

  比对完以后,要多去看看突变位点、插入缺失的地方,还有引物附近的那几个碱基,只要发现测序序列跟参考序列对不上,就别只信软件自动判出来的那个碱基字母,要回头翻到峰图界面,亲眼瞧一瞧那个位置上的峰形是否清晰,有没有被旁边的峰干扰。

 

  二、DNAMAN峰图杂峰过多怎么校正

 

  一发现峰图上杂峰扎堆,先得判断一下:这到底是只有个别位点乱,还是整段信号的品质都很糟糕,如果仅仅是少数位点出了情况,多半是杂合、模板里混进了不同片段,或者局部读峰出了问题;反过来,如果整段都不行,那常见的原因就是模板不够纯、引物的特异性不强、PCR产物里面杂东西太多,或者测序反应本身就没成功。

 

  1、把低质量的两端修剪掉

 

  在Sanger测序里,序列的开头和末尾通常更容易出现矮峰、拖尾和杂峰挤在一起的现象,所以正式比对以前,比较稳妥的做法是,先把前面几十个碱基和末尾质量明显不行的区域给剪掉,很多测序软件在峰形模糊、碰到杂合峰或者信号被压缩的地方容易判错,这些区域就得靠人眼去核对。

  2、检查单个位点上的峰形

 

  一个正常、干净的单峰,它的形状应该是尖利的,背景信号很低,而且跟前后的峰之间分得比较开,如果在某个位置上,两个峰差不多高,那或许就是杂合或者混样;如果只是有个小小的杂峰贴在主峰旁边,通常还是以主峰为准,不过也要结合前后好几个峰的形态一起估量。

 

  3、用反向测序交叉确认

 

  对于那些特别关键的突变位点,一定不要只靠单一方向的测序结果就拍板,最稳当的办法是,再用反向引物去测一次,这样就有了正反两条方向的序列,把这两条拼到一块儿再做比对,要是在同一个位置上,正向和反向都给出了相同的改变,那这个结果的可信度就会高出一截。

 

  4、不要硬着头皮手工改整段序列

 

  要是打开峰图一看,整段序列的峰形都乱成一团,背景很高、主峰都分不清,那就不太适合在DNAMAN里一个碱基接一个碱基地去手工改了,碰到这种情形,更靠谱的做法是回到实验源头去查,看看PCR产物是不是单一的、引物设计得够不够特异、模板浓度合不合适,必要的话干脆重新纯化产物或者重新测一次。

 

  三、DNAMAN峰图校正后怎么复核

 

  按照前面这些步骤把峰图校正完以后,还不能直接就把改好的序列当成最终结果拿去用,得另外再做一轮复核,确保这些改动在实验的逻辑上是说得通的,而不光是让字母排得好看。

 

  1、把原始文件好好留下

 

  最初收到的ab1、scf,还有测序公司给的seq文件,一定要原原本本地留着,不要用修改后的版本把它盖掉,手工改好的序列,可以单独存成一份新文件,文件的名字最好带上样本名、测序方向和日期,方便以后查找。

 

  2、重新跟参考序列比对一次

 

  把修剪和校正过的序列,再拿来跟参考序列比上一回,看看那些原来被标出来的差异位点是不是变少了,插入或缺失会不会还顽固地留在那里,如果剩下来的差异大多都集中在两端质量不高的位置,那在解读的时候就要特别小心,不要轻易下结论。

 

  3、检查阅读框

 

  对于处在编码区的测序结果,最好是把校正好的DNA序列翻译成蛋白序列,去瞧瞧发生的突变到底是同义的、错义的、无义的,还是把阅读框给移掉了,要是翻译出来到处都冒出了提前终止的密码子,或者整段蛋白序列都跟参照对不上,那就应当优先怀疑序列的方向、拼接是不是出错了,或者峰图本身的质量靠不住。

 

  4、把人工修改的地方一一记下来

 

  凡是靠肉眼去手工校正过的每个碱基,都要把它的准确位置、原来判读成什么、现在改成了什么,还有为什么这么改的理由,都一条条写清楚,到准备正式报告的时候,也别只把最后那版序列往上一放,对那些有疑问的关键位点,最好是附上峰图的截图,让别人能一眼就看到当时的峰形到底是什么样的。

  总结

 

  总的来看,DNAMAN怎么导入测序峰图,DNAMAN峰图杂峰过多怎么校正,处理的顺序可以这样固定下来:先搞清楚拿到的ab1、abi、scf或FASTA文件能不能被软件直接接受;接着把测序结果跟参考序列做比对,一旦发现哪里有出入,就立刻回看峰图去核实;杂峰太多的时候,可以先修剪两端低质量的段落,再一个位点一个位点地查看峰形,关键的地方一定要拿反向测序进行交叉确认;如果整段峰图都很乱,就别想着靠手工修改序列硬撑,而应该回头去排查PCR产物、模板纯度和引物特异性这些上游环节。

135 2431 0251