DNAMAN怎么导入测序峰图 DNAMAN峰图杂峰过多怎么校正-DNAMAN中文网站

　　当从测序公司拿回数据时，除了seq格式的序列文件，一般还会附上ab1、abi或scf这些峰图文件，要用好DNAMAN，先得弄清楚两件事情：怎么把这些测序峰图正确地导进去，以及万一峰图上杂峰太多，又能用什么办法来校正，处理时的要点是，不能光看那一排排碱基字母，而要回到色谱峰图上去，看一看每个位置上读出来的结果到底可不可靠。在Sanger测序得到的峰图文件里，其实打包了原始的峰形、电泳信号、碱基识别结果和相关的质量数据，ab1和scf都是很常见的trace文件格式。

　　一、DNAMAN怎么导入测序峰图

　　打算导入之前，最好先确认一下手头文件的格式，因为DNAMAN这个软件，比较擅长做序列分析、比对、引物设计和质粒图等等，万一当前这个版本没办法直接打开峰图，有一条变通的路子：先用测序仪附带的软件或者别的峰图查看工具，把序列导出成FASTA格式，然后再放进DNAMAN里做比对，DNAMAN本身是一款集成了多序列比对、限制性酶切和引物设计这些功能的分子生物学序列分析软件。

　　1、先试着把峰图文件打开

　　在DNAMAN里面，可以顺着菜单点【File】→【Open】，去选测序公司给过来的ab1、abi或者scf文件，如果软件认识这些格式，它会打开一个同时带着峰形曲线和碱基序列的窗口；要是打不开，就别在这里硬耗，先换其他能看峰图的软件把文件打开，再把碱基序列部分导出成纯文本。

　　2、接着导入序列文件

　　假如拿到的是seq、txt或者FASTA这类纯序列文件，直接通过【File】→【Open】导进去就好，导入完成以后，花一点时间检查一下序列的方向有没有反掉、长度是否正常，还有文件名里有没有标清楚是正向还是反向测序，免得把正反两股序列弄混了。

　　3、与参考序列进行比对

　　把测序结果和早就准备好的参考序列一起打开，然后执行序列比对，DNAMAN既能比对DNA序列，也能比对蛋白质序列，在比对前还可以按需圈出目标区域，并且微调一下比对参数，让出来的结果更有针对性。

　　4、把可疑的位点找出来

　　比对完以后，要多去看看突变位点、插入缺失的地方，还有引物附近的那几个碱基，只要发现测序序列跟参考序列对不上，就别只信软件自动判出来的那个碱基字母，要回头翻到峰图界面，亲眼瞧一瞧那个位置上的峰形是否清晰，有没有被旁边的峰干扰。

　　二、DNAMAN峰图杂峰过多怎么校正

　　一发现峰图上杂峰扎堆，先得判断一下：这到底是只有个别位点乱，还是整段信号的品质都很糟糕，如果仅仅是少数位点出了情况，多半是杂合、模板里混进了不同片段，或者局部读峰出了问题；反过来，如果整段都不行，那常见的原因就是模板不够纯、引物的特异性不强、PCR产物里面杂东西太多，或者测序反应本身就没成功。

　　1、把低质量的两端修剪掉

　　在Sanger测序里，序列的开头和末尾通常更容易出现矮峰、拖尾和杂峰挤在一起的现象，所以正式比对以前，比较稳妥的做法是，先把前面几十个碱基和末尾质量明显不行的区域给剪掉，很多测序软件在峰形模糊、碰到杂合峰或者信号被压缩的地方容易判错，这些区域就得靠人眼去核对。

　　2、检查单个位点上的峰形

　　一个正常、干净的单峰，它的形状应该是尖利的，背景信号很低，而且跟前后的峰之间分得比较开，如果在某个位置上，两个峰差不多高，那或许就是杂合或者混样；如果只是有个小小的杂峰贴在主峰旁边，通常还是以主峰为准，不过也要结合前后好几个峰的形态一起估量。

　　3、用反向测序交叉确认

　　对于那些特别关键的突变位点，一定不要只靠单一方向的测序结果就拍板，最稳当的办法是，再用反向引物去测一次，这样就有了正反两条方向的序列，把这两条拼到一块儿再做比对，要是在同一个位置上，正向和反向都给出了相同的改变，那这个结果的可信度就会高出一截。

　　4、不要硬着头皮手工改整段序列

　　要是打开峰图一看，整段序列的峰形都乱成一团，背景很高、主峰都分不清，那就不太适合在DNAMAN里一个碱基接一个碱基地去手工改了，碰到这种情形，更靠谱的做法是回到实验源头去查，看看PCR产物是不是单一的、引物设计得够不够特异、模板浓度合不合适，必要的话干脆重新纯化产物或者重新测一次。

　　三、DNAMAN峰图校正后怎么复核

　　按照前面这些步骤把峰图校正完以后，还不能直接就把改好的序列当成最终结果拿去用，得另外再做一轮复核，确保这些改动在实验的逻辑上是说得通的，而不光是让字母排得好看。

　　1、把原始文件好好留下

　　最初收到的ab1、scf，还有测序公司给的seq文件，一定要原原本本地留着，不要用修改后的版本把它盖掉，手工改好的序列，可以单独存成一份新文件，文件的名字最好带上样本名、测序方向和日期，方便以后查找。

　　2、重新跟参考序列比对一次

　　把修剪和校正过的序列，再拿来跟参考序列比上一回，看看那些原来被标出来的差异位点是不是变少了，插入或缺失会不会还顽固地留在那里，如果剩下来的差异大多都集中在两端质量不高的位置，那在解读的时候就要特别小心，不要轻易下结论。

　　3、检查阅读框

　　对于处在编码区的测序结果，最好是把校正好的DNA序列翻译成蛋白序列，去瞧瞧发生的突变到底是同义的、错义的、无义的，还是把阅读框给移掉了，要是翻译出来到处都冒出了提前终止的密码子，或者整段蛋白序列都跟参照对不上，那就应当优先怀疑序列的方向、拼接是不是出错了，或者峰图本身的质量靠不住。

　　4、把人工修改的地方一一记下来

　　凡是靠肉眼去手工校正过的每个碱基，都要把它的准确位置、原来判读成什么、现在改成了什么，还有为什么这么改的理由，都一条条写清楚，到准备正式报告的时候，也别只把最后那版序列往上一放，对那些有疑问的关键位点，最好是附上峰图的截图，让别人能一眼就看到当时的峰形到底是什么样的。

　　总结

　　总的来看，DNAMAN怎么导入测序峰图，DNAMAN峰图杂峰过多怎么校正，处理的顺序可以这样固定下来：先搞清楚拿到的ab1、abi、scf或FASTA文件能不能被软件直接接受；接着把测序结果跟参考序列做比对，一旦发现哪里有出入，就立刻回看峰图去核实；杂峰太多的时候，可以先修剪两端低质量的段落，再一个位点一个位点地查看峰形，关键的地方一定要拿反向测序进行交叉确认；如果整段峰图都很乱，就别想着靠手工修改序列硬撑，而应该回头去排查PCR产物、模板纯度和引物特异性这些上游环节。