做序列拼接时,很多人以为看到共识序列就算完成了,但真正交付往往要把拼接结果以FASTA或文本形式导出,并且把共识序列单独保存出来方便后续比对和注释。DNAMAN的常用做法是先在拼接或比对结果窗口里选中你要导出的对象,再从导出或保存入口选择格式与保存范围,避免只保存工程文件而忘了导出真正要交付的序列文件。
一、DNAMAN序列拼接怎么导出
导出拼接结果要先确认你导出的是原始reads、拼接后的contig,还是包含比对关系的拼接报告,不同对象对应的保存入口和格式会不一样。建议按先定位结果窗口再导出序列文件的顺序操作。
1、先定位到拼接结果所在窗口
完成拼接后切回显示拼接结果的窗口,确认当前显示的是拼接后的序列或contig列表,而不是单条序列编辑窗口;如果窗口里能看到多条序列与对齐关系,说明你在正确的结果视图里。
2、选中需要导出的拼接结果对象
在contig列表或结果树里点击你要导出的contig,若需要同时导出多个contig,按住Ctrl逐个点选,确保高亮选择范围覆盖你要交付的全部拼接结果。
3、从保存入口选择导出而不是仅保存工程
点击【File】进入【Save As】或【Export】,优先选择带Export含义的入口,这类入口一般会输出FASTA、文本或其他可交换格式;如果你只执行普通保存,通常只会保存项目或工作区,无法直接得到可用于下游分析的序列文件。
4、选择导出格式并确认序列名称规则
在格式选择里优先选FASTA作为通用格式,并检查导出的序列标题是否用contig名或样本名;如果你们有命名规范,建议在导出前先把contig重命名成可追溯的名称,避免导出后出现Contig1这类难以回溯的标题。
5、导出后做一次文件内容抽查
导出完成后用记事本或你们的序列查看器打开FASTA文件,确认每条序列前的>标题存在且序列无意外断行或夹杂空格,再把该文件作为交付件归档到项目目录。
二、DNAMAN拼接共识序列如何保存
共识序列保存的关键是先在拼接对齐视图里把共识序列显示出来并选中,再把它作为一条独立序列保存到序列库或导出为FASTA,避免共识只停留在屏幕显示层。
1、在拼接视图中显示共识序列行
在拼接或对齐窗口中找到共识序列的显示开关,通常在视图设置或右键菜单里能看到Consensus相关入口,开启后共识序列会以单独一行显示在对齐结果上方或下方。
2、选中共识序列并复制为独立序列
点击共识序列那一行使其成为当前对象,再在右键菜单里选择复制相关操作,把共识序列复制到新的序列对象中,确保它不依赖拼接窗口也能单独打开。
3、把共识序列保存到序列库便于后续管理
在新生成的共识序列对象上点击【File】进入【Save】或【Save As】,选择保存到你们的序列库或项目文件夹,文件名建议包含样本名与版本号,避免后续多轮拼接后分不清是哪一版共识。
4、需要下游分析时同时导出FASTA
如果共识序列要送去比对、注释或引物设计,建议在保存工程文件的同时再做一次FASTA导出,把共识序列作为单条FASTA输出,这样下游工具读取最稳定。
5、保存前先确认共识生成规则没有偏差
如果你在拼接前后调整过阈值或质量过滤,保存共识前先确认当前共识确实对应最新参数运行的结果,避免保存了旧共识而误以为是最新版本,后续比对时出现解释不一致。
三、导出与保存的交付口径
把拼接结果与共识序列真正交付出去,建议同时保留三份材料,拼接工程文件用于回溯,拼接结果FASTA用于下游,记录文本用于说明参数与版本,这样别人接手时不用猜你是怎么拼出来的。
1、同时保存工程文件用于复现
先把当前项目或工作区保存一份,文件名带日期与版本号,确保以后能回到同一界面复现拼接与共识生成过程。
2、输出拼接结果FASTA作为主要交付件
把每个contig或拼接后序列导出为FASTA,按样本或片段分文件存放,文件名写清样本与片段,便于后续批量比对与注释。
3、单独输出共识序列FASTA便于引用
共识序列建议单独导出成一个FASTA文件,文件名写清Consensus,后续写报告或做数据库提交时直接引用这份文件即可。
4、保留参数与版本记录降低沟通成本
把拼接用到的关键口径如重叠长度、错配容忍、质量过滤规则写成一段文本与文件同目录保存,别人拿到结果能快速理解差异来自参数还是样本。
5、导出后抽查长度与关键位点
用任意序列查看器抽查共识序列长度是否符合预期,并检查几个关键位点是否存在大量N或空缺,发现异常先回到拼接视图核对原始reads覆盖情况,再决定是否需要重新拼接。
总结
DNAMAN序列拼接导出建议在拼接结果窗口选中contig后通过带Export含义的入口输出FASTA等通用格式,并在导出前把contig命名改成可追溯口径;共识序列保存则应在拼接视图启用Consensus显示并把共识复制成独立序列对象,再用保存或导出把它单独输出为文件,同时保留工程文件与参数记录,保证结果可复现可交付。
