diamond是2015年nature methods上发布的一款新的比对软件,据说是一款比比对到NCBI-NR蛋白参考库更快更灵敏的软件。在比对短的reads比BLASTX快20000倍,并且具有相似的准确度。 参考文章: Benjamin Buchfink, Chao Xie, and Daniel H. Huson. Fast and sensitive protein alignment using diamond. Nature methods, 12(1):59–60, Jan 2015 介绍diamond是一款比对 protein和检索translated DNA,用于高性能分析大序列数据的软件。关键优势在于:
简介原文链接: https://github.com/bbuchfink/diamond/blob/master/README.rst 安装下载地址: https://github.com/bbuchfink/diamond 利用wget进行下载安装: wget http://github.com/bbuchfink/diamond/releases/download/v0.9.22/diamond-linux64.tar.gz* 安装完毕可以diamond version或者diamond help一下,检测是不是安装成功
运行第一步: 建立diamond格式的database. 输入文件为fasta格式,生成一个 diamond makedb --in Oryza_sativa.IRGSP-1.0.pep.all.fa -d Oryza_sativa 第二步 :比对, 比对可以是blastx也可以是blastp,下面以blastp为例blastx一样处理 E:\master\group_classification\2018\perl and flow 2\ref_num\ --db/-d 输出的文件格式介绍: 0 BLAST pairwise format. 其他参数说明: --max-target-seqs/-k 比对到的最大序列数,默认值是25。--top 百分数的形式表示--max-target-seqs --evalue/-e 比对的最大evalue值(默认0.001) --min-score 最小评分 --id 给出指定百分比的数据 --subject-cover 最小覆盖度 --unal (0,1) 是否输出未比对上的reads(0=no, 1=yes) --sensitive 建议对齐较长的序列 --more-sensitive 比对准确度更高
这里列出的参数只是我认为比较常用的,如果想要更详细的参数介绍还是去看manual 求助: 最近在找一个可以对蛋白进行全局比对并且运行速度还不慢的软件,希望知道的小伙伴们推荐一下,谢谢!! |