Since the proposal for pangenomic study, there have been a dozen software tools actively in use for pangenomic analysis. By the end of 2014, Panseq and the pan-genomes analysis pipeline (PGAP) ranked as the top two most popular packages according to cumulative citations of peer-reviewed scientific publications. The functions of the software packages and tools, albeit variable among them, include categorizing orthologous genes, calculating pangenomic profiles, integrating gene annotations, and constructing phylogenies. As epigenomic elements are being gradually revealed in prokaryotes, it is expected that pangenomic databases and toolkits have to be extended to handle information of detailed functional annotations for genes and non-protein-coding sequences including non-coding RNAs, insertion elements, and conserved structural elements. To develop better bioinformatic tools, user feedback and integration of novel features are both of essence.
在2005年, 泛基因组学概念被引入微生物研究中, 目前已开展多种生物的泛基因组学研究, 这也促进了泛基因组学分析软件和算法的开发。本文主要分析了目前使用较多和新近开发的12款泛基因组学分析软件的优缺点。虽然这些软件包各有特色,但是主要都集中在直系同源基因鉴定、泛基因组特征分析、基因注释的整合以及系统演化分析等几个方面。根据Web of science中收录的三大引文数据库中搜寻统计的信息,Panseq和PGAP是同行评审的科学出版物中引用次数最高的两个软件包。本文主要旨在帮助学生和生物信息学菜鸟迅速了解各类软件的功能特性, 为进行相关泛基因组学分析提供指导。另一方面,虽然已经有部分软件和算法被广泛使用,但仍存在许多提升空间,例如基因的详细注释以及非蛋白编码序列信息的分析等。作为一个较好的生物信息学工具,用户的反馈和新功能的开发无疑是两个非常重要的方面。
在2005年, 泛基因组学概念被引入微生物研究中, 目前已开展多种生物的泛基因组学研究, 这也促进了泛基因组学分析软件和算法的开发。本文主要分析了目前使用较多和新近开发的12款泛基因组学分析软件的优缺点。虽然这些软件包各有特色,但是主要都集中在直系同源基因鉴定、泛基因组特征分析、基因注释的整合以及系统演化分析等几个方面。根据Web of science中收录的三大引文数据库中搜寻统计的信息,Panseq和PGAP是同行评审的科学出版物中引用次数最高的两个软件包。本文主要旨在帮助学生和生物信息学菜鸟迅速了解各类软件的功能特性, 为进行相关泛基因组学分析提供指导。另一方面,虽然已经有部分软件和算法被广泛使用,但仍存在许多提升空间,例如基因的详细注释以及非蛋白编码序列信息的分析等。作为一个较好的生物信息学工具,用户的反馈和新功能的开发无疑是两个非常重要的方面。