News

2023年度“中国生物信息学十大进展”公布

ADMIN | 2024-03-15 23:50:41

为推动我国生物信息学的学科发展和创新研究，充分展示和宣传我国生物信息学领域的重大研究成果，《基因组蛋白质组与生物信息学报（英文）》（Genomics, Proteomics & Bioinformatics, 简称GPB）组织评选了2018年度、2019年度、2020年度、2021年度和2022年度“中国生物信息学十大进展”。在此基础上，GPB继续组织2023年度评选活动，经过100余名国内外生物信息学领域教授/研究员推荐，初选、复选投票，以及复核程序，现公布2023年度“中国生物信息学十大进展”评选结果（排名不分先后，按标题首字母顺序排序）。

感谢所有专家秉持专业和公正的态度参与本年度十大进展的推荐和评选；祝贺所有入选工作的团队！同时祝愿大家在2024新的一年里健康平安、工作顺利、大展宏图、硕果累累！

评审委员会

2024年3月16日

微信图片_20240316195602.png

泛癌种自然杀伤细胞异质性的生物信息学解析

自然杀伤（NK）细胞是抗肿瘤免疫反应的关键，但对其在不同患者、癌种间的异质性研究仍十分有限。北京大学张泽民、王东方、朱琳楠团队与中国科学技术大学彭慧团队合作，以大规模单细胞测序数据的生物信息学整合为支撑，系统性揭示了NK细胞在不同癌症类型和组织之间的异质性规律，首次定义了癌组织特异富集、杀伤功能受损的NK细胞亚类，该群细胞在泛癌种水平上与患者不良预后及免疫治疗耐受相关；研究还发现LAMP3+树突状细胞是导致癌组织中NK功能受损的关键。该研究提供了准确、全面的肿瘤浸润NK细胞图谱，助力开发新型以NK细胞为基础的肿瘤治疗策略。

该成果发表于Cell

推荐理由：首个人类自然杀伤细胞的泛癌图谱

图：生物信息学整合分析揭示NK细胞的泛癌种异质性规律

数据链接

http://pan-nk.cancer-pku.cn/

原文信息

Tang F, Li J, Qi L, Liu D, Bo Y, Qin S, et al. A pan-cancer single-cell panorama of human natural killer cells. Cell 2023;186:4235–51.e20. PMID: 37607536.

原文链接

https://doi.org/10.1016/j.cell.2023.07.034

▲ 长按阅读原文

人类和小鼠细胞身份识别及单细胞功能分析平台——CellMarker 2.0

细胞是构成生命体的基本单元，细胞身份识别是十分重要的。哈尔滨医科大学张云鹏教授团队开发了人类和小鼠细胞身份识别的分析平台——CellMarker 2.0。该平台资源丰富，涵盖人类和小鼠656个组织，2578个细胞类型，26,915个细胞标记，共计83,361个组织-细胞类型-细胞标记条目可用于细胞身份识别。该平台还拥有细胞注释、细胞聚类、细胞分化轨迹等六项单细胞数据分析及可视化展示功能。CellMarker 2.0自发布以来获得了全球超100个国家和地区用户的158,000余次访问，是识别人类和小鼠千万种细胞身份的宝贵资源。文章被Web of Science 列为生物学与生物化学领域ESI热点论文。

该成果发表于Nucleic Acids Research

推荐理由：提供了人/鼠不同细胞类型的分子标志物的高质量数据

图：CellMarker 2.0细胞身份识别及单细胞功能分析平台

数据库链接

http://bio-bigdata.hrbmu.edu.cn/CellMarker/

http://117.50.127.228/CellMarker/

原文信息

Hu C, Li T, Xu Y, Zhang X, Li F, Bai J, et al. CellMarker 2.0: an updated database of manually curated cell markers in human/mouse and web tools based on scRNA-seq data. Nucleic Acids Research 2023;51:D870–6. PMID: 36300619.

原文链接

https://academic.oup.com/nar/article/51/D1/D870/6775381

▲ 长按阅读原文

揭示基因组重复序列Alu调控转录新机制

人类基因组含有大量功能不明的重复序列，导致基因组巨大、转录调控极其复杂，使得解析人类遗传信息如何精准传递异常困难。中国科学院生物物理研究所薛愿超团队利用自主创建的RNA原位构象测序（RIC-seq）技术，绘制了细胞核内精细的RNA—RNA互作图谱，率先发现互补性Alu重复序列可介导增强子—启动子的配对选择特异性和转录激活。更重要的是，通过构建“突变-功能”图谱，系统注释了疾病相关非编码突变的分子功能，并在细胞和动物水平进行了深入的验证。该研究揭示了重复序列Alu在人类遗传信息精确传递过程中的基本规则，为重大疾病的精准医疗和致病机理研究提供了新策略。

该成果发表于Nature

推荐理由：揭示了增强子与启动子交互的选择性

图：“增强子-启动子互作图谱”以及“突变-功能图谱”构建

原文信息

Liang L, Cao C, Ji L, Cai Z, Wang D, Ye R, et al. Complementary Alu sequences mediate enhancer-promoter selectivity. Nature 2023;619:868–75. PMID: 37438529.

原文链接

https://doi.org/10.1038/s41586-023-06323-x

▲ 长按阅读原文

我国生命组学数据资源体系建设成效显著

中国科学院北京基因组研究所（国家生物信息中心）国家基因组科学数据中心（CNCB-NGDC）已连续7年被Nucleic Acids Research称为与美国国家生物技术信息中心（NCBI）、欧洲生物信息研究所（EBI）并列的全球主要生物数据中心。2023年，CNCB-NGDC协同国内共建和合作单位，强化多组学数据整合与知识融合，新建、升级并扩展了多个核心数据库，建成了原始测序、表达、表观、生物多样性等9大主题资源体系，为国家基因组科学数据的汇交共享、安全管理和挖掘利用提供了重要支撑。其中，组学原始数据归档库（GSA）成功入选全球核心生物数据资源（GCBR），是我国目前唯一入选的数据库。

该成果发表于Nucleic Acids Research

推荐理由：筑造中国生物数据资源根基

图：CNCB-NGDC多组学数据资源体系

数据库链接

https://ngdc.cncb.ac.cn

原文信息

CNCB-NGDC Members and Partners. Database resources of the National Genomics Data Center, China National Center for Bioinformation in 2023. Nucleic Acids Research 2023;51:D18–28. PMID: 36420893.

原文链接

https://academic.oup.com/nar/article/51/D1/D18/6845434

▲ 长按阅读原文

结构驱动的碱基编辑器开发与应用

碱基编辑可在单碱基精度实现精准遗传操纵，是基因功能研究、疾病治疗、生物育种的变革性技术之一，但其核心底盘脱氨酶难以满足多元化的应用需求。中国科学院遗传与发育生物学研究所高彩霞团队联合北京齐禾生科生物科技有限公司赵天萌团队，创新性地运用人工智能辅助的蛋白结构预测，建立了基于蛋白质三级结构的高通量聚类分析新方法，实现了脱氨酶功能结构的深入挖掘。一系列新挖掘的脱氨酶被开发为具有我国自主专利的新型碱基编辑工具，具有紧凑、高效、特异、功能多样等特点，解决了医学领域单个腺相关病毒（AAV）递送及农业领域大豆高效碱基编辑的应用难题。

该成果发表于Cell

推荐理由：人工智能指导的蛋白质结构聚类，助力研发新型碱基编辑工具

图：新型碱基编辑器开发与应用

数据链接

https://www.ncbi.nlm.nih.gov/bioproject/PRJNA915939/

https://www.ncbi.nlm.nih.gov/bioproject/PRJNA915940/

https://www.ncbi.nlm.nih.gov/bioproject/PRJNA915941/

https://www.ncbi.nlm.nih.gov/bioproject/PRJNA915942/

https://www.addgene.org/browse/article/28238292/

原文信息

Huang J, Lin Q, Fei H, He Z, Xu H, Li Y, et al. Discovery of deaminase functions by structure-based protein clustering. Cell 2023;186:3182–95.e14. PMID: 37379837.

原文链接

https://www.cell.com/cell/abstract/S0092-8674(23)00593-7

▲ 长按阅读原文

新方法实现单细胞命运轨迹的精确预测——PhyloVelo

细胞命运决定是生命的奥秘之一，揭示其规律和机制对于理解发育和疾病具有重要意义。然而，如何利用静态单细胞组学数据预测动态命运决定过程是生物信息学领域的一项重大挑战。中国科学院深圳先进技术研究院胡政和厦门大学周达团队合作提出了一项基于单调表达基因的轨迹推断新算法框架，命名为PhyloVelo。该方法通过整合谱系示踪和单细胞转录组数据，利用单调表达基因构建一个新颖的细胞分化时钟模型，能准确预测细胞过往状态和分化轨迹。相比传统方法，PhyloVelo在推断准确性和稳定性方面都有明显提升，为发育和疾病研究提供了有力的计算分析工具。

该成果发表于Nature Biotechnology

推荐理由：基于谱系示踪信息精确计算RNA速率的新方法

图：基于单调表达基因的细胞分化轨迹推断新框架（PhyloVelo）

在线使用文档

https://phylovelo.readthedocs.io/en/latest/index.html

原文信息

Wang K, Hou L, Wang X, Zhai X, Lu Z, Zi Z, et al. PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes. Nature Biotechnology 2023. https://doi.org/10.1038/s41587-023-01887-5. PMID: 37524958.

原文链接

https://www.nature.com/articles/s41587-023-01887-5

▲ 长按阅读原文

单液滴细胞外囊泡异质性解析新技术——SEVtras

胞外小囊泡（sEVs）是细胞间信息交流的关键环节，它们在免疫反应、病毒致病和癌症发生发展中发挥着重要作用。目前仍缺乏有效的研究手段来高效解析胞外小囊泡的异质性，以及深入揭示细胞对胞外小囊泡的分泌状态。中国科学院北京生命科学研究院赵方庆/冀培丰团队首次建立了胞外小囊泡异质性追踪算法SEVtras，并提出胞外小囊泡分泌活性指标，从细胞外尺度刻画了不同类型细胞的生理活动状态。该研究填补了胞外囊泡组学异质性追踪的空白，为海量单细胞转录组学数据的解析提供了独特的胞外视角。

该成果发表于Nature Methods

推荐理由：从单细胞转录组数据中解码胞外小囊泡的异质性

图：SEVtras追踪胞外小囊泡异质性

工具链接

https://github.com/bioinfo-biols/SEVtras

原文信息

He R, Zhu J, Ji P, Zhao F. SEVtras delineates small extracellular vesicles at droplet resolution from single-cell transcriptomes. Nature Methods 2024;21:259–66. PMID: 38049696.

原文链接

https://doi.org/10.1038/s41592-023-02117-1

▲ 长按阅读原文

空间多组学数据库及分析算法——SODB

近年来快速发展的空间组学技术（spatial omics）可同时测量细胞/组织的分子表达及空间位置信息，为解析组织微环境提供了条件。腾讯AI Lab姚建华团队、复旦大学原致远团队、德州大学达拉斯分校张奇伟团队合作开发了空间多组学数据库SODB，提供了丰富的空间多组学数据资源和分析算法。SODB利用跨模态空间多组学数据共性，将异质性数据标准化为统一数据结构。SODB采用分布式计算和树型存储设计，处理了超过6000万个细胞的空间多组学数据。SODB提出了组织空间分子景观可视化算法SOView，支持交互式分析组织结构及marker基因，支持多种空间组学分析算法的基准研究。

该成果发表于Nature Methods

推荐理由：领域最大的空间多组学数据库

图：SODB支持多种算法的基准研究

数据库链接

https://gene.ai.tencent.com/SpatialOmics/

原文信息

Yuan Z, Pan W, Zhao X, Zhao F, Xu Z, Li X. et al. SODB facilitates comprehensive exploration of spatial omics data. Nature Methods 2023;20:387–99. PMID: 36797409.

原文链接

https://doi.org/10.1038/s41592-023-01773-7

▲ 长按阅读原文

肿瘤免疫治疗相关的基因表达资源——TIGER

免疫治疗引领了癌症治疗模式的变革，然而在非筛选人群中其获益率并不高，亟需开发新型的免疫治疗策略和精准的疗效预测标志物。中山大学任间、左志向团队，周鹏辉团队，浙江省肿瘤医院赵安团队合作开发了一个泛癌种水平的肿瘤免疫治疗相关的转录组学数据整合分析的平台——TIGER。目前TIGER收录了33种癌症类型的11,057个肿瘤与正常样本的非免疫治疗的转录组数据，8种癌症类型的1508个肿瘤样本的免疫治疗转录组数据，来自25个癌症类型的655个样本的单细胞转录组数据。该数据库致力于促进免疫治疗新靶点和新型疗效预测标志物的鉴定和开发。

该成果发表于Genomics, Proteomics & Bioinformatics

推荐理由：肿瘤免疫治疗分子标志物分析的大数据平台

图：TIGER整体设计概览

数据库链接

http://tiger.canceromics.org/

原文信息

Chen Z, Luo Z, Zhang D, Li H, Liu X, Zhu K, et al. TIGER: a web portal of Tumor Immunotherapy Gene Expression Resource. Genomics, Proteomics & Bioinformatics 2023;21:337–48. PMID: 36049666.

原文链接

https://doi.org/10.1016/j.gpb.2022.08.004

▲ 长按阅读原文

基于工程化纳米孔的氨基酸及其翻译后修饰检测

蛋白质是生命活动的执行者，蛋白质序列的准确测定对于理解蛋白质的结构和功能至关重要。南京大学黄硕团队构建了一种高分辨率的工程化纳米孔，在孔道的传感区域精准引入了一个镍离子-次氮基三乙酸（Ni-NTA）适配器，借助金属离子与氨基酸之间的配位相互作用实现了20种蛋白质氨基酸和4种经典的翻译后修饰（磷酸化、糖基化、乙酰化、甲基化）的直接检测与完全区分，机器学习准确率可达98.6%。该策略被进一步应用于肽的氨基酸组成鉴定，为基于纳米孔的单分子蛋白质测序方法的开发提供了重要的设计策略和坚实的分辨率基础。

该成果发表于Nature Methods

推荐理由：首个能够识别20种天然蛋白质氨基酸的纳米孔测序和分析技术

图：镍离子修饰纳米孔道实现20种蛋白质氨基酸全分辨

原文信息

Wang K, Zhang S, Zhou X, Yang X, Li X, Wang Y, et al. Unambiguous discrimination of all 20 proteinogenic amino acids and their modifications by nanopore. Nature Methods 2024;21:92–101. PMID: 37749214.

原文链接

https://doi.org/10.1038/s41592-023-02021-8

▲ 长按阅读原文