2025年安诺优达组织研发的《评估基因组的注释质量的方法及装置(专利号:ZL 2025 1 0021739.9)》获得国家知识产权局授权。此次授权标志着公司在基因技术研发领域取得了新突破,体现了安诺优达团队的创新能力,彰显了公司在基因组学研究和生物信息分析领域的硬实力。
随着长读长测序技术的快速发展,搭配hifiasm、verkko等组装算法的提升,已实现高连续性、低错误率的高质量基因组参考序列构建。基因组组装后的注释分析作为功能研究与进化解析的核心环节仍面临着诸多挑战,阻碍下游生物信息学分析和功能基因组学研究。安诺优达近年来不断优化注释流程和技术,借助三代全长转录组数据(如 Iso-seq 技术),通过捕获完整转录本结构(包括 5’/3’UTR、可变剪切位点),显著提升基因结构注释的完整性与功能注释的准确性。
注释分析是解码生命的“最后一公里”
基因组注释是指对基因组序列组成成分、结构和功能的解析过程,包括重复序列预测、基因结构预测、基因功能注释和非编码RNA预测四个方面。它是一套含有众多软件的综合性流程,注释方法包括:
01 基于近缘物种序列相似性的注释
利用已知的近缘物种基因或蛋白质序列数据库(如NCBI、Ensembl、UniProt)与基因组进行比对,(如Genewise,miniport),通过同源性识别基因和功能元件。
02 基于基因预测算法的从头注释
使用计算工具(如Glimmer、GeneMark、Augustus)基于组装好的参考基因组,来预测基因的位置和结构(如外显子、内含子、启动子等)。
依赖于基因组序列的特征(如密码子使用偏好、开放阅读框等)。
03基于转录组注释
通过RNA-seq(如hisat2、STAR)或Iso-seq全长转录本(如PASA),将转录本数据比对回基因组,识别基因表达区域和基因表达水平证据。