 
  
2025年6月25日,谷歌DeepMind 推出AI模型 AlphaGenome,可处理长达百万碱基的DNA序列,以接近单碱基对的分辨率预测基因表达、转录起始、染色质可及性、组蛋白修饰、转录因子结合、突变影响等上千种生物学属性,是目前最先进的“序列到功能”模型之一,也是 DeepMind 继 AlphaFold 之后在生物科学领域的又一里程碑。
AlphaGenome是谷歌DeepMind开发的新型AI模型,旨在通过深度学习技术解析人类基因组的功能机制。该模型突破性地实现了三大核心能力:
(1)长序列高精度解析:能一次性处理长达100万碱基对的DNA序列,并在单碱基分辨率层面进行预测,覆盖以往模型难以兼顾的远程基因调控区域。
(2)全维度分子预测:同步输出数千种分子特性指标,包括:基因起止位点与RNA表达量、染色质空间构象与蛋白质结合位点、创新性剪接位点建模(首次通过 AI 直接预测 RNA 剪接模式)。
(3)变异效应评估:可在1秒内精准计算基因突变对调控功能的影响,在26项基准测试中全部达到或超越专业模型水平,尤其在罕见病相关变异解读中展现出价值(如成功解析白血病相关TAL1基因突变机制)。技术突破源于创新的卷积-Transformer 混合架构,训练时整合了ENCODE等国际数据库的数百万组基因组数据。实际应用中,该模型已证实能揭示非编码区突变致病机制(占基因组98%的关键区域),指导合成生物学中的精准基因回路设计,加速疾病靶点发现(如T细胞白血病研究案例)。当前通过API向科研机构开放非商业使用,但仍存在局限,包括超远程调控预测待优化、暂不适用于个人基因组分析、尚未整合环境因素等复杂变量等。该工具标志着基因组解读范式的转变,首次用统一模型替代传统单任务工具链。研究团队强调其定位是基础科研的加速器,期待与全球科学家共同推动对生命密码的系统性解码。
原文标题:AlphaGenome: AI for better understanding the genome