
AlphaGenome是由谷歌DeepMind推出的一款人工智能基因组解读平台,能够对长达100万个碱基对的DNA序列进行高分辨率的功能预测,并高效评估基因变异的影响。
一、主要功能
-
多模态基因组功能预测
-
基因起止点定位:预测基因的转录起始和终止位置。
-
RNA剪接模式:预测剪接位点及其表达水平。
-
RNA表达量:预测不同组织/细胞类型下的基因表达。
-
染色体可及性:预测染色质开放区域。
-
蛋白结合位点:预测转录因子等蛋白的结合区域。
-
-
变异效应高通量评估
-
AlphaGenome可对输入序列中的任意变异(如SNP、Indel)进行效应打分,预测其对上述所有分子属性的影响。
-
-
剪接异常建模
-
首次实现了对RNA剪接异常的直接建模,能够预测罕见遗传病相关的异常剪接事件及其表达水平。
-
二、技术原理
-
长序列输入与高分辨率预测
-
AlphaGenome能处理长达100万个碱基对的DNA序列,用单个碱基的分辨率进行预测。
-
-
卷积层检测短模式
-
模型用卷积层初步检测基因组序列中的短模式,识别局部的模式和特征。
-
-
Transformer整合信息
-
基于Transformer架构整合序列上所有位置的信息,捕捉长距离依赖关系。
-
-
多模态预测输出
-
基于输出层将检测到的模式转化为对不同分子特性的具体预测。
-
-
大规模数据训练
-
训练数据来自ENCODE、GTEx等大型公共数据库,覆盖数百种细胞类型和组织。
-
三、应用场景
-
疾病研究
-
帮助精确定位疾病潜在原因,发现新的治疗靶点。
-
例如在T细胞急性淋巴细胞白血病研究中,成功解析了致癌变异。
-
-
合成生物学
-
设计具有特定调控功能的合成DNA。
-
-
基础基因组研究
-
协助绘制基因组功能元件图谱,加深对基因组的理解。
-
四、使用方法
AlphaGenome通过API向非商业研究领域开放,用户可以通过API调用模型,输入DNA序列并获取预测结果。
五、适用人群
-
基因组学研究人员:用于疾病机制研究和基因调控研究。
-
合成生物学家:用于设计合成DNA。
-
基础生命科学研究者:用于探索基因组功能。
六、优缺点介绍
优点
-
全能型模型:可同时预测多种基因调控模态。
-
长序列建模能力强:支持百万级碱基对输入。
-
高分辨率:在多项基因组功能预测任务中表现优异。
-
高效变异打分:可在秒级时间内完成大规模变异效应评估。
缺点
-
数据局限性:目前仅基于人类和小鼠基因组训练。
-
细胞特异性不足:难以捕捉细胞动态变化对DNA序列功能的影响。
-
远距离调控能力有限:难以识别距离超过10万碱基对的目标基因序列。
分类标签
基因组学工具、人工智能、生物信息学、疾病研究、合成生物学
一家专注于绿色活性原料生产的高新技术企业,致力于通过新一代合成生物技术推动生物活性原料的绿色、高效生产,为多个领域提供优质原料。