来源:DeepTech深科技
近期,美国斯坦福大学丛乐教授、美国普林斯顿大学王梦迪教授与谷歌 DeepMind 团队合作,首次将大语言模型(LLM,Large Language Model)用于基因编辑实验,成功开发出一种名为 CRISPR-GPT 的智能体系统。
值得关注的是,它能够综合利用 LLM 的计算效率和特定领域的知识,实现为研究人员解决 CRISPR 基因编辑实验“量身定制”的自动化设计与分析。
该系统为研究人员提供智能化的基因编辑方案设计,在确保编辑精准性的同时,显著降低了实验操作的复杂性。具体包括:基因编辑实验设计、CRISPR 系统的选择、设计指导 gRNA 序列、推荐细胞递送方法、预测脱靶效应、推荐实验程序和设计验证修改、实验的数据分析、确认编辑结果的过程。
该研究显示出 CRISPR-GPT 在促进复杂生物发现任务方面的潜力,有望加速生物、医学、农业等领域的发现和应用。
近日,相关论文以《CRISPR-GPT: 基因编辑实验的智能体自动化》(CRISPR-GPT for agentic automation of gene-editing experiment)为题发表在 Nature Biomedical Engineering 上 [1]。斯坦福大学博士研究生屈元昊和普林斯顿大学博士研究生黄凯旋是共同第一作者,斯坦福大学丛乐教授和普林斯顿大学王梦迪教授担任共同通讯作者。
图丨相关论文(来源:Nature Biomedical Engineering)
首次将大模型应用于基因编辑实验设计
当下,基因编辑技术让人们对基因信息的精确改变成为可能。2012 年,基因编辑系统 CRISPR-Cas9 的问世,标志着该领域取得重大突破。
2013 年,基因编辑先驱、美国国家科学院院士张锋教授与丛乐等人(后者为第一作者),在 Science 发表 CPISPR 基因编辑的突破性论文《利用 CRISPR/Cas 系统的多重基因组工程》(Multiplex Genome Engineering Using CRISPR/Cas Systems)[2]。
2020 年,美国加州大学伯克利分校教授詹妮弗·杜德纳(Jennifer Doudna)以及德国马克斯普朗克感染生物学研究所教授埃马纽尔·夏彭蒂耶(Emmanuelle Charpentier),因在 CRISPR-Cas9 的贡献而获得诺贝尔化学奖。
随着基因编辑技术的进步和发展,其在研究基因功能、治疗遗传病、制备基因修饰模型和治疗癌症、增强农作物恢复力等方面发挥着愈发重要的作用。
然而,创建一个高效的基因编辑系统,不仅需要对 CRISPR 深入了解,还要经过复杂的实验,这需要投入大量的时间和进行专业的科研训练。
近年来,LLM 在日常对话、世界知识、图像生成等方面展现出巨大的应用潜力。LLM 技术的发展为解决科学问题提供了新的契机的同时,AI for Science 应用也日益增多。此前,已有化学家通过 LLM 构建智能体,辅助科研人员进行实验设计和化学合成方案制定。
基于其他领域的成功应用案例,结合以基因编辑作为工具解决生物学问题的实际需求,该团队提出了一个关键问题:能否将 LLM 应用于基因编辑领域,通过智能体为研究人员提供专业辅助?
理论上虽然可行,但实际应用中面临诸多挑战:通用 LLM 存在幻觉等固有问题,且由于缺乏专业领域知识,无法为研究人员提供精准、具体的基因编辑设计方案。该团队发现,通用 LLM 的输出结果缺乏一致性,往往会提供众多不同的选择方案,导致研究人员难以确定最适合的基因编辑系统。
图丨CRISPR-GPT 智能体概述(来源:Nature Biomedical Engineering)
为解决这些问题,CRISPR-GPT 的每个模块都通过将 LLM 与特定领域的生物数据进行微调来优化,以确保基因编辑工作的准确性和效率,用户可以根据特定研究需求灵活调整设计方案。
这一创新的人工智能工具采用思维链推理模型和状态机架构,确保即使是基因编辑领域的“新手”生物学家,也能够迭代优化实验设计。该系统可完成多种基因编辑任务,包括 CRISPR 基因敲除、表观遗传编辑、先导编辑、碱基编辑等。
CRISPR-GPT 的核心优势在于,充分利用 LLM 的推理能力来处理自然语言交互。用户无需按照固定模式输入需求,而是像咨询专家一样自然提问,系统便能协助解决基因编辑实验设计中的各类问题。
斯坦福大学丛乐课题组博士研究生屈元昊的主要研究方向包括基因编辑、单细胞测序以及人工智能在生物医学中的应用。他对 DeepTech 表示:“据我了解,这是首次将大模型应用于基因编辑实验设计的研究。我们的核心创新在于让 AI 真正理解基因编辑的专业知识,并能像领域专家一样进行推理和决策。”
三种模式:通过智能交互“量身定制” CRISPR 基因编辑实验
目前,CRISPR-GPT 共有三种交互模式,分别适用于不同背景的研究人员,真正实现个性化的基因编辑实验设计。
第一,预设模式。该模式适用于对基因编辑不太熟悉的研究人员(初学者),通过该模式能够从最初的 CRISPR 系统选择,一直到最后的数据分析,完整地做完基因编辑实验。
第二,自动模式。这种模式比较适合具有基因编辑领域基础的科研人员,以帮助他们解决某一个或某几个问题,而不需要从头开始基因编辑实验。
例如,研究人员可以用自然语言的方式对该系统说:我想设计一个靶向于某基因的 gRNA。在自动模式中,通过 LLM 的推理能力,让它能够具体地分析每个用户不同的需求。
第三,问答模式。在研究人员对一些不熟悉的 CRISPR 系统进行实验时,可采用问答模式,自由地咨询与 CRISPR 基因编辑实验相关的问题。
图丨CRISPR-GPT 的组成部分使人类-人工智能协作,能够在复杂任务中自动化基因编辑实验设计(来源:Nature Biomedical Engineering)
基于丛乐实验室在基因编辑领域多年的技术积累,经常会收到来自世界各地的学者咨询关于 CRISPR 的各种问题。目前,研究人员正在将关于 CRISPR 问题和回答的数据集,与在网络中提取关于 CRISPR 数据集整合到 CRISPR-GPT 中。
屈元昊表示:“我们将实验室多年积累的 CRISPR 问答数据集整合到系统中,通过 LLM 进行专门训练和微调。这样 CRISPR-GPT 就能基于真实的专家知识为用户提供更准确、可靠的答案,进而真正解决实际研究中遇到的问题。”
“专家级”智能决策:模拟专家思维提供精准解决方案
CRISPR-GPT 采用“专家思维”模式,通过逐步推理为用户提供各类基因编辑实验的智能化解决方案。
以递送系统选择为例,这是基因编辑领域一个关键且复杂的技术难题。在干细胞或免疫细胞的体内编辑中,实验成功与否很大程度上取决于递送系统和 CRISPR-Cas 系统的匹配选择。
传统上,这个过程需要研究人员具备深厚的生物学背景,查阅大量文献,并凭借经验进行判断,既耗时又依赖个人专业水平。
CRISPR-GPT 通过智能化方式解决这一难题。当系统识别到特定生物学关键词(如“A-375 细胞”)时,会自动关联到其细胞类型特征(肿瘤细胞系)。
基于预设的专家知识,系统首先提出几个可能的备选递送方案(如逆转录病毒递送系统)。接下来,系统会进行实时文献搜索,参考学术引用数据等指标对备选方案进行综合评估,最终为用户提供 1-2 个最优的递送系统选择。
屈元昊表示:“我们的核心理念是让 AI 像专家一样思考问题。系统不仅具备专业知识,还配备了实时文献搜索等工具,能够智能化地为用户推荐最适合的递送系统。这完全改变了传统依赖个人经验和手工查阅文献的研究模式,让基因编辑实验设计变得更高效、更精准。”
图丨CRISPR-GPT 和 ChatGPT-3.5/4o 在不同模式下基因编辑实验设计任务中的性能比较(来源:Nature Biomedical Engineering)
在一项针对人类肺癌细胞系的实验中,CRISPR-GPT 成功设计了针对 TGFβR1、SNAI1、BAX 和 BCL2L1 四个关键基因的敲除实验,并通过 CRISPR-Cas12a 系统进行高效的基因编辑。根据实验结果,这些基因的编辑效率高达 80%。
在另一项针对人类黑色素瘤细胞系的实验中,CRISPR-GPT 成功设计并实施了对 NCR3LG1 和 CEACAM1 两个基因的表观遗传激活实验。结果证明,这两个基因的表达水平得到了明显提高。上述两项实验不仅表现优异,并且均一次成功。
为评估 CRISPR-GPT 智能体的性能,该团队邀请了 8 名具有 CRISPR 和基因编辑专业知识的研究人员设计一系列任务,测试 CRISPR-GPT 协助实验设计的能力。
他们从准确性、推理能力、完整性和简洁性四个维度,将 CRISPR-GPT 与 ChatGPT-3.5 和 ChatGPT-4o 进行对比评估。专家评估结果显示,CRISPR-GPT 在基因编辑实验设计的上述四个方面以及综合评分均优于通用 LLM。
为自动化生物科研开辟新道路
研发 CRISPR-GPT 是为了更好地促进科研的发展,但是这也是一把“双刃剑”,不能忽视可能带来的伦理道德和基因编辑安全等相关问题。
为此,该团队通过与伦理道德专家和基因编辑安全专家交流和讨论,采取了一系列预防措施。比如,通过设计关键词过滤和指导原则等,对人类受试者的应用限制、保护遗传信息的隐私以及对可能出现的意外结果(例如编辑更强大的病毒)的警告。
总体来说,CRISPR-GPT 实现了简化、自动化复杂生物学研究的基因编辑实验的设计过程。由于该系统集成了 LLM 与学科专业知识、外部工具和模块化任务执行系统,研究人员可以更简易、更准确、更高效地计划和开展基因编辑的相关实验。
“这项研究为自动化生物科研开辟了新道路。目前我们正在不断优化技术,解决实际应用中的各种挑战。我相信未来会有更多生物学研究能够借助 AI 和机器学习技术来完成,这将彻底改变科研的工作方式。”屈元昊说。
用机器帮助和替代人类执行实验任务,能够减轻科研人员的工作负担,并极大地加速探索科学的进展;而人类的最主要工作是思考、判断、设计实验,以及发现需要解决的科学问题。
该团队希望未来可以通过所开发的智能体控制机器人或自动化实验平台,真正地实现用先进的工具帮科研人员全自动地做实验,或生产基因编辑的细胞等模式。
随着基因编辑工程领域的不断发展,CRISPR-GPT 与自动化实验室的集成平台和机器人技术的进步,为加速科学发现和研究相关疾病带来了新的希望。
目前,该课题组还有一系列基于生物医学智能体研发的相关工作正在进行中。感兴趣的读者可以访问 genomics.stanford.edu 了解最新进展,并参与 CRISPR-GPT 智能体的 beta 测试。
参考资料:
1.Qu,Y. et al. CRISPR-GPT for agentic automation of gene-editing experiments. Nature Biomedical Engineering (2025).
https://www.nature.com/articles/s41551-025-01463-z
2.Cong,L. et al. Multiplex Genome Engineering Using CRISPR/Cas Systems. Science 339,6121,819-823(2013).
https://www.science.org/doi/abs/10.1126/science.1231143
运营/排版:何晨龙