7月7日,在2023世界人工智能大会(WAIC)上,业界首个AI蛋白质生成大模型“NewOrigin”(中文名为“达尔文”)正式亮相。NewOrigin大模型的研发领军人,清华大学智能产业研究院卓越访问教授、分子之心创始人许锦波教授表示,AI蛋白质生成大模型瞄准创新药设计、合成生物学等真实产业应用需求,将用一个模型满足蛋白质生成全流程需求,未来大分子药、新生物材料等蛋白质设计可实现“一键定制”。
据介绍,NewOrigin大模型通过学习千亿级多模态大数据,可实现多模态定向生成,单模型就能满足序列生成、结构预测、功能预测、从头设计等蛋白质生成全流程需求,解决产业应用所需的特定功能蛋白质生成难题,并在真实的产业环境中评估效果与价值。
【资料图】
过去60多年中,蛋白质结构始终是困扰生物学家的终极难题之一,科学家们曾多次因解析血红蛋白等重要蛋白质的三维结构被授予诺贝尔奖。这一局面在AI方法应用之后得到了根本性的改变。2016年,许锦波教授首次借助AI大幅提升了蛋白质结构预测精度,自此开始,AI彻底颠覆了蛋白质预测,并逐步影响蛋白质生成。但由于极高的技术壁垒,蛋白质生成至今仍是全球科学家尚未完全攻克的技术难题。
“大模型的出现将大大加速蛋白质生成技术的发展进程,并推动其在生物医药、合成生物学等领域应用,进而改变生物经济的格局。”许锦波在演讲中表示。当下ChatGPT等自然语言大模型的表现,让各界对大模型机制信心倍增。但在蛋白质生成等专业垂直领域,通用的自然语言大模型能力十分有限。究其原因,生物领域的复杂数据、专业知识与应用场景,都与自然语言交互的通用场景相差甚远,能力要求也更高。
因此,研发蛋白质生成大模型,除了必备的算法、算力、数据等基础条件,还需要具备两大专业进阶能力:一是融合计算机、生物、物理等多学科,熟识AI、分子动力学、量子计算等多种方法,且能在实践中并行考虑序列与结构、主链与侧链、进化与组学的跨领域融合能力;二是走出实验室,下沉至真实的产业环境,在需求、验证、落地上贴近真实产业需求的能力。“具备这些能力和条件的团队非常稀缺”,许锦波认为。
许锦波团队从2019年开始使用预训练机制研发蛋白质设计算法,通过整合结构预测、侧链预测、蛋白-蛋白对接等多种技术,结合多种场景需求,目前已在改造或从头设计蛋白质上取得了重要的突破。比如,设计功能类似但更小的蛋白质、能够结合某个小分子的蛋白质、能够结合某个底物的酶、基因编辑用的蛋白质等。
在此基础上,分子之心开发了融合自然语言和蛋白语言的AI蛋白质生成大模型NewOrigin,它具备5重优势:可以根据特定需求定制化生成蛋白质,比如针对某个靶点生成抗体,或针对某个底物生成特异性的酶等,实现“按需定制”;基于数千亿多模态数据,NewOrigin可以进行多模态的输入、输出,比如生成具备某种特定功能的蛋白质序列,或生成某个蛋白质的三维结构信息等,满足不同层次的应用所需;同时,为了评估生成效果,NewOrigin融合AI、分子动力学、量子计算等多种方法,形成多维反馈机制,来实现快速验证和迭代。为了降低交互门槛,NewOrigin使用了融合自然语言交互的蛋白质生成模式,以满足广大不具备AI技术背景的生物学家的应用需求。更重要的是,NewOrigin大模型是真正面向产业需求的AI蛋白大模型,可基于工业级的应用反馈持续迭代,解决真实的产业需求。
为了更好的满足应用所需,分子之心将在一站式蛋白质预测、优化、设计平台“MoleculeOS”中集成NewOrigin大模型能力,并以NewOrigin为底层基础,面向药物设计、合成生物学等应用场景打造产业级的解决方案,进一步将NewOrigin大模型的能力在药物设计、生物育种、环境保护、高性能材料等多个领域广泛落地,驱动多领域创新。比如,以对话交互的方式,让NewOrigin生成针对某个靶点的抗体,或生成具备某个底物特异性的酶等。
许锦波表示,AI和生物科技是当下全球科技竞争的重要战略领域,蛋白质技术作为生物科技的底层技术,与AI融合创新是必由之路。AI蛋白质生成大模型的开发只是起点,更具价值的是将其真正应用于产业中,实现可编程、可预测的创新药设计和生物制品开发,通过底层技术突破驱动生物经济变革。
关键词:
-
AI蛋白质折叠奠基人许锦波:NewOrigin大模型未来将“一键定制”蛋白药物
因此,研发蛋白质生成大模型,除了必备的算法、算力、数据等基础条件,
-
怀来供电公司:加强高温巡检 应对负荷高峰
7月5日,怀来供电公司组织工作人员对辖区内10千伏供电线路进行巡检测温。
-
[水泥大数据研究院]水泥产业链指数运行周报(2023.7.7)
[水泥大数据研究院]水泥产业链指数运行周报(2023 7 7)
-
深圳人行等5部门发布《深圳金融支持外贸稳规模优结构的指导意见》
2023年7月6日,为进一步贯彻落实党中央、国务院决策部署,加大金融对稳
-
车顶维权女车主诉特斯拉案将二审 车顶维权女车主诉特斯拉案二审将开庭
天眼查App显示,近日,张某周与特斯拉(上海)有限公司名誉权纠纷案新
-
参数出错请停止使用
1、学校历史悠久办学条件优越广州市信息工程高级职业技术学校是公办国
-
新型芯片光子电路诞生,可将单一激光束转换成多种不同新光束
精确塑造和控制可见光光束,对于诊断和研究人类疾病、捕获构成世界上最
-
涉棚改、拆迁、危房改造、.....丰台这些问题有最新答复!
涉棚改、拆迁、危房改造、 丰台这些问题有最新答复!,拆迁,棚改,丰
-
意大利米兰一养老机构发生火灾至少6人遇难
意大利米兰一养老机构发生火灾至少6人遇难---新华社罗马7月7日电(记者
-
操场的拼音(一场雨的拼音)
1、沙场的场:chǎng,一场雨的场:cháng。2、场,汉语汉字,cháng字
-
一眼千年 看东方之美的绵延
01:025日下午至6日上午习近平总书记在江苏省苏州市考察来到平江历史文
-
14年新低!三星电子二季度营业利润暴跌96%:半导体需求疲软
在当时三星报告称,由于存储芯片价格进一步下跌、库存价值大幅削减,其
-
直播延时(关于直播延时的基本详情介绍)
1、延时直播是指有观众参与的现场直播节目提前一定时间开始,用专用的
-
上海一男子每天划船上下班:单程6公里,耗时1小时
近日,上海李先生在网上发布了自己每天划船上下班的视频,引发网友关注
-
华丰科技上市,系华为中兴通讯设备供应商,曾获华为投资
7月6日消息,华丰科技近期在科创板上市,发行价为每股9 26元,上市当天
-
人民热评:虚构的“山河大学”反映的问题真真切切
山东、山西、河南、河北四个省份打造一所四省交界的综合性大学——“山
-
儿科专家:2种水果吃一次一月不消化,家长别再纵容,少给娃吃
儿科专家:2种水果吃一次一月不消化,家长别再纵容,少给娃吃,水果,积
-
小暑到来 炎炎夏日如何正确预防中暑
央广网南京7月7日消息(见习记者王纪民实习生李婕)7月7日迎来小暑节气
-
“炎陵黄桃” 提早上市了?此“锦香”非彼“锦绣”
本报讯(株洲晚报融媒体记者 易蓉通讯员 黄振)还没上市,就有人吆喝卖
-
重生唐三;狐女拍卖师黑丝性感,唐三接连买下宝物,孔雀妖王汪清登场
黄金树起拍价一败元素币,开始竞拍,这东西在唐三看来不可多得,但是却