10月21日,第三届“创世技”颠覆性创新榜发布暨颠覆性创新成果(海淀)转化促进中心揭牌仪式在北京海淀举办。作为2020年全国双创周云上活动周部委、北京市和中关村创新创业季重点活动之一,本次活动发布了2020“创世技”颠覆性创新榜和最具颠覆性潜力榜。其中,百度研究院的“AI助力新冠病毒分析和疫苗序列设计”成果入选2020颠覆性创新榜。

百度技术委员会理事长陈尚义(左四)领奖

自2020年新冠疫情发生以来,百度持续上线一系列技术和服务,全面支持疫情防控和复工复产。特别是在新冠肺炎病毒基因测序和疫苗研究方面,百度此前免费开放的线性时间算法LinearFold等人工智能前沿技术更是发挥了巨大作用。今年五月,百度研究院再次深化在AI算法领域的能力,重磅推出全球首个mRNA疫苗基因序列设计算法LinearDesign,大大提升了疫苗设计的稳定性和蛋白质表达水平,加速了疫苗研发速度。

颠覆性AI新算法 LinearDesign 16分钟优化mRNA疫苗稳定性

从生物学角度看,疫苗的研制有多个方向,如DNA疫苗、mRNA疫苗、蛋白质疫苗等。其中,mRNA疫苗是最有希望的预防工具。但mRNA本身稳定性差、易被分解,所以在保存、运输过程中及体内表达时很容易失效。因此,如何稳定mRNA,提升研发效率,成为了全球科研机关、防疫机构和生物医学公司的难题。

基于此,百度LinearDesign算法应用计算机科学领域经典算法——动态规划算法,将这一问题的搜索时间从亿万亿年降低到分钟级。在新冠病毒的刺突蛋白序列上的计算机模拟实验表明,LinearDesign能够设计出结构最稳定的序列,而且设计时间只需要1个半小时。

值得一提的是,如果采用线性时间近似算法,所需时间还可以进一步缩短到16分钟, 且与最优解的能量差距(衡量稳定性的指标,能量越低越稳定)只有0.6%。这两种设计相比于自然界天然存在的新冠病毒刺突蛋白mRNA序列要稳定的多(能量降低了150%)。

AI算法免费开放 百度持续释放技术原力

事实上,在LinearDesign算法出炉之前,百度已经开始用AI算法助力疫情防控。今年1月,百度研究院免费开放了将此次新型冠状病毒的全基因组二级结构预测从55 分钟缩短至27 秒的LinearFold算法,而新算法LinearDesign正是基于线性时间算法LinearFold的升级。

因此,同LinearFold算法一样,百度研究院继续向全球疫苗研发机构及研究中心等免费开放LinearDesign算法,并在arXiv发布了相关论文、提供了CoV-Seq工具平台,让研究人员能够加速科研的进展,助力新冠病毒疫苗研发。

可以看到,人工智能技术可以从技术角度为新冠疫苗研发提供全新的解题方法。LinearDesign算法,正是来源于百度与全球生物、医药专家的思想碰撞。而随着人工智能技术的不断发展,在生物计算领域,AI与生物、医药等行业的深度融合可以有效填补复杂行业问题与前沿算法之间的关键空白地带,加速算法落地和反哺计算问题的定义,而这可能会成为生物计算领域发展的新方向,同样也可能是AI落地探索的一种全新模式。

目前,百度已与中国疾病预防控制中心病毒病预防控制所签署战略合作协议,联合设立“中国CDC应急技术中心-百度基因测序工作站”。中国疾病预防控制中心后续也将使用百度LinearDesign算法设计的mRNA疫苗序列进行体外实验,验证疫苗的稳定性和蛋白质表达效率。未来,百度将继续以AI技术助力全球抗疫事业。