量子计算与AI“双拳”出击,他们锁定38种潜在抗疫药物
作者 | Just
出品 | AI科技大本营(ID:rgznai100)
医药研发行业有一个“三个十”的说法,即一种药物的发现需要投入十年以上的时间,花费十多亿美元,最后获得10%的成功率。也就是说,医药研发需要花费很长时间,投入大量资金才能成功研发出一种药物。
不过,AI等新技术的不断涌现,让科学性极强的医药研发行业也有机会追求大幅“提速降费”。
“把原本可能需要三到五年的药物发现过程,显著地缩短至一到两年,同时还帮助人们跳脱出药物研发专家个人经验和能力的限制,全面加速药物研发。”致力于以计算驱动药物研发的晶泰科技联合创始人、AI负责人赖力鹏告诉AI科技大本营。
抗疫,筛选出38种潜在药物分子
目前AI在医药研发的应用覆盖多个研发环节,包括靶点发现到苗头化合物、先导化合物的发现,然后到药物开发和临床实验。
以新冠病毒的靶点发现为例,首先需要找到病毒上与转录、复制、感染等关键机能相关的蛋白质,然后分析其与药物结合、抑制这些机能实现的位点。通过找到能有效、稳定地与这些靶点结合的分子,就可以阻止病毒的感染和传播,患者由此得到治疗。
寻找候选药物分子并非易事。传统的方法是通过药物化学家的参与,从百万到千万潜在化合物层层进行筛选,去做实验验证对抑制病毒活性有效的化合物。而通过AI生成模型、强化学习和迁移学习,可以根据对应靶点去设计出更加多样化的分子结构,这样扩大了找到相应分子的可能性,将搜索的最大范围从现有的10^23个化合物分子的搜索空间扩大到10^60。
这样就可以从百万、千万个潜在有效的类药分子中,利用AI算法,对其生物活性、溶解性、毒性、稳定性、合成难度,以及与人体内吸收、分布、代谢、排泄关联的关键性质进行快速、准确的层层筛选与综合打分评估。
综合表现最理想的一百多个分子,通过高精度的量子物理计算进一步精准预测其关键性质,随后结合药物化学家的专家挑选,就可以确定几十个最有希望能够成功研发的药物侯选分子,进入针对性实验验证。
晶泰科技AI定向生成的分子库。其中蓝色为训练集分子,红色是AI随机生成的分子,黄色为经过强化学习后生成的性质更加理想的类药分子。
1月20日,晶泰科技成立了一个新冠肺炎攻关小组,并基于随后发布的病毒基因序列进行同源建模,对获得的关键蛋白质模型进行了分享。他们还通过计算的方式验证了新冠病毒相比SARS病毒具有更强的人际传播能力,并且做了病毒可能出现的变异的扫描,以帮助后续的疫苗、抗体等药物的研发。
很快,基于几个关键的靶点,他们在美国药监局上市的3000种药物以及10000多种中药成分分子中筛选出183种潜在的活性药物分子,后来经过更高精度的量子物理、计算化学方法,进一步将范围缩小到38种活性比较理想的药物分子,推进到细胞实验阶段,以验证其对新冠病毒的抑制作用。
氯喹已在细胞实验和临床治疗中展现出新冠病毒有比较好的抑制效果,晶泰科技也与广东的众生药业公司合作,研究氯喹抑制新冠病毒的分子作用机理,并进行实验验证。
值得一提的是,他们还在人工智能药物研发平台上面搭载了生物药研发相关算法,目前正通过研究病毒表面的一些蛋白,帮助新冠抗体和亚单位疫苗做基础研究。
切入晶型预测,确定医药行业的“钉子”
晶泰科技不是一家以AI技术在医药研发行业起家的AI创业公司。
6年前开始创业,三位创始人考虑的是先找到医药行业的“钉子”,而不是拿着AI的锤子去找钉子。“先确定问题,再寻找解决问题的最佳路径。”赖力鹏称。
这与晶泰科技三位创始人的技术背景不无关系。生物化学领域等待更快速、精确的研究方法应用于工业界,而他们多年从事量子物理、量子化学领域的科学研究,专注于如何更精确地理解、计算原子、分子间的作用关系,这些科学算法正是新材料、生物化学等领域科研方法创新的源头。最终,他们确定以药物开发环节的晶型预测问题为切入点。
什么是晶型?从化学结构上看,虽然石墨和金刚天差地别,但本质上是碳原子由不同的空间排列而产生的“晶型”。同样的,一个药物分子的各个原子在空间结构上由于旋转角度、排列方式的细微差异,可能产生上千万种晶型,而真正稳定的晶型也会有几种甚至几十种之多,它们的药物性质也不尽相同。传统研究方法依赖实验试错,一旦有遗漏就会给药企带来潜在的专利诉讼、临床失败,甚至药品召回的风险,蒙受巨大的经济损失。
晶型预测技术则可以用准确的预测结果指导实验,从而加速研发、提高成功率。
其一大难点在于,需要预测分子在结晶形成固体结构的所有可能性。赖力鹏解释,要解决这个问题,要尽可能准确地计算原子间的相互作用,再从上千万种可能性中锁定最适合药物开发的晶型。
精确度、速度与成本如何实现最优化是另一大难题。计算中会产生百亿级甚至千亿级的高精度结构数据,而药企研发争分夺秒,对计算精度和计算速度都有很高的需求,并且需要在成本可控的范围内尽可能快地完成计算,否则就无法在药物研发中的实现广泛应用。
而以计算预测的方法改进,加速晶型研发,就可以提高药物安全性,帮助有效的新药分子成功开发为药物产品,更早到达患者身边。
确定了晶型这一痛点问题后,2014年晶泰科技正式成立。彼时,他们手中的“锤子”以量子物理和量子化学技术为主,深度学习还没有像在2016年那样被业内所熟知。
不久,如何思考在这一领域持续创新,将现有的技术积累与AI、机器学习、搜索技术和其他底层的计算方法结合,进一步突破精确度、效率与成本的边界,并拓展新的工业应用,成为他们的研究重点。
拥有业界领先的晶型研究算法的同时,晶泰科技将研发方向聚焦在药物发现和药物开发阶段,前者指从药物的靶点出发,找到可能与靶点产生作用的分子,后者主要在药物固相和后续制剂方面进行研究。
AI打辅助,量子物理计算是杀手锏
基于量子物理和量子化学的计算技术与AI相结合是晶泰科技最核心的杀手锏。
赖力鹏介绍,计算辅助药物研发的科学根源是分子和分子之间的相互作用,不管是药物结晶,还是药物制剂过程,药物和辅料的选配,它们在量子力学层面上其实都可以理解为处理不同原子间的相互作用。
所以在他看来,当计算物质之间的相互作用时,基于量子力学的计算方法是最准确的。但问题是,在真实的项目中用量子力学去计算的时候,一个体系中可能存在大量原子,现在的算力无法支撑这样庞大的计算量。
工业界的处理方法是,在量子力学的方程中引入一些基于经验的估计参数,去简化计算的过程,核心是基于专业领域的知识和经验,去选择正确的参数来对量子力学计算的方程进行简化。
幸运的是,以深度学习为核心的AI方法可以对参数做出更好的估计,以进行药物设计和筛选。
晶泰科技ID4平台的AI药物发现流程
在药物筛选阶段,由于分子是不同的原子通过化学键建立连接,从算法的角度来说,可以看成一个有节点和边的图结构,而在分子表示方法上,由于分子的结构无法直接输入一个神经网络进行训练和学习,所以需要投射到一个矢量化空间,如何做适量化很大程度上会影响到模型表现。
赖力鹏进一步介绍,当处理蛋白和小分子相互作用的时候,如何选择正确的表示方式(embedding)很重要,涉及的建模方法也是多样的,包括NLP里的sequential模型以及图卷积模型,他们会把不同的网络架构进行整合,以适应需要解决的问题。
在他看来,AI与量子计算相辅相成。目前,在生物和化学领域的应用,只使用AI技术本身的精度并不足够,而单纯用量子物理计算的方法效率也不够,这就需要把两个方法结合到一起,让AI可以在一个非常大的样本范围内去做快速筛选,同时提高量子力学计算技术的精度。
复杂计算离不开算力支撑。他们能够通过工程能力去调度大量的计算资源,可以同时调度不同的云计算平台,在很短时间内部署百万核级的CPU计算资源。
上述三大底层技术结合构成了晶泰科技最基础的计算,快和准是基本技术能力体现。尤其在晶型计算上,赖力鹏表示,他们在全球范围内可能没有竞争对手。
为计算能力提供基础保障的还有数据。晶泰科技会尽可能去整合来自不同数据库的公开数据,包括具体项目中合作方的实验数据,目前已积累千亿规模的数据。同时,他们也会调用大量的计算资源去做高精度的计算,积累上百万到上千万的高精度计算数据来训练AI模型,从而提高模型预测精度。不过,由于他们使用的量子物理化学等算法可以更好的描述问题,所以对数据的依赖性相对更低。
赖力鹏再一次强调应该从底层问题出发,考虑利用不同方法的优势进行组合,以解决问题。
解决问题是根本,现在已不是概念的风口
近几年算力、数据和各种机器学习框架和算法的出现,带动了AI在不同行业的场景落地和发展,药企开始重视新技术在医药行业中应用的可能性。
面向未来,晶泰科技会在技术层面加深方法上的研究,在量子计算、AI方法以及云计算资源三方面技术优点做更紧密的衔接。另外,他们也计划将分子设计技术拓展到高能材料等新领域进行探索。
赖力鹏说,AI的技术一定要和已有的基础计算技术相结合:通过AI的学习能力和创造能力,为药物发现提供更多可考虑的化合物分子,其次,在药物筛选的早期使用多种计算方法做综合评估,优先各方面性质更理想、研发风险低的分子,就可以降低那些后期的失败风险和时间成本,而仅凭实验无法做到这一点。
业务层面,不同于很多企业扎根在一、两个领域去做一些项目,他们希望做成一个赋能药物研发的综合平台,注重解决一些底层共性问题,对具体医药项目的类型没有限制。
晶泰的平台架构已初步成型,他们计划进一步扩大包括与大型跨国药企和创新型生物科技公司在内的合作。目前,晶泰科技已与包括辉瑞在内的40多家药企合作,尤其在晶型研究环节改变药企的新药研发流程。而他们的人工智能医药研发平台与创新药企合作所发现的药物分子,已经进入临床前研究阶段。
从行业角度,他认为在AI的浪潮之下,初创公司和药企会更重视数据的结构化和数据收集,所以未来在企业内部和公开领域,数据的数量和质量都会有很大提升,这将为AI的进一步落地和应用提供更好的机会。
但无论技术如何推陈出新,赖力鹏认为行业归根结底都应该从问题出发,“要看重技术是不是真实解决了药企在研发中的需求,评判标准就是付费合作,现在其实已经不是处在概念的风口,大家现在更应该积极的把技术转化成能够真实解决研发需求的解决方案。”
相关文章:
前百度主任架构师创业,两年融资千万美元,他说 AI 新药研发将迎来黄金十年
推荐阅读
我佛了!用KNN实现验证码识别,又 Get 到一招
潘石屹 Python 考试成绩 99 分,网友:还有一分怕你骄傲
平安科技王健宗:所有 AI 前沿技术,都可以在联邦学习中大展身手
踢翻这碗狗粮:程序员花 7 个月敲出 eBay,只因女票喜欢糖果盒
在 520 这天,竟然有人把 Docker讲清楚了? | 原力计划
斗地主吗?能学区块链那种! | 原力计划
你点的每个“在看”,我都认真当成了AI
相关文章:

Android官方开发文档Training系列课程中文版:OpenGL绘图之应用投影与相机视图
原文地址:http://android.xsoftlab.net/training/graphics/opengl/projection.html##transform 在OpenGL ES环境中,投影相机View可以将所绘制的图形模拟成现实中所看到的物理性状。这种物理模拟是通过改变对象的数字坐标实现的: 投影 - 这基于…
Python分析101位《创造营2020》小姐姐,谁才是你心中的颜值担当?
来源 | CDA 数据分析师责编 | Carol Show me data,用数据说话。今天我们聊一聊《创造营2020》各个小姐姐,点击下方视频,先睹为快: 最近可以追的综艺真是太多了,特别是女团选秀节目。之前我们刚聊过《青春有你2》&…

体验Remix——安卓电脑
第一次听说Android-X86 以前玩唱吧的时候接触过PC上的安卓模拟器,不过这个只是一个软件,效果毕竟不好,想要把电脑变成安卓手机,还差远了。 然后,前段时间一直纠结要不要换个手机,我现在的华为小6已经跟我…

重置 microsoft visual studio窗口
“工具”->“导入导出设置”—>“重置所有设置”,在这个向导中可以重置编译环境的!转载于:https://www.cnblogs.com/qiantuwuliang/archive/2011/05/31/2064825.html

排序算法总结之堆排序
一,堆排序介绍 堆是一个优先级队列,对于大顶堆而言,堆顶元素的权值最大。将 待排序的数组 建堆,然后不断地删除堆顶元素,就实现了排序。关于堆,参考:数据结构--堆的实现之深入分析 下面的堆排序…

Hessian通信案例(java)
个人博客: 戳我,戳我 前言 由于工作的原因,接触到了hessain,项目需要做hessain和xml之间的报文转换。但是对于hessian是个什么东西一头雾水。于是接下来的时间了解了hessain协议的序列化规则以及hessian协议进行通信的方式。这篇文章是在完成了这个模块…

VDI序曲二十一 APP-V 4.6 SP1服务器端部署
APP-V是微软应用程序虚拟化除RemoteApp以外非常棒的另一种应用程序虚拟化,此应用程序虚拟化是把搭开应用程序消耗的资源放在前端,应用程序虚拟化主要解决的还是软件兼容性问题和保护软件资产问题,同时让用户无需安装就可以绿色使用的手段&…
绝悟之后再超神,腾讯30篇论文入选AI顶会ACL
作者 | 马超责编 | Carol出品| AI科技大本营(ID:rgznai100)封图 | CSDN 付费下载于东方 IC近日,国际计算语言学协会年会ACL在官网(https://www.aclweb.org)公布了2020年度的论文收录名单,其中腾讯共有30篇论文入选&…

mac中用命令行运行mysql
1,安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/,根据我的机器的配置情况选择了64bit版本。 2,命令行中启动mysql 安装的位置在/usr/local/mysql 于是做了一个别名: $alias mysql/usr/loc…

Hessian源码分析(java)
个人博客: 戳我,戳我 先扯一扯 前一篇博文Hessian通信案例(java)简单实现了Java版的Hessian客户端和服务端的通信,总体看来,实现起来比较简单,整个基于Hessian的远程调用过程也显得很方便。但是知其然还要知其所以然&…
必读!53个Python经典面试题详解
作者 | Chris翻译 | 苏本如,编辑 | 夕颜题图 | 视觉中国出品 | AI科技大本营(ID:rgznai100)本文列出53个Python面试问题,并且提供了答案,供数科学家和软件工程师们参考。不久前,我作为“数据科学家”开始担…

Microsoft Web 平台安装程序 (Web PI) Microsoft Web Platform Installer
Microsoft Web 平台安装程序 3.0 (Web PI) 是一款免费的工具,使用它可以获得 Microsoft Web 平台的最新组件(包括 Internet Information Services (IIS)、SQL Server Express、.NET Framework 和 Visual Web Developer)。Web PI 的内置Window…

Linux Shell 脚本限制ssh最大用户登录数
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://dgd2010.blog.51cto.com/1539422/1670233 我撰写本文原来的意图是想把“复制SSH渠道”和"copy SSH Session"这样的功能从远程s…

hessiancpp编译和使用(C++版)
个人博客:戳我,戳我 许下的承诺 前两篇博客Hessian通信案例(java)和Hessian源码分析(java)介绍了Java版的hessian的使用以及源码分析。当时也说过打算写一下C版的hessian的使用和源码分析,现在就是兑现承诺的时候了。其实我项目中实际用到的…
美国AI博士一针见血:Python这样学最容易成为高手!
我见过市面上很多的 Python 讲解教程和书籍,他们大都这样讲 Python 的:先从 Python 的发展历史开始,介绍 Python 的基本语法规则,Python 的 list, dict, tuple 等数据结构,然后再介绍字符串处理和正则表达式࿰…

win7操作系统在哪显示隐藏文件夹
win7操作系统在哪显示隐藏文件夹 打开计算机--组织--文件夹和搜索选项--查看--把 “隐藏受保护的操作系统文件”前面的钩去掉,选中“显示隐藏的文件、文件夹和驱动器”--确定

ASP.NET MVC4中调用WEB API的四个方法
当今的软件开发中,设计软件的服务并将其通过网络对外发布,让各种客户端去使用服务已经是十分普遍的做法。就.NET而言,目前提供了Remoting,WebService和WCF服务,这都能开发出功能十分强大的服务。然而,越来越多的互联网…

使用docker制作hexo镜像
个人博客:戳我,戳我 背景 这段时间一直在折腾我的博客,由于之前出现过一次电脑硬盘完全挂掉的情况,为了避免重新搭建博客系统,一直打算搞一个方便点的环境,能进行多机迁移之类的。正好,Docker完…
3D目标检测深度学习方法数据预处理综述
作者 | 蒋天元来源 | 3D视觉工坊(ID: QYong_2014)这一篇的内容主要要讲一点在深度学习的3D目标检测网络中,我们都采用了哪些数据预处理的方法,主要讲两个方面的知识,第一个是representation,第二个数据预处…

NTLM协议认证
第一篇blog,发现这是个记录学习过程的好地方。从基础的开始吧。 NTLM: 基本知识telnet的一种验证身份方式,即Windows NT LAN Manager (NTLM); NTLM 是为没有加入到域中的计算机(如独立服务器和工作组)提供的…

新盒模型移动端的排版
这里采用的是新盒模型来进行排版: <div class"mytest"> <header></header> <section></section> <footer></footer> </div> 在CSS样式里添加如下样式 html,body{ height: 100%; } .mytest{ …

微信跳一跳高分辅助踩坑
旧博文,搬到 csdn 原文:http://rebootcat.com/2018/01/08/wechat_jump_hack/ 最近挺火的微信跳一跳 最近新版微信的『跳一跳』小程序着实火了一把,也把小程序这个概念再次推波助澜了一波,看来以后小程序这个入口会有大作为。 张小…
“编程能力差,90%的人会输在这点上!”谷歌开发:其实都是在瞎努力
这是一个很难让人心平气和的年代。疫情之下,很多人的都在面临着:失业、降薪、找不到工作、随时被裁等风险。但是:有心的人早已上路超车,做个人能力的升级——提高自己的不可替代性。李开复曾提出过“五秒钟准则”:一项…

64位win7安装IIS7时不能浏览asp的问题
64位win7高级家庭版安装IIS7,安装完成后只能浏览静态页,找了很多的教程都没有解决,最后在一个博客里看到说64位系统下ASP是不支持的ODB读取ACC的数据库的,因此需要开启32位应用程序的支持。 方法是: Internet 信息服务…

0525 项目回顾7.0
一、sprint总结 当谈到团队,我开始真的不知道团队是怎么样的,怎么样进行工作的,要该怎么出力团队的关系,有时候会涉及到个人问题,是不是该考虑进来,但是很多时候是不能的,每一个人作为团队的一份…

辩证看待 iostat
旧博文,搬到 csdn 原文:http://rebootcat.com/2018/01/16/using-iostat-dialectically/ 前言 经常做系统分析会接触到很多有用的工具,比如 iostat,它是用来分析磁盘性能、系统 I/O 的利器。 本文将重点介绍 iostat 命令的使用,并…
搞机器学习,Python和R哪个更合适?
【编者按】如果你正想构建一个机器学习项目,但却纠结于如何选择编程语言,这篇文章将是你所需要的。这篇文章不仅帮助你理解Python和R这两种语言的区别,还有助于你了解各个语言多方面的优势。作者 | Manav Jain译者 | Joe,编辑 | 夕…

Java安装方法
第1章 Java简介及开发环境搭建 实验1 JDK的下载、安装与配置 【实验目的】 (1)熟悉JDK工具包的下载及安装过程。 (2)掌握JAVA_HOME、CLASSPATH及Path的设置内容。 (3)掌握Java程序运行原理及Javac、Java命…

Hash函数的安全性
我们为了保证消息的完整性,引进了散列函数,那么散列函数会对安全正造成什么影响呢?这是需要好好研究一番的问题。 三个概念: 1.如果y<>x,且h(x)h(y),则…

一键安装python3环境
旧博文,搬到 csdn 原文:http://rebootcat.com/2018/04/15/python3_in_a_box/ 一键安装python3环境 由于现在逐步转移到 python3 进行开发,但是很多机器并没有预装 python3 环境,所以需要安装。 所以分享一个我常用的,…