看清头秃元凶,腾讯AI首度揭示真相
出品 | AI科技大本营(ID:rgznai100)
11月17日,腾讯公布了一项人工智能助力药物发现的新进展。
通过腾讯自研的提升蛋白质结构预测精度的新方法,联合研究团队首次解析了II型5a还原酶(SRD5A2)的三维结构,揭示了治疗脱发和前列腺增生的药物分子“非那雄胺”对于该酶的抑制机制,这将有助于深化研究相关疾病的病理学机制及药物优化。
此次,腾讯 AI Lab 采用“从头折叠”的蛋白质结构预测方法帮助解析了SRD5A2晶体结构,并通过自研AI工具“ tFold”有效提升了蛋白质结构预测精度,在科研突破中发挥了核心作用。除了在SRD5A2结构中的应用,这套方法还可以拓展应用于蛋白质分子和病理学机制的相关研究中。
该项联合研究成果于近日登上了国际顶级期刊 Nature 子刊《 Nature Communications》。论文题为《人体类固醇II型5a还原酶与抗雄激素药物非那雄胺的结构研究》,由南科大生物系魏志毅副教授课题组与匹兹堡大学张诚教授、新加坡 A*STAR 研究所范昊研究员、腾讯 AI Lab 黄俊洲博士带领的研究小组合作完成。
论文链接:https://www.nature.com/articles/s41467-020-19249-z
据了解,tFold工具还在CAMEO(全球唯一的蛋白质结构预测自动评估平台)的国际测评中连续半年保持周度冠军。目前,tFold公测版本已通过腾讯「云深智药(iDrug)」平台官网对外开放。
链接:
https://drug.ai.tencent.com/console/cn/tfold
“从头折叠”新方法破解晶体学难题
在人体内,性激素有促进性器官成熟、副性征发育及维持性功能等作用。
二氢睾酮是人体中已知最强的雄激素,对于人体的发育和生理活动至关重要,但同时也需要保持合理的平衡。一方面,二氢睾酮控制着男性性器官的发育,水平过低将导致男性性征缺陷。另一方面,水平过高又是导致前列腺增生和脱发的罪魁祸首。
合成性激素依赖类固醇还原酶,二氢睾酮即由 SRD5A2 催化合成。因此,当患者因为二氢睾酮水平过高而出现前列腺增生和脱发问题时,可以通过抑制 SRD5A2 来降低患者二氢睾酮水平。作为SRD5A2 的高效抑制剂,非那雄胺(finasteride)被广泛用于治疗这类疾病。
尽管 SRD5A2 具有重要生理作用,其高分辨率结构信息却十分缺乏,导致 SRD5A2 催化二氢睾酮合成的机理以及非那雄胺抑制 SRD5A2 酶活的机制并不清晰。
这是由于 SRD5A2 具有独特的七次跨膜结构,其与人类全部已知结构的蛋白在结构上存在较大差异,难以通过“模板建模”(template-based modeling)方法获得初始构型来解析晶体数据。同时又因为 SRD5A2 是一类多次跨膜蛋白,使得传统的用于获取蛋白质晶体相位信息的“重原子替代”(Heavy-atom derivatization)方法亦难以奏效。
为了解决这一难题,腾讯 AI Lab 科研团队采用了难度更高的“从头折叠”(de novo folding)方法来预测 SRD5A2 蛋白的三维结构,并将其用于“分子置换”(molecular replacement, MR)的初始构型来解析晶体数据。
所谓“从头折叠”,是相对于“模板建模”的一种蛋白质结构预测方法。“模板建模”是目前最普遍的蛋白结构预测手段,但有一个使用前提——人类已知的蛋白结构数据库(即PDB)当中,必须存在和预测的蛋白相似的结构,否则就无法使用。而腾讯AI Lab采用的“从头折叠”方法则跳出了这个限制,可以不依赖于模板来预测蛋白结构。
但此前,通过“从头折叠”方法预测的蛋白质结构精度不高,难以满足晶体数据解析的精度需要。而在腾讯 tFold 工具加持下得到的高精度“从头折叠”的结构模型,为分子置换方法提供相位,继而解析确定2.8Å 原子级别精度的SRD5A2晶体结构。
这一结果能直接推进我们对体内 SRD5A2 活性失调引发的各类疾病的理解,进而为基于 SRD5A2 结构的药物开发提供更多有价值的参考信息。
《Nature Communications》的一位评审对此创新方法给予了高度评价:“作者能用预测的分子置换(MR)模型来确定晶体结构,这一点非常有趣。本评审认为该技术确实非常出色,整个X射线晶体学界将从该方法中受益匪浅。”
自研冠军级 tFold 工具突破蛋白质结构预测精度
腾讯 AI Lab 自研的 tFold 工具正是破解 SRD5A2 蛋白结构这一重要难题的关键。为了提升“从头折叠”方法(又称“自由建模”)的精度,tFold 工具通过三项技术创新,实现了蛋白结构预测精度的大幅提升。
首先,实验室研发了“多数据来源融合”(multi-source fusion)技术,来挖掘多组多序列联配(multiplesequence alignment, MSA)中的共进化信息。
然后,借助 “深度交叉注意力残差网络” (deep cross-attention residual network,DCARN),能极大提高一些重要的蛋白2D结构信息(如:残基对距离矩阵)的预测精度。
最后,通过一种新颖的“模板辅助自由建模“(Template-based Free Modeling, TBFM)方法,将自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的3D模型中的结构信息加以有效融合,从而大大提高了最终3D建模的准确性。
在研究方面,tFold 平台已在国际公认最权威的测试平台CAMEO上证明其创新价值及有效性。腾讯 AI Lab 于2020年初在CAMEO平台注册了自动化蛋白结构预测服务器 tFold server,并自2020年6月起至今一直保持周度(图1)、月度、季度、半年度冠军。tFold server在一般案例上领先业内权威方法6%以上,在困难案例上则领先12%以上。
在应用方面,tFold server的公测版也已经在腾讯「云深智药」平台发布。用户可以手动输入待预测的氨基酸序列或从本地上传FASTA 格式的序列文件。在经过一定时间的计算之后,用户即可得到使用“从头折叠”方法预测得到高精确度蛋白结构(下图)。
tFold server的3D Modeling输出页面。左边部分为从头折叠得到的3D蛋白模型;右边部分是该3D模型在给定的预测残基对距离矩阵下的偏差。
腾讯「云深智药」用AI持续助力药物发现
依托大数据挖掘与机器学习等先进技术优势,腾讯正致力于推动AI与医疗产业的深度结合,助力社会整体医疗水平提升。
据了解,「云深智药」是腾讯发布的首个AI驱动的药物发现平台,整合了腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势,致力于帮助用户大幅度减少寻找潜在活性化合物的时间和成本。
腾讯「云深智药」平台主要功能
「云深智药」的五大模块覆盖临床前新药发现全流程,目前各功能模块正持续完善与升级。除蛋白质结构预测外,平台还上线了分子生成模块。AI驱动的分子生成模型是辅助小分子药物设计的重要工具之一,不仅能加速药物发现流程,还能启发药化专家跳出现有的分子库,探索更大的化合物空间。该模块还整合了ADMET属性预测功能,可对生成的新分子实时进行属性筛选。
据介绍,平台的逆合成算法也已取得了一定进展,计划于明年上线。其它小分子和大分子药物发现功能模块也将逐步上线。
除药物研发以外,腾讯 AI Lab 也在影像筛查、病理诊断等多个医疗领域持续探索,不断拓展和深化研究与应用。
在AI助力医疗技术方面,实验室联合多家合作单位研发了中国首款智能显微镜,帮助医生提高工作效率。2020年10月,在免疫组化样本(IHC)分析的基础上,智能显微镜新增了针对宫颈液基细胞(TCT)标本进行临床样本的显微图像进行观察、筛选、标记功能,并已获得国家药监局审批证书。
在病理研究领域,腾讯 AI Lab 也研发出了世界领先的前沿算法,比如斩获MICCAI 2020 CPM-RadPath 挑战赛第一名的算法,能够准确区分神经胶质瘤(大脑最常见肿瘤)的不同亚型并进行分级,有望弥补人工诊断效率低、主观因素影响较大等问题。
此外,腾讯 AI Lab 在今年早些时候与南方医院合作发表了名为《基于病理图片的结直肠癌微卫星不稳定性预测模型的开发和解释》的文章,利用算法模型可辅助病理医生筛查结直肠癌中微卫星不稳定亚型,降低微卫星不稳定筛查的条件要求,帮助更多的地方医院也有能力执行这样的筛查。
更多精彩推荐
赠书 | 图像分类问题建模方案探索实践
程序员奶爸用树莓派制作婴儿监护仪:哭声自动通知,还能分析何时喂奶
强化学习:10种真实的奖励与惩罚应用
全球数百万台 Mac 疑似因 Big Sur 更新险酿计算灾难,苹果官方回应来了!
大神们都是如何在时间序列中进行特征提取的?看完就懂了!
相关文章:

UNIX--stat、fstat和lstat函数
2019独角兽企业重金招聘Python工程师标准>>> stat、fstat和lstat函数(UNIX) #include #include int stat(const char *restrict pathname, struct stat *restrict buf); 供给文件姓名,获取文件对应特点。感受通常是文件没有翻开的时分这样操作。 int fst…

UVA 1482 - Playing With Stones(SG打表规律)
UVA 1482 - Playing With Stones 题目链接 题意:给定n堆石头,每次选一堆取至少一个。不超过一半的石子,最后不能取的输,问是否先手必胜 思路:数值非常大。无法直接递推sg函数。打出前30项的sg函数找规律 代码ÿ…
Google和网易有道合作开课了
11月16日,2020年Google开发者大会正式开幕。受疫情影响,本次大会首次以线上形式举办,这也是Google首次以全线上形式与中国开发者相聚。本届大会主题聚焦“代码不止”,其中“学习”成为本次大会重要板块之一。在该主题下࿰…

Node.js v0.10版本发布
Node.js研发团队发布了node.js v0.10版本,它是个基于Javascript、用于构建高性能异步服务器的平台。该版本主要更新如下:更易于使用的数据流处理模块,通过域更好地处理错误,此外还带来了性能方面的提升。该团队还宣布在v0.10之后、…

动手扩充FreeTextBox的功能
作者:朱俊代码:C#关键字:FreeTextBox、流媒体出自:http://blog.csdn.net/foxmail/archive/2004/08/21/81096.aspx摘要:最近一个项目要求可以在发表文章的时候能发布电影,当然不可能叫用户去写HTML代码了&am…

《防患未然:实施情报先导的信息安全方法与实践》——3.3 攻击剖析
本节书摘来自华章计算机《防患未然:实施情报先导的信息安全方法与实践》一书中的第3章,第3.3节,作者:[美] 艾伦利斯卡(Allan Liska) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 攻击剖析 为了开发更…

c#.net常用函数和方法集
1、DateTime 数字型 System.DateTime currentTime new System.DateTime(); 1.1 取当前年月日时分秒 currentTimeSystem.DateTime.Now; 1.2 取当前年 int 年currentTime.Year; 1.3 取当前月 int 月currentTime.Month; 1.4 取当前日 int 日currentTime.Day; 1.5 取当…
员工培训:如何制定以数据为依据的业务决策
作者 | Kamy Anderson翻译| Katie,责编 | 晋兆雨出品 | AI科技大本营头图 | 付费下载于视觉中国普华永道的研究表明,高度数据驱动的组织在决策方面取得显着改善的可能性要高三倍。不幸的是,高达62%的高管仍然更多地依赖经验和直觉…

IoC容器Autofac(1) -- 什么是IoC以及理解为什么要使用Ioc
阅读目录: 一. 一个没有使用IoC的例子 二. 当需求发生变动时,非IoC遭遇到的困境 三. 使用IoC彻底解决问题 四. 总结 一、一个没有使用IoC的例子 IoC的全称是Inversion of Control,中文叫控制反转。要理解控制反转,可以看看非控制反转的一个例…

【直播预告】7月18日3D游戏引擎免费公开课答疑,參与送C币!
喜讯喜讯!为了酬谢广大学员。CSDN学院特推出iOS和3D游戏引擎开发免费技术答疑公开课,让您度过一个充实的暑假~ 參与本次公开课,即有机会获得50C币! 答疑公开课时间:7月18日 晚7:30-9:30 答疑主题:姜雪伟3D…

Linux0.11内核引导启动过程概述
Linux0.11仅支持x86架构。它的内核引导启动程序在文件夹boot内,共有三个汇编代码文件。按照启动流程依次是: (1)bootsect.s。boot是启动引导的意思,sect即sector,是扇区的意思,二者合在一起启动…
用Python分析5000+抖音大V,粉丝最喜欢的视频类型是它
作者 | 小F来源 | 法纳斯特头图 | CSDN下载自视觉中国最近,小F在知乎上看到一个关于抖音的问题。里面提到了,目前我国人均每天刷短视频110分钟。看这数据,看来小F又被平均了。不过老实说,只要一打开抖音,小F确实是有一…

JSTL 读取数组 和 字符串连接
2019独角兽企业重金招聘Python工程师标准>>> JSTL读取数组: 从后台取得一个字符串,如:AA-50-3,通过-划分成字符串数组。然后读取每个字符串。 <c:set var"cle" value"${fn:split(AA-50-3,-)}"…
《Photoshop Lab修色圣典(修订版)》—第1课1.7节言归正传
本节书摘来自异步社区《Photoshop Lab修色圣典(修订版)》一书中的第1课1.7节言归正传,作者【美】Dan Margulis,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.7 言归正传Photoshop Lab修色圣典(修订版)上面的讨论说明,与其他方法相比&#x…

PHP获取当前时间差8小时的问题
<?php echo date("Y-m-d H:i:s"); //当前时间 ?> 这个方法获取的时间和标准时间差8小时;从php5.1.0开始,php.ini里加入了date.timezone这个选项,默认情况下是关闭的也就是显示的时间(无论用什么php命令…

四连通,和八连通的详解(MATLAB)
转至:http://www.cnblogs.com/xiaojidan/archive/2012/08/20/2647261.html 功能:标注二进制图像中已连接的部分。语法:L bwlabel(BW,n) [L,num] bwlabel(BW,n) 其中BW为输入图像;N可取值为4或8表示连接四连通或八连通区域;NUM为找到的连通…
梅花桩上练真功,腾讯公布机器人移动技术探索新突破
出品 | AI科技大本营11月20日,腾讯公布了其在移动机器人研究方面的新进展:四足移动机器人 Jamoca 和自平衡轮式移动机器人首次对外亮相。Jamoca 是国内首个能完成走梅花桩复杂挑战的四足机器人,自平衡轮式移动机器人的相关研究成果还入选了机…

《Redis入门指南(第2版)》一第2章 准备
本节书摘来异步社区《Redis入门指南(第2版)》一书中的第2章,作者: 李子骅 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第2章 准备 Redis入门指南(第2版)“…
深度学习中的注意力机制(二)
作者 | 蘑菇先生 来源 | NewBeeNLP目前深度学习中热点之一就是注意力机制(Attention Mechanisms)。Attention源于人类视觉系统,当人类观察外界事物的时候,一般不会把事物当成一个整体去看,往往倾向于根据需要选择性的去…

DataGrid列操作
DataTable检测是否存在某个DataColumn 1.if (dt.Columns.Contains("aa") true){ //存在aa} 2.foreach(DataColumn mDCol in dt.Columns) { if(mDCol.ColumnName"aa") { //存在aa } } 怎么样移除DataGrid列private void OnDataBound(object send…

【★更新★】高性能 Windows Socket 服务端与客户端组件(HP-Socket v2.0.1 源代码及测试用例下载)...
HP-Socket 以前为某大型通信项目开发了一套通用 Windows Socket TCP 底层通信组件,组件代号为 HP-Socket。现在把 HP-Socket 的所有代码向大众公开,希望能对大家有所帮助;另外,为了让大家能更方便的学习 HP-Socket,因此…

【数据库优化专题】MySQL视图优化(一)
本期数据库优化专题分享,为大家带来的是DBA社群MySQL领域原创专家——李海翔所著的MySQL视图优化系列文章。以下是第一部分的内容,未完部分敬请关注后续更新。 专家简介 李海翔 网名:那海蓝蓝 DBA社群MySQL领域原创专家 从事数据库研发、数…

使用Repeater的Template
.NET FX提供了一个方法,就是使用Template来在程序运行时对Repeater的显示进行控制. 这里我就不多说了,可以去看MSDN中的相关资料.(嘿嘿,其实我也没搞多少 )..其实主要是private void lc_DataBinding(object sender, EventArgs e)函数,在DataSource中的数据进行Bind的时候,每Bin…

获取文件最后修改时间的VC代码
作者:朱金灿来源:http://blog.csdn.net/clever101很多时候我们需要知道系统是什么时候编译生成的。我想到的一个直接的思路的是获取exe文件的最后修改时间。下面的一段代码可以做到这一点:CWinApp* pApp AfxGetApp();std::string strAppName…
BAT新风向标:程序员有福利了!
人工智能已成为新时代的风向标,如果你是对人工智能感兴趣的互联网工作者、大学生、研究生并期望在 AI 方向发展,建议你一定要深入学习一下人工智能。因为,未来将是人工智能的时代!为什么会有这个判断呢?第一࿰…

《C++代码设计与重用》——1.2 重用的神话
本节书摘来自异步社区出版社《Imperfect C中文版》一书中的第1章,第1.2节,作者: 【美】Martin D.Carroll , Margaret A.Ellis,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.2 重用的神话 C代码设计与重用1.2 重用的神…

控件的呈现方法(Rendering)的内核
Asp.net中所有的控件都是从System.Web.UI.Control类,在control类中定义了三个与呈现有关的方法,分别是Render方法,RenderChildren方法和RenderControl方法.其中RenderControl方法是public的方法,先看看这三个方法的实现: Public void RenderControl(HtmlTextWriter writer) {//…
清华、北大教授同台激辩:脑科学是否真的能启发AI?
作者 | 高卫华出品 | AI科技大本营头图 | CSDN下载自视觉中国广义的智能科学是研究智能背后的科学,需要不断扩展科学研究范围,没有最后的疆域。但脑在几千年内的进化中都相对静止,因此脑科学是“自然科学最后的疆域”。脑科学是一个重要的研究…

CentOS 5 升级mysql5.1启动服务时报错
CentOS 5 升级mysql5.1启动服务时报错: [ERROR] Error message file /usr/share/mysql/english/errmsg.sys had only 481 error messages, but it should contain at least 641 error messages.解决方法是:1.mv /usr/share/mysql/english/errmsg.sys /us…

《JavaScript设计模式》——11.2 一切只因跨域
本节书摘来自异步社区《JavaScript设计模式》一书中的第11章,第11.2节,作者:张容铭著,更多章节内容可以访问云栖社区“异步社区”公众号查看 11.2 一切只因跨域 “哦,为什么会出现,什么是跨域?…