当前位置: 首页 > 编程日记 > 正文

“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?

640?wx_fmt=jpeg


作者|琥珀

出品| AI科技大本营


又一次,计算机科学家和生物学者站在一起,对抗人类向内探索的挑战——用机器学习预测基因编辑 CRISPR 中的脱靶效应。


今年年初,发表在《自然》生物工程杂志上的一篇论文描述了 Elevation 这项工具。该工具由微软研究员 Nicolo Fusi、加州大学伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研发,可在 CRISPR 编辑基因时预测脱靶效应。


640?wx_fmt=png

那么何为“脱靶”?何为“CRISPR”?何为“基因编辑技术”?


首先,让我们来认识这项关键技术“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被称为“CRISPR/Cas9 基因编辑技术”。


根据维基百科上的介绍来看,CRISPR 是存在于细菌中的一种基因组,该基因组中含有曾经攻击过该细菌的病毒的基因片段。细菌透过这些基因片段来侦测并抵抗相同病毒的攻击,并摧毁其 DNA 的特定部分。目前 Cas9 是首个被掌握且广泛应用的核酸酶。


该系统主要由两部分构成:一个负责剪切的 Cas9 蛋白,一个负责识别基因组中特定序列的“向导RNA”(sgRNA)。


通过该序列,科学家们可以准确且有效地编辑生命体内的部分基因(通俗来讲,就是在特定基因的特定位点切割和改变 DNA)。该技术可能会带来突破性应用,如改造细胞生产高产耐寒作物,甚至还可能帮助人类大规模消除癌症、艾滋等疾病。


机器学习预测脱靶效应


不知大家是够还记得 2017 年 5 月发表在《Nature Methods》杂志上的一篇题为“Unexpected mutations after CRISPR-Cas9 editing in vivo”的论文研究?尽管后续调查发现研究存在的实验漏洞导致了错误判断,但也侧面反映出 CRISPR/Cas9 基因编辑系统存在的技术安全上诸多挑战。


其中一个重要问题就是发生在基因组中的脱靶效应,不仅在其目标序列切割,还对相似序列进行切割,导致产生潜在突变及危害。这一现象被称为“脱靶效应”。


为此,研究人员现在有多种方法来改善这一问题。本文开头提到的 Elevation 工具正是试图通过机器学习手段予以预测。


首先,他们在生成的数据上训练出了第一层机器学习模型。这些数据报告了所有可能的靶向区域的活动,只有一个核苷酸与向导 RNA 不匹配。


然后,通过团队哈佛医学院和马塞诸塞州总医院附属医院给出的公开数据,机器学习专家训练了第二层模型,该模型将第一层模型改进并推广到模型存在多个错配核苷酸的案例中。


"第二个模型非常重要,因为脱靶效应可以发生在不止一次向导 RNA 与靶向 DNA 之间的错配",伯克利大学分校 Lisgarten 教授表示。在他看来,一些模型特征是直观的,例如向导 RNA 与核苷酸序列之间的错配问题。


最后,该团队在其他几个公开数据集上验证了他们的双层模型,这其中还包括哈佛医学院和马塞诸塞州总医院附属医院生成的数据集。


通过计算工具,研究人员可以输入他们想要修改的基因名称,搜索结果将反馈出预测的脱靶效应,研究人员据此再进行排序。研究人员面临的首要挑战是为特定的实验选择何种 RNA。在每个向导 RNA 上大约有 20 个核苷酸,因此在每组实验中,每个靶向 DNA 基因上都匹配有数百种潜在的向导 RNA。


目前 Elevation 和另一篇用于预测靶向效应的工具 Azimuth 合起来使用,现已开源代码。(链接:https://www.crispr.ml/)


一场始料未及的风波


实际上,“脱靶效应”这个早就让研究人员们“草木皆兵”的研究话题自始至终都没有妥善的解决方案,而今却因另一件尚未确认的“突破性”进展骤然掀起了世界范围内包括学术研究者在内的热议。


挑起人们兴趣的来源于 11 月 26 日的一则公开消息。


“一对基因经过修改的双胞胎婴儿已于 11 月健康诞生,基因编辑使她们将来可能具有天眼抵抗艾滋病的能力。这是世界首例免疫艾滋病的基因编辑婴儿,也意味着中国在基因编辑技术用于疾病预防领域实现历史性突破。”


来自中国深圳的科学家贺建奎在第二届国际人类基因组编辑峰会召开前一天表示。


640?wx_fmt=png

图:贺建奎


然而,这个“历史性突破”却未迎来掌声,而是更多人对该起事件的谴责。就连该技术发明人 Jennifer Doudna 也紧急回应称:“假定今天( 26 日)的新闻得到证实,这使得对基因编辑技术的使用限制更为紧迫,我们应该限制对人类胚胎细胞的基因编辑仅仅用于确切的未被满足的医学需求。”


基因编辑技术,无论是用在人类医学、动植物育种还是药物筛选领域,都存在技术与伦理道德层面的双重考验。


那么如果在可接受的伦理道德和医学需求范围之内,研究人员对基因编辑技术的探索仍旧不会终止。


这不禁让笔者想起了“进击的巨人”中描述的那样:破墙而入捕食人类的巨人,实际上在数百年前是人类自己所创造。


目前贺建奎团队表示将于11 月 28 日(本周三)在香港正式发布关于此次基因编辑的全盘报告,让我们拭目以待。


精彩推荐



CSDN 学院出品的《人工智能工程师直通车》实训营,目的是:通过 120 天的实战,将学员培养达到具备一年项目经验的人工智能工程师水平。CSDN 百天计划课程共分为 3 个阶段,4 个月完成。扫描下方二维码可领取千元优惠券。


640?wx_fmt=png

相关文章:

Flash Player漏洞利用Exploiting Flash Reliably

以下消息来自幻影论坛[Ph4nt0m]邮件组前两天推荐过Mark Dowd的Paper “Exploiting Flash Reliably”[url]http://hi.baidu.com/secway/blog/item/242655971275376855fb96d8.html[/url]学习了一下,很好很强大。为以后Flash Player漏洞的利用开辟了一条崭新崭新的道路…

java好用的hbase库_Hbase入库基于java

计划每周写一篇博客,督促自己快点学习,懒惰会让人上瘾,努力奋斗,不忘初心。某天,忽然来任务,要做hbse入库,之前自学过hbase,感觉挺简单的,网上搜了些model直接撸码&#…

linux(ubuntu)环境下安装及配置JDK

安装完IDEA之后遇到了问题,发现jdk安装完之后配置环境变量好困难,下面总结一下我的安装及配置方式: JDK下载链接:http://download.oracle.com/otn-pub/java/jdk/8u144-b01/090f390dda5b47b9b721c7dfaa008135/jdk-8u144-linux-x64.tar.gz 作者…

专访英特尔AIPG全球研究负责人Casimir Wierzynski:物理学、隐私和大脑将根本性塑造AI...

记者|琥珀出品| AI 科技大本营在 11 月 14 日至 15 日在北京召开的英特尔人工智能大会(AIDC)上,英特尔人工智能产品事业部(AIPG)全球研究负责人 Casimir Wierzynski 发表了主题为《人工智能研究——物理学、隐私和大脑…

flash php socket通信_php与flash as3 socket通信传送文件实现代码

前段时间在flashseer看到有人提到:可以通过socket方式传送swf文件,让用户无法获取到swf文件… 当时还没有出as3的反编译,所以对程序的保护没有在意.随着反编译程序的平民化,不希望别人看到源代码的朋友就比较着急…通过socket方式传送swf文件来避免泄漏源代码的思路(只适用as3)…

全线衰退:PC产业一枝孤秀

之三:全线衰退:PC产业一枝孤秀 在3C中,也许个人电脑(PC)产业算是当今中国最有希望的。中国的计算机工业号称已有50年历程,但成为民用产品的起始点应在30年前,与改革开放同时起步。1978年,国家成立了计算机工…

用Gogs在Windows上搭建Git服务

1.下载并安装Git,如有需求,请重启服务器让Path中的环境变量生效。2.下载并安装Gogs,请注意,在Windows中部署时,请下载MiniWinService(mws)版本。3.在MariaDB中创建一个命名为Gogs的数据库&#…

wamp安装多版本php,WampServer安装多个php版本

早期的WampServer安装多个版本php很简单,只需要单击php下的Get more...就行了,WampServer会自动导航到http://www.wampserver.com/addons_php.php下去安装php,但目前这种方式好像不行了,该页面找不到了,那么我们只能手…

利用Windows自带服务架设免费邮件服务器

在Windows Server 2003中带有完整的SMTP和POP3服务,并且能够支持有域和无域两种环境,非常便于中小型企业实施。今天,小编就以Windows Server 2003企业版为例带领大家架设一台免费的邮件服务器,希望能够对各位朋友学习邮件服务器提…

阿里首次开源深度学习框架X-Deep Learning

今年,各企业在开源路上的势头可以说是“你追我赶”,谁也不甘落后。6 月,小米宣布开源自己在移动端深度学习框架 MACE;9 月,腾讯 AI Lab 宣布开源一款自动化深度学习模型压缩与加速的框架——PocketFlow。双十一刚过&am…

应用基于资产的开发到 SOA 的服务中1

SOA 的主要原则之一是在整个 SOA 生命周期中将服务视为可重用资产。因此,务必在 SOA 中对服务应用正式的资产开发流程和指南。本文可帮助 IT 架构师、项目经理和 SOA 管理员全面了解一些主要 IBM 产品如何协作来帮助有效地在 SOA 中将服务作为可重用资产进行创建、使…

用Piranha来实现WEB的负载均衡

简述:利用(LVSPiranha)基于完整开源软件的架构可以提供一个简单的负载均衡及高可用的服务架构。LVS 集群采用 IP 负载均衡技术和基于内容请求分发技术。调度器具有很好的吞吐率(在DR模式下),将请求均衡地转移到不同的服务器上执行,且调度器自动屏蔽掉服务器的故 障,…

SQLServer数据库试题及答案

选择题:(20分) 1、根据关系数据基于的数据模型——关系模型的特征判断下列正确的一项:(___) A、只存在一对多的实体关系,以图形方式来表示。 B、以二维表格结构来保存数据,在…

php中怎样阻止网页进行跳转,阻止php页面跳转方法

阻止php页面跳转方法一、 header 函数header()函数的主要功能是将HTTP协议标头(header)输出到浏览器。参数void header (string string [,bool replace [,int http_response_code]])可选参数replace指明是替换前一条类似标头还是添加一条相同类型的标头,默认为替换。…

张宏江:人工智能的长远发展需要有人坐冷板凳

从金山 CEO 退休两年后,除了在源码资本任职投资合伙人,张宏江又在刚刚成立不久的北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。作为一个横跨产学研、投…

Python 中的进程、线程、协程、同步、异步、回调(一)

在进一步之前,让我们先回顾一下各种上下文切换技术。 不过首先说明一点术语。当我们说“上下文”的时候,指的是程序在执行中的一个状态。通常我们会用调用栈来表示这个状态——栈记载了每个调用层级执行到哪里,还有执行时的环境情况等所有有关…

php iis6 安装ssl证书,在IIS下部署SSL证书实现HTTPS

HTTPS是以安全为目标的HTTP通道,简单讲是HTTP的安全版。谷歌已经制定了一项长远的计划,它的最终目标是将所有通过HTTP协议呈现的网页标为“不安全”,对于站长来说,部署SSL证书来迁移到HTTPS是一个现实和重要的问题,那么…

今晚8点直播 | 微软亚洲研究院副院长刘铁岩:机器学习技术前沿与未来展望

人工智能正受到越来越多的关注,而这波人工智能浪潮背后的最大推手就是“机器学习”。机器学习从业者在当下需要掌握哪些前沿技术?展望未来,又会有哪些技术趋势值得期待? AI科技大本营联合华章科技特别邀请到了微软亚洲研究院副院…

11月最佳机器学习开源项目Top10!

整理 | Jane出品 | AI科技大本营过去一个月,我们从近 250 个机器学习开源项目中挑选出了最受大家关注的前十名。这些项目在 GitHub 上平均 Stars 数为 2713。这些项目涉及由 Google AI Research 开源的 BERT 预训练模型、DeepMind 开源的图网络库、Facebook Researc…

notepad php发布网站,谈谈如何把WordPress部署到服务器上

第一次部署本网站,稀里糊涂差不多用了大半天,真是惭愧呀,很想狠狠的抽自己一下。老子信了你的邪!!!废话不多说,大概的步骤是:前奏1.注册域名--云主机购买--域名备案--域名解析(dodo也是首次对这…

单列索引和复合索引的使用

表结构: mysql> desc car; ----------------------------------------------------------- | Field | Type | Null | Key | Default | Extra | ----------------------------------------------------------- | id | int(3) | NO …

java学习1

工作了很久,以前学的技术都差不多忘了,为了不荒废技术,现在开始起学习java,并将学习中遇到的问题加以记录。问题1、Exception in thread "main" java.lang.NoClassDefFoundError解决方法:这类问题导致的可能…

ICLR 2019高分论文抢先看,谁是第一?

作者 | 非主流出品 | AI科技大本营 ICLR 2019 将于明年的 5 月 6-9 日在美国路易斯安那州的新奥尔良市举行。本届大会共收到近 1600 篇投稿,相比 ICLR 2018 的 935 篇,以及 ICLR 2017 的 490 篇,几乎每年都在翻番。此前,ICLR 一直…

招行java开发面试,面经:Java后台开发-招行网络科技

一面:留学党的惯性凌晨面试1内容:自我介绍Final关键字数据库(mysql/oracle二选一)数据库调优脏幻不可重复读(mybatis/radis二选一)基本操作(批量插入/如何保证一致性)几种创建新对象方法我成功引导向了反射的诸多应用TCP/UDP老生常谈的区别和三挥四握问题…

puppet相关问题统计

1、 notice: Run of Puppet configuration client already in progress; skipping 解决方法: 部分情况下puppet服务会无法启动,且会提示puppet已经启动,这个时候需要删除一个文件。 rm /var/lib/puppet/state/puppetdlock …

WebForm中DataGrid的20篇经典文章

1、DataGrid动态模板列更新数据并且分页的例子 http://www.cnblogs.com/lovecherry/archive/2005/03/26/126102.html 2、DataGrid动态添加模板列的一个例子 http://www.cnblogs.com/lovecherry/archive/2005/03/25/125526.html 3、DataGrid实现增删(带提示&#xff…

Kotlin基本语法和使用

Kotlin 是一个基于 JVM 的新的编程语言,由 JetBrains 开发。与Java相比,Kotlin的语法更简洁、更具表达性,而且提供了更多的特性。 Kotlin是使用Java开发者的思维被创建的,Intellij作为它主要的开发IDE。对于 Android开发者&#…

java注解返回不同消息,Spring MVC Controller中的一个读入和返回都是JSON的方法如何获取javax.validation注解的异常信息...

Spring MVC Controller中的一个读入和返回都是JSON的方法怎么获取javax.validation注解的错误信息?本帖最后由 LonelyCoder2012 于 2014-03-14 03:16:27 编辑标题可能有点绕,看代码就明白了:这是我的User类:import org.hibernate.…

三摄正普及,四摄在路上?谷歌逆天AI算法,只做单摄虚化

作者| 琥珀出品| AI科技大本营想要提高拍照效果,想必对于多数手机厂商而言,给手机塞进更多的摄像头似乎成了当前主流做法,例如“普通摄像头景深摄像头”、“黑白彩色摄像头”、“广角长焦摄像头”……不过,偏偏有这么一家企业反其…

TBContact -- 导出ThunderBird邮件地址本

我写的一个导出ThunderBird邮件地址本的小工具,使用了多线程。其功能有:1 自动检测系统是否装有ThunderBird,并列出所有的地址本文件*.mab。2 可以手工指定一个或多个地址本文件。3 自动检测每个地址本文件里的联系人个数。4 导出每个地址本文…