当前位置: 首页 > 编程日记 > 正文

色情低俗、暴力恐怖内容...如何用AI“一网打尽”?

640?wx_fmt=png


作者 | Rachel、Just

出品 | AI科技大本营(ID:rgznai100)


移动互联网时代催生了大量的多媒体数据,每天在社交平台、长短视频、直播平台、新闻资讯等内容平台产生了数以亿计的图片和视频,这些数据的内容审核面临严峻的挑战。人工审核显然费时又费力,这时,以计算机视觉为代表的 AI 技术开始大显身手。


诸多相关业务的平台推出了相应技术平台,有着庞大内容生态的腾讯也不例外。成立于 2012 年的腾讯优图实验室承载着腾讯在计算机视觉领域的研究内容,专注于图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地,因此,优图也推出了基于深度学习算法的自研内容审核一站式平台:DeepEye。


该平台集色情内容识别、暴力恐怖内容识别、涉政敏感内容识别、低俗行为识别、Logo 识别等业务于一身。如此庞杂的识别业务背后,我们不禁要问:DeepEye 平台与其他内容审核平台相比有何技术特点?优图在图像和视频理解领域又有哪些技术创新?多模态机器学习是否会成为视频内容理解技术的主要研究方向?


作为 5 月 25 日-5 月 27 日即将在杭州举办的 CTA 大会(官网:https://dwz.cn/iSZ7BQUR)机器学习论坛的演讲嘉宾,AI科技大本营就上述问题采访了腾讯优图实验室高级研究员彭湃。


640?wx_fmt=jpeg

彭湃,2016 年加入腾讯,负责优图实验室深度学习和图像理解方向的技术研究和项目落地,主导包括 Qzone 相册、腾讯觅影、优图天眼、DeepEye 等重点项目的研究与落地。曾发表多篇研究论文,并被 CV 领域国际顶级会议和期刊(SIGIR x3、TKDE、UbiComp、MM、CIKM、ICMR等)收录。


以下为采访内容实录:


AI科技大本营:您个人在腾讯优图发表了一些高水平会议论文和期刊文章,目前最满意的是哪一篇?在发表论文方面,有什么经验可以分享?


彭湃:关于论文发表方面,其实优图实验室非常鼓励大家在平时的工作中,把一些在项目中发现的好用的模型、方法、Trick 沉淀为高水平论文,一方面是升华对问题更加深刻的理解,另一方面也提升了自己和部门在学界业界的影响力。


AI科技大本营:近几年,你们在图像和视频理解领域取得了哪些新的技术进展?


彭湃:优图实验室近期在场景化的方向取得了比较大的进展,比如一个关键的核心技术就是行人重识别的技术,我们创新性地提出了基于金字塔结构的行人视觉特征学习算法,该算法发表在计算机视觉领域顶级会议 CVPR 2019 上,并在行人重识别的 3 大数据库刷榜第一。


AI科技大本营:优图内部主要的的考核目标是怎样的?你们是如何平衡科研和工程落地的?


彭湃:优图实验室的理念是做“实用”的前沿技术,这里的“实用”是指我们探索和沉淀出来的核心前沿技术,是要能够用在实际项目落地中去,真正地服务好用户和企业。因此,我们大多时候都是从我们手头上正在做的实际项目出发,思考当前场景下核心的技术挑战和难点是什么,这样抽象出来的问题非常具有实用价值,我们把这种模式的科研思维称为业务导向的研究思路。


AI科技大本营:您个人获得过公司级业务突破奖以及技术突破奖各 2 次,能否具体介绍下内容审核技术上取得了何种突破?


彭湃:我觉得所有的奖项授予的并不是个人,而是团队。在内容审核中,尽管当前的深度学习模型几乎都在高性能 GPU 上训练,但是业务落地大规模部署的场景,大量的 GPU 成本昂贵,因此 CPU 部署通常是业务上性价比更高的选择,但缺点是推断(Inference)耗时长。考虑实际业务中,正常图片还是占比较大,因此我们的解决思路是训练一个浅层的小模型和深度的大模型,小模型用来过滤掉大多数的正常图片,只让有异常的图片进入到大模型。这样的级联模型部署方式可以大大降低业务方的部署成本。


AI科技大本营:内容审核对于视频网站而言是非常重要的工作内容,腾讯优图针对视频审核开发了专门的平台 DeepEye,该平台与其他企业的内容审核平台相比有哪些独特性?


彭湃:DeepEye 是优图实验室维护互联网内容生态健康而打造了一套基于深度学习算法的内容审核平台,该平台具备色情内容识别、暴力恐怖内容识别、涉政敏感内容识别、低俗行为识别、Logo 识别等。考虑到内容审核场景面临的大都是数据吞吐量较大的业务,大量的 GPU 部署将提高业务成本,因此在算法设计和选型上,我们并没有过分依赖于单一的深度模型,而是采用了浅层小模型和深层大模型级联的方式,这种部署方式可以快速在 CPU 上实现大规模的并行部署,大大降低成本。


AI科技大本营:未来几年,多模态机器学习会是视频内容理解技术的主要研究方向吗?


彭湃:是的,多模态的信息融合要比单一模态来的更加有效果。以内容审核场景为例,有时候不仅仅是某张图像本身的视觉内容有问题,而是图像上面的文字、数字出现了涉黄、涉政字眼,这时候只有图像语义理解的单一能力就无法搞定此类 case,而结合 OCR 以及词库过滤就可以更好地解决这类问题。


(*本文为 AI科技大本营原创文章,转载请联系微信1092722531


CTA核心技术及应用峰会



5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。


更多重磅嘉宾请识别海报二维码查看。CTA深度培训已经开课,主会议倒计时 1 天,少量余票即将售罄,欢迎点击阅读原文购票参会!更多详细信息15101014297,备注“CTA”,了解票务以及会务详情。


640?wx_fmt=jpeg


推荐阅读

  • 危机加剧:ARM釜底抽“芯”,华为腹背受敌

  • 面对996,程序员如何利用“碎片时间”涨薪?

  • 权威解读 GitHub、Apache 疑云:主流开源软件究竟是否会被闭源?

  • Kaggle季军新手笔记:利用fast.ai对油棕人工林图像进行快速分类(附Python代码)

  • 程序员连拿3份Offer,每份高达45K?他说做对了这些!

  • ARM到底是一家什么样的公司?

  • 为什么你写了一万小时的代码,却没能成为架构师?| 程序员有话说

  • 别怀疑,孩子在家里也能学编程!

  • 百花村区块链山的选民们, 超有趣!

640?wx_fmt=png


点击阅读原文,了解CTA核心技术及应用峰会

相关文章:

想要学好Go语言的必须知道的一个小技巧

2019独角兽企业重金招聘Python工程师标准>>> 由于我转Go语言比较早,很多认识我的,转Go或学习Go的同学遇到问题,经常会过来问我,然后,我发现。 除了学习Go语言可以看那些资料,这个问题以外&#…

【CSS3教程】CSS3基础常用技巧实例集合

为什么80%的码农都做不了架构师?>>> CSS3常用技巧 CSS3下条纹&方格斜纹背景的实现 一、效果抢先:CSS3下的条纹背景demo 这些美丽的纹饰全部都是由CSS实现的,没有一点点的图片。 二、原理简述 主要是应用了两个CSS3的属性&…

【FFmpeg】ffmpeg工具源码分析(二):转码核心函数 transcode

1、转码流程 1)转码前初始化:打开输入输出文件,初始化编码器、解码器、过滤器,创建多线程,设置串口终端等; 2)while循环处理每一包数据,核心函数 transcode_step(稍后分析); 3)转码结束前收尾工作:关闭多线程,刷新编解码缓冲区,恢复串口终端设置,向输出文件写…

在CentOS7上部署Apache Mesos

概述 Apache Mesos是一款基于多资源(内存、磁盘、CPU、端口等)调度的开源集群管理套件,能使容错和分布式系统更加容易。 工作原理 Apache Mesos采用了Master/Slave结构来简化设计,将Master做得尽可能轻量级,仅保存了各…

CTA核心技术及应用峰会开幕!(附第二日参会攻略)

全球智能化趋势当前,人工智能技术正蓬勃发展。为了直击开发者在机器学习与人工智能技术研究与落地过程中的痛点与瓶颈,深入解析机器学习和知识图谱技术在行业中的实践和落地。2019 年 5 月 26 - 27 日,由中国 IT 社区 CSDN 与数字经济人才发展…

Sharepoint学习笔记—ECMAScript对象模型系列-- 8、组与用户操作(一)

这里总结一下关于使用ECMAscript对象模型来操作Goup与User的常用情况,因为内容较多,所以拆分为两个部分,这部分主要内容如下: 1、取得当前Sharepoint网站所有的Group 2、获取当前登录用户的Title与所属Group 3、获取指定Group下的…

【FFmpeg】ffmpeg工具源码分析(三):分配过滤器内存(宏GROW_ARRAY)详解

0、引言 在ffmpeg.c源码的核心函数transcode() 中,先执行初始化操作transcode_init() ; 首先初始化过滤器filtergraphs,在寻找过滤器在哪分配时,发现它使用宏GROW_ARRAY以增长的方式来分配内存。 1、GROW_ARRAY原型 #define GROW_ARRAY(array, nb_elems)\array = grow_a…

技术引路:机器学习仍大有可为,但方向在哪里?

整理 | CTA 直播小分队出品 | AI科技大本营(id:rgznai100)杭州国际博览中心,这里曾经是二十国集团领导人第十一次峰会的主场馆,5 月 26 日 CTA 核心技术与应用峰会(杭州)同样在这里正式召开&…

基于GTID模式MySQL主从复制

基于GTID模式MySQL主从复制 GTID复制原理:基于GTID的复制是MySQL 5.6后新增的复制方式GTID (global transaction identifier) 即全局事务ID, 保证了在每个在主库上提交的事务在集群中有一个唯一的ID.在原来基于日志的复制中, 从库需要告知主库要从哪个偏移量positio…

NET Framework 2.0中的数据访问新特性

1异步数据访问 a)支持异步数据编程 b)SqlConnection – BeginOpen – EndOpen c)SqlCommand – BeginExecuteNonQuery – BeginExecuteReader – BeginExecuteXmlReader – EndExecuteNonQuery – EndEx…

【网络】通讯名词解释:带宽、速率、波特率、奈奎斯特定律、香农定理

1、带宽 1.1 解释一 带宽,又叫频宽,是数据的传输能力,指单位时间内能够传输的比特数。高带宽意味着高能力。 数字设备中带宽用bps(b/s)表示,即每秒最高可以传输的位数。 模拟设备中带宽用Hz表示,即每秒传送的信号周期…

这可能是最全的机器学习工具手册!

作者 | 红色石头转载自 AI有道(ID:redstonewill)工欲善其事必先利其器!之前我也断断续续给大家发文整理过一些关于数据科学,尤其是机器学习、深度学方面的速查手册!但是,每次分享的都比较是针对某一块的内容…

保持分布式团队同步

分布式团队最大的挑战是沟通,这对建立协作的基本原则必不可少。调整工作时间,互相适应,而团队联络员有助于沟通和同步工作。以信任、尊重和开明为基础的团队会鼓励组织中的人们互相帮助,培养一种使团队保持同步的文化。\\SkuVault…

Word2010开发——操作文档

参考: http://blog.csdn.net/akipeng/article/details/6534375 http://www.haogongju.net/art/19029 首先建立一个Word外接程序(Word AddIn)(家里的Vs竟然是中文版,汗!) 接着在项目中新增项&…

【驱动】ubuntu安装内核头文件

1、检查是否已经安装 使用dpkg-query命令检查是否有可用的内核头文件。 $ dpkg-query -s linux-headers-$(uname -r) 如果输出显示install ok installed说明已经安装成功 Package: linux-headers-4.15.0-142-generic Status: install ok installed2、安装内核头文件 $ sudo…

嫌Terminal终端太单调?快收下这几个有趣的改造工具!

整理 | Rachel责编 | 琥珀出品 | AI科技大本营(ID:rgznai100)【导语】Terminal(终端)是程序员常用的工具之一,常用于系统的相关配置修改。系统自带的 terminal 较为简单,很多 Github 的开源项目都尝试对终端…

关于matlab向文件写入数据的方法——留着备用

MATLAB数据采集的时候,往往需要把得到的数据保存下来。 fid fopen(文件名,‘打开方式’); 说明:fid用于存储文件句柄值,如果fid>0,这说明文件打开成功。打开方式有如下选择: ‘r’&#xff…

js在页面滚动到一定位置时触发事件?

function getTop(e) {var offsete.offsetTop;if(e.offsetParent!null) //只要还有父元素,也就是当前元素不是根节点就继续往上累计元素的高度offsetgetTop(e.offsetParent);return offset; } var myBlockTop getTop(document.getElementById("homepageBanner")); va…

【C语言】学习笔记3——字符串

1. 字符串(charcacter string)是一个或多个字符的序列 2. C语言没有专门用于存储字符串的变量类型。字符串都被存储在char类型的数组种。 3. 数组由连续的存储单元组成,字符串种的字符被存储在相邻的存储单元中, 每个单元存储一个…

Facebook 的AI翻身之战!

作者 | Michael K. Spencer译者 | 王艳妮,责编 | 屠敏出品 | CSDN(ID:CSDNnews)Facebook最近举办了F8会议,这是了解这个平台未来发展的绝佳机会。 F8是Facebook的年度开发者大会——一个为期数日的活动,期间…

【Linux驱动】ThinkPad笔记本wifi模块rtl8821ce在ubuntu16.04的驱动(默认没有)

0、wifi模块型号 在win10下设备管理器中查看,型号为:Realtek 8821CE Wireless LAN 802.11ac PCI-E NIC 1、问题描述 在ThinkPad上安装win10ubuntu16.04双系统后,在win10下wifi可以正常使用,但是在ubuntu下没有wifi列表。 2、…

关于Linux的inode和dentry的一组文章

先mark一下,有时间再看。 http://www.ruanyifeng.com/blog/2011/12/inode.htmlhttp://teaching.idallen.com/dat2330/04f/notes/links_and_inodes.htmlhttp://www.thegeekstuff.com/2012/01/linux-inodes/http://blog.chinaunix.net/uid/7828352/frmd/-1.htmlhttp:/…

为什么Rust连续4年获“最受喜爱编程语言”?

作者 | Mike Tang责编 | Aholiab出品 | 区块链大本营(blockchain_camp)2015年5月15日,Rust编程语言核心团队正式宣布发布Rust 1.0版本。4年来,它优雅的解决高并发和高安全性系统问题的能力,受到了越来越多开发者的喜爱。并且连续4…

【Windows】清除win10开始菜单中失效打程序标签

1、问题描述 安装新版本Qt程序,卸载旧版本Qt后,在开始菜单中,还有残留,但是已经失效,需要删除这些失效的程序标签。 2、显示隐藏文件夹 打开此电脑——查看——勾选“隐藏项目”: 3、删除失效的程序标签…

解析equals(Object obj)和compareTo(T obj)

背景:最近在研究静态扫描的东西,遇到一个规则:"equals(Object obj)" should be overridden along with the "compareTo(T obj)" method 然后就想深度扒一扒equals和compareTo有什么区别 1.java.lang.Object是所有类的父类…

安装和部署Exchange Server 2007

为什么Exchange Server 2007使用服务器角色? 简化部署和管理 增强可扩展性 改进安全性 见下图:什么是邮箱服务器角色? 邮箱服务器角色: 存储用户邮箱和公共文件夹 通过群集, LCR, CCR实现高可用性 并不在邮箱之间转输邮件邮箱服务器: 不应该能从Internet直接访问 必须是活动…

AI时代,中国技术创新如何弯道超车?

2019 年 5 月 26 日 - 27 日,杭州国际博览中心,由工信部人才交流中心指导,CSDN 和数字经济人才发展中心主办的 CTA 核心技术及应用峰会圆满落下帷幕。本次大会聚焦机器学习、知识图谱等 AI 领域的热门技术,关注技术在行业中的实践…

【TX2】英伟达Nvidia TX2连接蓝牙设备

1、问题描述 买了一个蓝牙键盘(航世B.O.W 折叠键盘HB099,200大洋),尝试在连接TX2的蓝牙,试试好使不 2、安装蓝牙 Blueman 是一个适合在 GNOME 桌面环境使用的图形化蓝牙管理工具。 sudo apt-get install blueman b…

usermod

功能说明:用于修改系统已经存在的用户账号信息。 参数选项:-c comment 修改用户password文件中用户说明栏,同useradd -c功能。-d home_dir 修改用户每次登入时所使用的家目录,同useradd -d功能。-e expired_date 修改用户终止日期…

asp.net 获取当前时间的格式

在平时的编程中,经常会用到获取当前的系统时间,格式也很特定,今天就把一些格式整理了一下,贴出来,以便以后的使用。 //获取日期时间 DateTime.Now.ToString(); // 2008-9-4 20:02:10 DateTime.Now.ToLocalT…