当前位置: 首页 > 编程日记 > 正文

让假图无所遁形,阿里篡改图像检测大赛集结号令打响

近年来,伴随多媒体技术的迅速发展,图像安全隐患随之而来。一些不法分子通过伪造或恶意篡改证件、政府文件、转账记录截图等方式,不仅进行诈骗活动,还带来一些社会问题:2 月 10 日,广西柳州融水苗族自治县赵某某为了好玩,将一张核酸检验结果呈阴性的《检测报告详情》,P 图为阳性转发到多个微信群,造成不良社会影响,最终被依法查获。

目前 IT 界已意识到图像篡改的危害性,国内外积极开展对图像篡改检测研究,但大多数技术主要针对自然图像篡改检测,如何帮助人们日常生活中辨别假图?对此,我们采访到阿里安全媒体安全负责人渡明来解读相关技术,一探究竟。

图像篡改检测技术,让假图无所遁形

企业数字化转型正如火如荼开展,越来越多企业的业务搬到线上,众多  IT 系统支持人们通过拍照上传照片材料等形式来办理业务,无需采用传统邮寄纸质材料,方便人们生活工作。

然而有不法分子有可能通过 P 图来伪造证书资料,意图鱼目混珠。近日,阿里安全负责知识产权投诉审核的小二发现了一些有问题的资质备案图片,用户提交的品牌方证明材料竟然是手敲的空白营业执照:下载的是浙江的营业执照模板,手敲的是上海公司的名称,如果没有丰富的审核经验,可能不会注意到细微的地区字母缩写差异。这类伪造品牌方的投诉,有可能是想勒索网店或同行恶意投诉。

渡明所在的阿里安全媒体安全研究团队,致力于媒体取证及媒体水印等的技术研究,为阿里的数据安全和内容保护提供技术支持,图像篡改检测研究也是关键的一环。针对上述情况,团队将这些人工经验沉淀到 AI 伪造图像检测技术中,利用 AI 技术帮助迅速识别是否为伪造证件,并标注伪造痕迹。

在实际应用中,如何快速判断一张图是否被 P 图篡改过?渡明跟我们解释道,最简单的是通过计算机分析图片,判断图像原数据是否被修改过,如果图片里的数据信息出现丢失、不一致情况,我们可判断出图片被篡改过。通过返回“是/否”的判断,可提示用户是否需要重新上传图片。

此时如果一张照片中的“2021”被改为“2022”,假如要标记出篡改信息末尾“2”的话,采用篡改定位技术,将整个图像分成小块,统计和分析每小块的特性,分析是否被压缩、重采样、引入新特征像素等,通过对比分析,标记出小块存在的差异点,从而找出被篡改过的图像。

谈及阿里安全在这领域的优势,渡明表示,在上述判断“是/否”的问题上,团队做的算法比学术界里公开的算法更准确。在篡改定位技术上,业界公布的一些算法针对的场景较简单,可能没有考虑到一些复杂的现实场景:例如当图片被篡改后做检测测试,没有考虑图片压缩、通过 IM 软件上传下载等场景,有可能造成算法性能下降。渡明团队洞察上述场景的实际需求,在研究算法时充分考虑传输特性等因素,让算法表现将更加稳定,增强算法鲁棒性。

目前图像篡改检测技术可应用在聊天信息篡改识别及定位、资质证明的信息页面篡改识别及定位、投诉申诉业务中凭证原始性、真实性鉴定及篡改定位、物流风控场景中物流单、购物单图像的原始性、真实性鉴定及篡改定位、转账记录和聊天记录篡改识别及定位、政务软件中生成的表单图像原始性、真实性鉴定及篡改定位、其他媒体内容(如网页或图像等)的截屏篡改检测及定位等场景上。

阿里安全发布AI安全人才召集令,10 万元奖金等你来战

阿里不仅通过成立上述研究团队来深入相关算法的研究,还重视对安全人才的培养。自 2019 年开始,每年阿里安全开展“安全 AI 挑战者计划”大赛,已举办了人脸对抗识别比赛、ImageNet 图像对抗比赛、辱骂场景文本对抗比赛、通用目标检测的对抗攻击、伪造图像的对抗攻击比赛,吸引全球安全高手关注。

为推进图像篡改检测技术的发展,培养更多安全人才,2 月 17 日,阿里安全开展真实场景下篡改图像检测大赛,准备了 10 万元奖金,诚邀高等院校、科研单位、互联网企业等人员参赛。值得一提的是,为更接近真实场景,本次大赛准备了一万张图像数据集,让选手充分发挥创意。

渡明表示,通过开展大赛,将国内外对安全技术志同道合的人员聚集起来,加强开发者之间的交流沟通,帮助开发者学习和成长。同时大赛反哺阿里安全技术创新,促进阿里安全与高校、企业产学研合作,加快相关项目的研究落地。

当笔者和往届选手交流时,发现不少同学通过大赛有“意外收获”:2021年,中国人民大学计算机视觉方向的研究生鹿月与轮辉参加了“伪造图像的对抗攻击”比赛,他们在比赛中沉淀的论文研究成果被计算机视觉三大顶会之一的 ICCV 收录,并获得“伪造图像的对抗攻击”比赛的最佳论文奖,获得丰厚奖金之余,随后两人收到阿里安全的面试邀请,顺利进入媒体安全团队实习。

鹿月说,大赛作为阿里安全提供的学习和交流平台,自己在参赛过程中,通过和其他优秀选手的交流分享,收获良多,成长不少。

轮辉说,大赛开展之际,阿里安全提供相关详尽的baseline 资料,帮助了自己快速入门,迅速尝试开展研究。

想了解更多“真实场景篡改图像检测挑战赛”资讯?可点击官网:

https://tianchi.aliyun.com/competition/entrance/531945/introduction

相关文章:

Apache网页优化之网页压缩

Apache网页压缩技术 实验介绍:本实验在虚拟机的Linux系统上搭建http-2.4.2,并在配置过程中开启mod_deflate模块,实现网页的压缩功能,最终通过fiddler抓包工具,验证mod_deflate压缩是否生效。 1、首先将搭建httpd服务所需要的软件包…

推荐阅读的多核编程技术书籍

多核编程技术好书推荐 多核程序设计技术——通过软件多线程提升性能 , 作 者: (孟加拉)阿克特(Akhter,S.),(美)罗伯茨(Roberts,J.) 著…

zabbix监控windows(03,08)

监控windows主机:下载zabbix_agents_2.2.3.win.zip (zabbix官网下载)解压文件,把对应的文件(32位或者64位)考到C盘根目录(对应目录就OK)并带配置文件;编辑配置文件:zabbix_agentd.win.confLogFi…

Dubbo原理何源码解析之服务暴露

2019独角兽企业重金招聘Python工程师标准>>> 一、框架设计 在官方《Dubbo 用户指南》架构部分,给出了服务调用的整体架构和流程: 另外,在官方《Dubbo 开发指南》框架设计部分,给出了整体设计: 以及暴露服务…

维基百科上的算法和数据结构链接很强大

突然发现维基百科上的算法和数据结构比百度百科强多啦,图文并茂。 其实这个网站不错:http://www.sorting-algorithms.com 冒泡排序: bubble冒泡的意思http://zh.wikipedia.org/wiki/%E5%86%92%E6%B3%A1%E6%8E%92%E5%BA%8F-------------------…

基于 OpenCV 的图像阴影去除

作者 | 努比来源 | 小白学视觉我们经常需要通过扫描将纸上的全部内容转换为图像。有很多在线工具可以提高图像的亮度,或者消除图像中的阴影。但是我们可以手动删除阴影吗?当然可以,我们只需要将图像加载到相应的代码中,无需任何应…

not exists 跟not in 纪念一下

转载于:https://www.cnblogs.com/zzzzw/p/4973378.html

jquery $.proxy使用 Jquery实现ready()的源码

jquery $.proxy使用 在某些情况下,我们调用Javascript函数时候,this指针并不一定是我们所期望的那个。例如: 1 //正常的this使用2 $(#myElement).click(function() {3 4 // 这个this是我们所期望的,当前元素的this.5 6 $(…

PHP session回收机制

由于PHP的工作机制,它并没有一个daemon线程,来定时地扫描session信息并判断其是否失效。当一个有效请求发生时,PHP会根据全局变量 session.gc_probability/session.gc_divisor(同样可以通过php.ini或者ini_set()函数来修改&#x…

WPF学习拾遗(二)TextBlock换行

原文:WPF学习拾遗(二)TextBlock换行下午在帮组里的同事解决一个小问题,为了以后方便,把就把它收集一下吧。 新建一个TextBlock作为最基础的一个控件,他所携带的功能相对于其他的控件要来的比较少, 比较值得…

Meta 开发 AI 语音助手,用于创建虚拟世界和实时翻译

编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) Meta 在近日的「用人工智能构建元宇宙」的讨论会上,展示了最新的 AI 黑科技 「Builder Bot」 ,并且在此次会议上 Meta 公布了关于构建元宇宙的人工智能计划,其中包括…

MySQL的基础

2019独角兽企业重金招聘Python工程师标准>>> 数据库和SQL 什么数据库 数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务。 什么是SQL 结构化查询语言(Structured Query Language)…

Python:Bug 官网不要了,全迁去 GitHub

近几年,GitHub 开发者数量逐年上升,仅过去一年 GitHub 的新增用户便有 1600 万人,总用户数更是达到了 7300 万——在开源浪潮席卷全球中,GitHub 无疑成为了许多开发者迈入开源的一个重要途径。 Python 开发团队或许正是看中了这一…

最新的全球编程语言,操作系统,web服务器等使用率分析报告

由www.w3techs.com 根据alexa排名前100万的网站数据给出的分析报告,并每天持续更新。1.服务器端编程语言排名 http://w3techs.com/technologies/overview/programming_language/all点评:PHP是最高的,说明目前php是主流,但是asp.ne…

javascript中有关this的使用

this在面向对象编程中非常重要,他的值取决于调用的模式。 在Javascript中有4种调用模式:方法调用模式、函数调用模式、构造器调用和apply调用。 1. 方法调用模式:当一个方法被调用时,this被绑定到该对象。方法可以使用this访问自己…

Vue中v-if和v-show的使用场景

1. 官方文档 https://cn.vuejs.org/v2/guide/conditional.html#v-if-vs-v-show 2. v-if 和 v-show 的区别 2.1 官方解释 v-if 是“真正”的条件渲染,因为它会确保在切换过程中条件块内的事件监听器和子组件适当地被销毁和重建。 v-if 也是惰性的:如果在初…

手机自带的显示基站命令

安卓手机自带快捷指令显示当前的网络信息,不过手机厂商不同,命令也不一样。每次要用时总想不起来命令,记下备用。(1) HTC 安卓手机在拨号键盘输入 *#*#4636#*#* , 选择 “手机信息” (2)三星安卓手机 *#*#4636#*#* , 选择 “手机信息” (3)摩…

LB负载均衡集群 - NAT

前提:客户机 : eth0 192.168.0.200 eth1 192.168.205.129dir主机: eth0 192.168.0.166 eth1 192.168.205.128rs1主机: eth0 192.168.0.207rs2主机: eth0 192.168.0.208rs1 和 rs2的网关是dir 192…

时序预测的三种方式:统计学模型、机器学习、循环神经网络

作者 | luanhz来源 | 小数志导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛,…

Python 爬虫练手项目—酒店信息爬取

from bs4 import BeautifulSoup import requests import time import reurl http://search.qyer.com/hotel/89580_4.html urls [http://search.qyer.com/hotel/89580_{}.html.format(str(i)) for i in range(1,10)] # 最多157页 infos [] # print(urls)# 批量爬取数据 def g…

应用交换技术的负载均衡算法

原文出处是:http://hi.baidu.com/ruijievideo/blog/item/5959be1f3c1621ff1bd576d2.html 应用交换技术的负载均衡算法应用交换技术里主要包括四项关键的技术:◆截获和检查流量◆服务器监控健康检查◆负载均衡算法◆会话保持截获和检查流量保证只有合适的…

平民架构的春天——UCloud数据方舟实战记

LNMP是最亲民的网页服务架构,整合了优秀的开源软件,想必大家再熟悉不过了,随着云计算的落地;大众创业,万众创新的倡导,为了更好的服务和安全,LNMP也迁入了云平台,比如像UCloud这样优…

用 Python 制作可视化报表,这也太快了!

作者 | 小F来源 | 法纳斯特在数据展示中使用图表来分享自己的见解,是个非常常见的方法。这也是Tableau、Power BI这类商业智能仪表盘持续流行的原因之一,这些工具为数据提供了精美的图形解释。当然了,这些工具也有着不少缺点,比如…

Django 错误汇总

1、 解决:python manage.py migrate sessions 2、转载于:https://blog.51cto.com/jacksoner/2130665

几种负载均衡算法

几种负载均衡算法 本地流量管理技术主要有一下几种负载均衡算法: 静态负载均衡算法包括:轮询,比率,优先权 动态负载均衡算法包括: 最少连接数,最快响应速度,观察方法,预测法,动态性能分配&#…

cassandra命令

压力测试:cassandra-stress [command] -node [nodes] -mode thrift user[user] password[password] example: cassandra-stress write n10 -node 192.168.0.105 -mode thrift usercassandra passwordcassandra

《2022产业互联网安全十大趋势》发布,专家学者透析产业安全新变化

2月28日,在中国产业互联网发展联盟指导下,人民邮电报、中国信息安全、腾讯安全联合实验室、腾讯研究院联合推出《2022产业互联网安全十大趋势》。该报告由《中国信息安全》杂志出品人温哲、腾讯副总裁丁珂、腾讯研究院院长司晓等20余位行业顶级专家、学者…

slurm用户快速入门手册

1. 概述2. 架构3. 命令3.1 sacct3.2 sattach3.4 sbatch3.5 sbcast3.6 scancel3.7 scontrol3.8 sinfo3.9 smap3.10 squeue3.11 srun3.12 strigger3.13 sview1. 概述 Slurm 是一个开源、容错、高可伸缩的集群管理和大型小型 Linux 集群作业调度系统。slurm不需要对操作系统内核进…

什么是CGI、FastCGI、PHP-CGI、PHP-FPM、Spawn-FCGI?

原文地址:http://www.mike.org.cn/articles/what-is-cgi-fastcgi-php-fpm-spawn-fcgi/什么是CGICGI全称是“公共网关接口”(Common Gateway Interface),HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具,其程序须运行在网络服务器上…

5个短小精悍的 Python 趣味脚本,太赞了,非常适合小白上手!

作者 | 菜鸟哥来源 | 菜鸟学Python今天特地为大家准备了几个简单的“开胃小菜”。希望大家能够通过这几个简单而实用的小案例,活跃一下自己的思维,为接下来的工作和学习做好准备。话不多说,我们接下来就开始介绍。1、图片尺寸缩小所需库&…