当前位置: 首页 > 编程日记 > 正文

ImageNet十年,AI数据标注如何蓬勃发展?

2016 年,AlphaGo 战胜李世石,成为新一代 AI 浪潮的重要里程碑事件。

经此一役,很多人都认识到了算法和算力对 AI 发展的重要性,确忽略了另一个重要因素:数据。

2009 年,时任斯坦福大学任助理教授的李飞飞,在CVPR 2009 上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文。来自全球 167 个国家近 5 万名工作者以众包的方式,通过三年合作努力,标注出 1500 万图像,最终成为 AI 历史上的有标志性意义的数据集。

如此庞大规模的标注性数据,对 AI 领域计算机视觉技术的发展起到了极大的推动作用。从 2010-2016 年,李飞飞等发起的 ImageNet 挑战赛成果取得了惊人的成绩,其中分类错误率从 0.28 降到了 0.03,物体识别的平均准确率从 0.23 上升到了 0.66。

正是因为如此大规模标注图片数据的出现,加上深度学习算法的发展,以及芯片算力的指数型增长,引发了如今的人工智能革命。

2017 年之后,ImageNet 挑战赛不再继续,算法层面已经过拟合了,在 Top 5 上的结果也逼近饱和。ImageNet 挑战赛完成了自己的使命,但是越来越多的图像、视频、语音、文本等数据集的出现,不断推动着 AI 在不同领域继续前进。

AI商业化落地:七分靠数据,三分靠trick

如今,AI 已经进入商业化落地的阶段,然而 AI 算法模型泛化能力依旧不够,通用性较差,当前许多 AI 算法都是数据驱动的,需要持续收集大量特定应用场景的数据,然后在应用中进行持续迭代。

《奇点临近》的作者雷·库兹韦尔表示,直到 2029 年,人类也才有超过 50% 的概率开发出通用AI。一些 AI 工程师表示“七分靠数据,三分靠trick”,可见数据对 AI 落地的重要性。

随着 AI 对数据的要求越来越高,对于很多企业来说,定向收集并标注高质量的数据并不是一件易事,因此衍生出了专业的数据标注服务厂商,进行对应数据采集标注服务。

以云测数据为代表的厂商,通过自建数据场景实验室和数据标注基地,目前已经实现为智能驾驶、智慧城市、智能家居、智慧金融、新零售等众多领域提供高精度、场景化的数据采集、数据标注服务,全方位支持文本、语音、图像、视频等各类型数据的处理。

据介绍,目前云测数据深度合作伙伴覆盖了汽车、手机、工业、家居、金融、安防、教育、新零售、地产、生态系统等行业,涵盖了计算机视觉、语音识别、自然语言处理、 知识图谱等AI主流技术领域,其数据标注的最高交付质量精度最高可达到 99.99%。

AI 落地需要场景化的数据,有效的数据,才能保证落地之后的真正效果。IT 界有这么句话“Garbage in, garbage out”,只有投入高质量的数据,才能得到有意义的结果。因此云测数据等正在做的事情,其实就是帮助 AI 更好地落地。

数据标注不易:如何实现场景化数据生产?

想要做“好的数据”并不容易,现阶段人工智能技术对数据采集的需求相对复杂、聚焦,难度较大。同时,随着人们对AI算法识别准确的要求更上一个台阶,具有更高精准度的数据也成为模型训练的重中之重。

据云测数据总经理贾宇航介绍,现阶段 AI 数据服务发展有着三个大趋势:

1)“数据的精准度将成为行业追逐热点和重要突破项

随着人们对人工智能算法识别准确的要求更上一个台阶,具有更高精准度的数据 也将成为训练阶段的主流需求。云测数据在数据采集标注领域的重要优势之一, 就是能提供足够精准的训练数据,因此其最高 99.99%的精准度可较好的应对人工 智能数据精准度提升的情况,形成企业护城河。

例如,在自动驾驶领域,数据需求正向着多模态的方向发展。所谓多模态,即是对多维时间、空间、环境数据的感知与融合,而云测数据如今已经可以提供全流程的数据采集标注服务。

以基于激光雷达生成的3D点云图像标注为例,在标注工具方面,云测数据全面支持3D点云标注、3D矩形框选、语义分割、目标跟踪(用于标注点云连续帧)、2D&3D融合标注等工具的使用,同时拥有快速切帧、复制功能、2D图辅助框、有效标注区域、预置框、自动贴合等一系列提高标注效率和准确度的辅助功能。

作为深耕智能驾驶领域的 AI 数据服务商,云测数据积累了大量3D点云数据标注经验,已输出了千万帧级别的高质量点云数据。

2)人工智能向垂直领域落地,场景化数据需求迎来增长 

在算法落地阶段,经过研发与训练之后,人工智能应用从理论走向市场,对细分 场景化的数据准确度提出更高要求。这些数据采集需求相对复杂、聚焦,难度较 大,对 AI 数据服务商的场景化采集能力提出了很高的要求。 以云测数据为例,为进一步满足场景化数据的需求,首创了“数据场景实验室”进 行相应的场景化数据生产。

3)数据采集标注服务商的技术能力将变得更加重要,数据的隐私安全依旧需 要完善

技术层面来讲,随着 AI 训练数据需求多样化,以及复杂程度的提升,客户类型 丰富、数据需求多样、并发项目众多等因素对厂商的能力和效率提出更高要求。 如云测数据就拥有一套自主研发贯通创建任务、分配任务、数据处理、质检/抽 检、和数据安全管理等各环节于一体,并且能对图像、文本、语音、视频以及点 云数据做到一站式加工处理的管理和执行一体化平台。

人工智能对数据提出更高需求,展现了在人工智能产业化落地进程中,数据发挥的重要作用。我们相信,数据标注产业将会不断发展,推动 AI 领域催生出更多令人兴奋应用和场景,助力 AI 大规模商业化落地,真正推动产业智能化的发展。

相关文章:

关于webservice的异步调用简单实例

于webservice的异步调用简单实例无论在任何情况下&#xff0c;被调用方的代码无论是被异步调用还是同步调用的情况下&#xff0c;被调用方的代码都是一样的&#xff0c; 下面&#xff0c;我们就以异步调用一个webservice 为例作说明。这是一个webservice <WebMethod(Descrip…

理解NSAttributedString

An NSAttributedString object manages character strings and associated sets of attributes (for example, font and kerning) that apply to individual characters or ranges of characters in the string. 这句话就是对这个类的一个最简明扼要的概括。NSAttributedString…

Redis集群两种配置方式

2019独角兽企业重金招聘Python工程师标准>>> 第一种使用&#xff1a;JedisCluster <bean id"jedisPoolConfig" class"redis.clients.jedis.JedisPoolConfig"><property name"maxTotal" value"30" /><proper…

调用API弹出打印机属性对话框

调用api弹出打印机属性对话框 Author:vitoriatangFrom:Internet.NET Framework封装了很多关于打印的对话框&#xff0c;比如说PrintDialog, PageSetupDialog. 但是有的时候我们还需要关心打印机属性对话框&#xff0c;那么就可以调用API来解决这个问题。有几个API函数与之相关P…

Oracle DBA学习互联网化的内容

搞了多年的Oracle数据库维护&#xff0c;近几年来&#xff0c;个人感觉基本都在舒适区&#xff0c;技术上没啥进步。而且由于个人资料或者学习方法的限制&#xff0c;Oracle数据库技术上再想精进感觉事倍功半。2013年开始&#xff0c;去IOE的声势搞得轰轰烈烈&#xff0c;mysql…

离不开深度学习的自动驾驶

作者 | 小白来源 | 小白学视觉头图 | 下载于视觉中国深度学习在整个自动驾驶技术的各个部分中进行了应用&#xff0c;例如在感知&#xff0c;预测和计划中都有应用。同时&#xff0c;深度学习也可以用于制图&#xff0c;这是高级自动驾驶的关键组成部分。拥有准确的地图对于自动…

IOS -- base64编码

在iOS7以后可以用NSData自带的base64EncodedStringWithOptions进行编解码&#xff1a; 方法如下&#xff1a; - (NSString *)encodeToBase64String:(UIImage *)image {return [UIImagePNGRepresentation(image) base64EncodedStringWithOptions:NSDataBase64Encoding64Charact…

OpenCV持久化(二)

如何利用OpenCV持久化自己的数据结构&#xff1f;我们来看看OpenCV中的一个例子。 MyData.hpp定义自己的数据结构MyData如下: #ifndef MYDATA_HPP #define MYDATA_HPP#include <opencv2/core/core.hpp> #include <iostream> #include <string>using namespac…

Excel、Exchange和C#

摘要&#xff1a;Eric Gunnerson 将向您介绍如何使用 Outlook、Excel 和 C# 创建自定义的日历&#xff0c;该日历可以提供适用于短期项目和长期项目的清晰明了的版式。 下载 csharp05152003_sample.exe 示例文件&#xff08;英文&#xff09;。 虽然一月份已经过去了&#x…

这个宝藏工具,给你一种黑客般的感觉

明天要交作业了&#xff0c;吴检正在宿舍熬夜爆肝拼命敲代码&#xff0c;劈里啪啦的键盘声和咔咔的鼠标声格外嘈杂&#xff0c;室友陈琛瞥了一眼&#xff0c;背过身&#xff0c;沉沉睡去&#xff0c;留下他一人在深夜无尽的黑暗中&#xff0c;断断续续却又没有尽头的咔咔声中凌…

LSTM神经网络

LSTM是什么 LSTM即Long Short Memory Network&#xff0c;长短时记忆网络。它其实是属于RNN的一种变种&#xff0c;可以说它是为了克服RNN无法很好处理远距离依赖而提出的。 我们说RNN不能处理距离较远的序列是因为训练时很有可能会出现梯度消失&#xff0c;即通过下面的公式训…

用C#实现在PowerPoint文档中搜索文本

用编程的方式根据对象模型很容易实现在Word、Excel文档中搜索文本&#xff0c;在PowerPoint里面也同样如此&#xff0c;使用对象模型有助于我们了解office的文档结构。 搜索的思路和方法基本是一样的&#xff0c;用PowerPoint应用程序对象打开指定的文档&#xff0c;用文档对象…

雷军的最后一次 重 大 创 业

这是我人生最后一次重大创业项目。我愿意押上人生全部的声誉&#xff0c;亲自带队&#xff0c;为小米汽车而战&#xff01;——雷军作者 | Carol头图 | 下载于视觉中国出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;3月29日19:30&#xff0c;小米春季新品发布会拉…

shell之冒号的作用

冒号&#xff1a; &#xff1a;在shell中是一种命令&#xff0c;意思是总是为真&#xff0c;但是却不做任何操作&#xff0c;即总是为真的空命令eg:[rootlocalhost ~]# ${abc:t1}-bash: t1: command not found[rootlocalhost ~]# : ${abc:t1}[rootlocalhost ~]# echo $abct1[ro…

关于epel源的配置

EPEL&#xff0c;即Extra Packages for Enterprise Linux&#xff0c;这个软件仓库里有很多非常常用的软件,而且是专门针对RHEL设计的&#xff0c;对RHEL标准yum源是一个很好的补充&#xff0c;完全免费使用&#xff0c;由Fedora项目维护&#xff0c;所以如果你使用的是RHEL&am…

C#如何在Form中嵌入并且操作Excel表格

网上比较多讲述如何操作excel表的文章&#xff0c;但都是启动excel的窗口来打开excel数据文件。有时候需要把excel表嵌入到自己程序的form中&#xff0c;给客户一个不用切换窗口的操作界面&#xff0c;似乎更好。这在vc中用ole技术很容易实现&#xff0c;但是在c#中方法就不一样…

自研芯片架构 ,这家中国公司发布DPU芯片计划

近日,专注于智能计算领域的DPU芯片和解决方案公司中科驭数发布了其下一代DPU芯片计划&#xff0c;将基于自研的KPU&#xff08;Kernel Processing Unit&#xff09;芯片架构&#xff0c;围绕网络协议处理、数据库和大数据处理加速、存储运算、安全加密运算等核心功能&#xff0…

QQ超时不能刷新好友接收发送信息

如果您在其它电脑登录时正常&#xff0c;只在本地出现此种情况&#xff0c;可能与您本机的设置及网络限制有关&#xff0c;建议您先确保安装的是我司的官方版本&#xff0c;然后再搜索并删除您的QQ号码文件夹&#xff08;会丢失聊天记录&#xff0c;请注意备份&#xff09;&…

JavaStuNote 4

装箱(inbox)和拆箱(outbox) 代表了类类型和基本类型之间的转换行为。 手动版本号&#xff1a; Integer b new Integer(10); Int a b.intValue; 自己主动版本号&#xff1a; Integer b30; Integer bnew Integer(30); Int ab; int a b.intValue(); 由于基本类型…

把Doc文档转换成HTML等其它格式

利用microsoft Word 9.0 Object Library可以在页面中对Doc文档进行格式转换。有关Word对象的一些方法可以参考Open和Save。下面是进行转换的代码[C#]&#xff1a; /// <summary>/// WordToHtml 的摘要说明。/// 首先要添加引用&#xff1a;Microsoft Word 9.0 Object Li…

如何学好Python?相信很多人都做错了!

Python入门从哪开始&#xff0c;以我的过往经验&#xff0c;发现很多的教程都是这样讲的&#xff1a;先介绍 Python 的基本语法规则、list、dict、tuple 等数据结构&#xff0c;然后再介绍字符串处理和正则表达式&#xff0c;介绍文件等IO操作.... 就这样一点一点往下说。然而这…

艾麦捷科技-铂金小猪新年致辞

2019独角兽企业重金招聘Python工程师标准>>> 光阴似箭&#xff0c;2013年是匆忙的一年&#xff0c;艾麦捷科技从最初的“笑谈”到现在上线&#xff0c;招财猪进销存管理软件从无到有&#xff0c;到现在多次更新&#xff0c;无一不是在匆忙中完成的&#xff0c;尽管很…

C#开源框架整理

Json.NET http://json.codeplex.com/ Json.Net 是一个读写Json效率比较高的.Net框架.Json.Net 使得在.Net环境下使用Json更加简单。通过Linq To JSON可以快速的读写Json&#xff0c;通过JsonSerializer可以序列化你的.Net对象。让你轻松实现.Net中所有类型(对象,基本数据类型 …

提供一个基于.NET的加密/解密算法

提供一个基于.NET SymmetricAlgorithm 类的、带私钥的加密/解密算法的包装类。使用方法&#xff1a; symmcrypto de new SymmCrypto(SymmCrypto.SymmProvEnum.DES);Response.Write(x.Decrypting(de.Encrypting("ok","yyy"),"yyy")); 类的实现…

ubuntu修改IP

一、使用命令设置Ubuntu的ip地址1. 设置IP sudo ifconfig eth0 203.171.239.155 netmask 255.255.255.224 这样就算设置好了网卡eth0的IP地址和子网掩码2. 设置网关 sudo route add default gw 203.171.239.1293. 设置DNS 修改/etc/resolv.conf&#xff0c;在其中加入 nameserv…

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片

整理 | 伍杏玲出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;随着 AI、大数据、IoT 技术的相互渗透&#xff0c;人们对数据的要求也越来越高&#xff0c;如何提供普适专用、安全而强大的处理能力的架构&#xff1f;Arm 为这个答案准备十年。近日&#xff0c;Arm 推出…

HDU 6051 - If the starlight never fade | 2017 Multi-University Training Contest 2

/* HDU 6051 - If the starlight never fade [ 原根,欧拉函数 ] | 2017 Multi-University Training Contest 2 题意&#xff1a;给定 m,p, p 是素数设 f(i) 是 满足 (xy)^i ≡ x^i mod p 的 (x,y) 对数 且 1 ≤ x ≤ p-1 , 1 ≤ y ≤ m 求 ∑[1≤i≤p-1] i*f(i)限制&#xff…

干货!用 Python 快速构建神经网络

作者 | ZackSock责编 | 欧阳姝黎头图 | 下载于视觉中国前言机器学习一直是Python的一大热门方向&#xff0c;其中由神经网络算法衍生出来的深度学习在很多方面大放光彩。那神经网络到底是个个什么东西呢&#xff1f;说到神经网络很容易让人们联想到生物学中的神经网络&#xff…

才知道百度也提供了智能DNS服务 - 加速乐

http://jiasule.baidu.com/ 智能DNS 依托百度多年积累的高精度DNS识别库&#xff0c;平均只需5秒全球DNS服务器全部生效&#xff0c;百度蜘蛛1秒生效。抗攻击、无限解析记录&#xff0c;免费支持电信、联通、移动、铁通、教育网、国外、搜索引擎等分线路解析。 极致云加速 百度…

c#中结构与类的区别

类与结构的差别如何选择结构还是类一&#xff0e;类与结构的示例比较&#xff1a;结构示例&#xff1a;public struct Person {string Name;int height;int weightpublic bool overWeight(){//implement something}}类示例&#xff1a;public class TestTime {int hours;int mi…