AI 技术升级,这一新方法遏制在线语言骚扰
编译 | 禾木木
图源 | IC photo
出品 | AI科技大本营(ID:rgznai100)
哥本哈根IT大学的 Nina Nørgaard 和她的组员正在参与一项非同寻常的工作,更好地方法来识别网络上的偏见。研究人员对数千条 Facebook、Reddit 和 Twitter 帖子进行了调查,并验证这些帖子是否有性别歧视、刻板印象或是骚扰。
研究发现,22个国家的一半以上的女性说她们在网上受到骚扰或虐待。五分之一的遭受虐待的女性说她们改变了自己的行为——减少了或停止使用互联网。
社交媒体公司开始使用 AI 来识别和删除贬低、骚扰或威胁暴力侵害女性行为的帖子。研究人员发现,没有一个标准去识别性别歧视或厌恶女性的帖子;而且大多数研究都是用英语进行的,这使得在其他语言和不同文化的人更没有主观性的决定。
因此,丹麦的研究人员尝试了一种新方法,聘请 Nørgaard 和 7 名全职人员来审查和标记这些帖子。
他们会选择不同年龄和国籍、不同政治观点的人,这样就可以减少对于单一的世界观的偏见。在这些被标记的人中,包括软件设计师、气候活动家、女演员和环保人员。
研究人员表明这些对话可以更准确的标记数据来训练 AI 的算法,经过数据微调的 AI 可以在85%的时间里辨别在社交媒体平台上的偏见行为。
但是除了社交媒体之外,这些发现还是很有用的。企业也开始使用AI来筛选工作上或新闻稿中带有性别歧视的内容。
标记数据可能看起来是平淡无奇的,但这是机器学习算法工作的燃料。AI的研究伦理和研究人员还是希望AI制造商更加关注用于训练大型语言模型的数据集。如OpenAI的文本生成器GPT-3或用于识别照片中物体的ImageNet模型。
在图灵的研究中,数据标记者会按照时间来了解对话的整个内容,而不是像丹麦研究那样从单个的帖子中就得出结论。图灵的研究人员会召开会议对这些帖子如何标识进行讨论,从而达成共识。因此,他们表示在使用过数据集微调的语言模型后,准确率为92%。
Elisabetta Fersini 是意大利Milan-Bicocca大学的助理教授,她自 2017 年以来一直在研究社交媒体上的偏见。她称丹麦人员的方法是有助于标注数据和构建AI模型。同样,这项研究也可以采取一种更精细的方法来标记数据,就像图灵研究所所使用的方法。
偏见是取决于人们看到特定图像或一些文本以及社会属性。她认为应该用多种语言进行研究。由于地区、教育水平以及类型的关系,每个人的看法都是不同的。
人类学家、微软高级首席研究员Mary Gray说“他们需要更多的时间告诉你这项研究”。虽然丹麦和图灵研究人员所采取的方法对人性和个人的感觉有很多微妙的地方,但它仍然在思考个人,最终会打破这个体系。
多项研究发现,偏见是一个常见的特点。虽然Mary Gray认为那些帖子应该被标记,然后交由调解人进行处理,而不是通过AI自动决定。但这可能会导致一些不好的言论,并且这对社交媒体公司来说更是一个挑战,因为这意味着技术本身是无法解决问题的。
就像大多数的父母可能会不理解孩子说的话一样,人类和群体表达类似骚扰这样的语言是非常复杂的,不是能够通过简单的文本来标注的。然而我们可以训练AI来使用这种新方法,加强标签的多样性,这样就可以遏制在线骚扰。
参考链接:
https://www.wired.com/story/new-way-train-ai-curb-online-harassment/
往
期
回
顾
专访
把钱投给甘坐冷板凳的 AI 研究院
技术
大有乾坤,售前机器人背后 AI 技术
新闻
他的压缩算法改变了世界
转载
女程序员也有35岁危机
分享
点收藏
点点赞
点在看
相关文章:
MFC中快速应用OpenCV(转)
转载链接:http://wiki.opencv.org.cn/index.php/MFC%E4%B8%AD%E5%BF%AB%E9%80%9F%E5%BA%94%E7%94%A8OpenCV 简介和缘起 本教程原始讨论主题,请见 【原创】MFC中快速应用OpenCV教程,制作此教程的目的,就是为了方便广大windows下面使…

liunx软件安装
RPM包 1. -qa显示当前系统中以RPM方式安装的所有软件列表。 2. -qi查看指定软件包的名称、版本、许可协议、用途描述等详细信息(--info)。 3. -ql显示指定的软件包在当前系统中安装的所有目录、文件列表(--list)。 4. -qf查看指定…

程序员因开发速度太慢而遭公司起诉,索赔金额高达90万!
作为程序员,你最头疼的事情是什么?下面这个算吗?在需求不停并更地前提下,项目还得如期上线。本文程序员因未能如期上线项目,公司直接起诉至法院,并提出90万元的索赔。一起来看看这个案件中法院是如何判决的…

c程序性能优化
一段c程序,功能开发完成,开始性能优化。当然是先用 -pg 编译,再gprof看“热点”在哪里,很快找到,是计算hash值的函数,于是换了个更快的hash函数——fnv ( http://isthe.com /chongo/tech/comp/fnv/)&#x…

struts2上传图片的全过程
转载自:http://blog.sina.com.cn/s/blog_6608320c0100j6no.html1、写一个上传的jsp页面upload_p_w_picpath.jsp,内容如下:<body><center> <font color"red"><s:fielderror/></font> <s:form actio…

Java中 与,||与|的区别
阅读目录 区别短路运算举例回到顶部区别 && || 是逻辑运算,支持短路运算 & | 是位运算,不支持短路运算 回到顶部短路运算 当有多个表达式时,左边的表达式值可以确定结果时,就再继续运算右边的表达式的值; 回到顶部举例 例1 Testpublic void…

保持dropdownlist选中值
RowDataBound事件 protected void GridView1_RowDataBound(object sender, GridViewRowEventArgs e) { int i; for (i 0; i < GridView1.Rows.Count; i) { if (e.Row.RowType DataControlRowType.DataRow) { e.Row.Attributes.Ad…

js判断鼠标位置是否在某个div中
div的onmouseout事件让div消失时,会出现这样的情况,就是当鼠标移至div中的其它内容时,此时也判定为离开div,会触发 onmouseout事件,这样div中的内容就不能操作了。解决的办法是当触发onmouseout事件时,先判…

奉劝程序员们:写再多代码,还不如提升这两大能力有价值!
哪个国家的程序员水平最高?软件工程师水平测定平台HackRank发起了一系列编程挑战竞赛,给出了一份出乎意料的数据。据悉,这份数据研究分析了HackerRank社区里30万名开发者完成的140万项编码挑战。最终的结果显示中国程序员排在了第一位&#x…

IBM Thinkpad T43-44U 升级到 2G 内存后少了 66M
背景前段时间把 T43-44U 升级到 2G 内存,可以升级后,内存显示总是 1982M,少了 66M。奇怪之极,怎么搞都没搞好。有的热心网友建议重新刷 BIOS,升级到联想刚发布的 1.26 版。可是刷 BIOS 危险系数太高,俺是万…

Linux下的ATT语法(即GNU as 汇编语法)入门
学习这么长时间,一直在C语言这一层面上钻研和打拼,日积月累,很多关于C的疑惑在书本和资料中都难以找到答案。程序员是追求完美的一个种群,其头 脑中哪怕是存在一点点的思维黑洞都会让其坐卧不宁。不久前在itput论坛上偶得《Comput…

汽车高级驾驶辅助系统ADAS激光雷达创新者Cepton与Growth Capital达成企业合并协议
汽车高级驾驶辅助系统 (ADAS) 和车辆自动驾驶领域光感测距技术(激光雷达)的创新者Cepton Technologies, Inc.(以下简称“Cepton”)将与Growth Capital Acquisition Corp.(以下简称“Growth Capital”,纳斯达…

通过Navicat for MySQL远程连接的时候报错mysql 1130的解决方法
在用本地的navicat连接服务器的mysql数据库时候出现下面的问题: 解决的方法: 解决方法: 1、改表法。可能是你的帐号不允许从远程登陆,只能在localhost。这个时候只要在localhost的那台电脑,登入mysql后,更改…

17张图揭密支付宝系统架构
支付宝的系统架构图,仅供参考。不管是不是支付行业,都值得我们参考,学习。 imageimageimageimageimageimageimageimageimageimageimageimageimageimageimageimageimage推荐阅读 阿里高级Java面试题(首发,70道ÿ…

Facebook性能大提升的秘密:HipHop
facebook / hiphop-php https://github.com/facebook/hiphop-php Facebook神秘的PHP项目HipHop for PHP终于揭开面纱。这个项目由一个PHP到C的转换程序,一个重新实现的PHP运行库,和许多常用PHP扩展的重写版本构成,目的是旨在加速和优化PHP…

Android必备:Android的体系结构
2019独角兽企业重金招聘Python工程师标准>>> 链接地址:http://www.xx566.com/detail/107.html 最近一个月接触Android,开始做一些app的开发,通过参考网络上的资料,阅读Android相关的书籍,从无知到了解&…

豆瓣评分 9.4 的算法巨著,这本书带无数读者入门算法
说到算法巨著,你可能想到的是《算法导论》这本经典。但在入门算法时,还有一本与之比肩的巨著,不得不提,它就是《算法(第4版)》。这本豆瓣评分 9.4 的算法巨著,可谓是算法经典好书,给…

zabbix企业应用之监控oracle
本次介绍如何使用zabbix监控oracle,主要使用pyora这个python脚本来监控,具体地址可以参考https://github.com/bicofino/Pyora 我的zabbix版本为2.0.6,oracle为11g 下面是部分效果图 1、Oracle/Active user count 2、Oracle/Bytes sent and re…

ZendFramework的介绍、安装和实例运行
框架主要是为了提高开发效率、使得团队开发人员之间的更容易沟通和协作以及提高应用程序的可维护性。学习了解一种或多种框架对实际项目的应用会有所帮助。一、ZendFramework 的介绍:ZendFramework(以下简称:ZF),以 Model-View-Controller(MV…
input type=hidden /在IE中占空间(转)
input 的 type 设为 hidden 的话,就是隐藏域(废话)。隐藏域在页面中不显示,但可以有值。既然是“隐藏”的,怎么还说会占空间呢。这是 IE 的 bug,不过这个 bug 的出现需要一定的条件,换句话说就是…

网友:Java岗,自学一个月跳槽计算机视觉,其实入门很简单
笔者在脉脉上看到一条帖子:原来Java岗,自学一个月成功跳槽视觉算法岗。这已经不是笔者第一次看到转行成功的程序员案例了,而大家的跳槽动机基本上都离不开,发展趋势、岗位高薪、职业兴趣。计算机视觉行业真相:竞争压力…

MapReduce对交易日志进行排序的Demo(MR的二次排序)
1.日志源文件 (各个列分别是: 账户,营业额,花费,日期) zhangsan163.com 6000 0 2014-02-20 lisi163.com 2000 0 2014-02-20 lisi163.com 0 100 2014-02-20 zhangsan163.com 3000 0 2014-02-20 wangwu126.com 9000 0 2014-02-20 w…

HTTP中Get与Post的区别
Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认 为:一个URL地址,它用于描述一个网络上的资源,而…

sdut AOE网上的关键路径(spfa+前向星)
http://acm.sdut.edu.cn/sdutoj/showproblem.php?pid2498&cid1304 题目描述 一个无环的有向图称为无环图(Directed Acyclic Graph),简称DAG图。 AOE(Activity On Edge)网:顾名思义,用边表示活动的网ÿ…

苹果新功能惹网友众怒,还有隐私可言吗?
编译 | 禾木木出品 | AI科技大本营(ID:rgznai100)大部分人选择 iPhone 的一大理由就是信息安全,这家公司对于个人隐私的保护一直为人称赞。最近苹果公司宣布,为了让儿童能够更加安全地上网,他们决定在iOS 15、iPADOS 15、macOS Monterey系统中…

让Ubuntu拥有SUSE一样的GRUB启动界面
SUSE的漂亮大家可能都见识过,尤其是那个Grub启动画面。我身边的朋友为了在自己的系统上也能使用SUSE的GRUB启动画面,用了一种原理比较简 单,过程比较白痴的方法:先安装SUSE,把/boot单独分区,然后把除了/boo…

计算机编程简史图
计算机编程简史图www.21kaiyun.com 21世纪开运网 算准你每天的桃花运 帮忙推广下我的网站 谢谢

HTML5 模板推荐
http://www.yundic.com/转载于:https://www.cnblogs.com/lsl8966/p/4133484.html

Windows 11 再惹“众怒”!网友:微软就是逼我去买新电脑!
整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)一般来说,不论是移动还是桌面操作系统,如若要升级版本,大多用户都不会产生过大的抵触情绪,毕竟更新往往都是为了确保用户获得最佳体验。但近来用户对微软…

刚学习了linux的DHCP 配置.呵呵.自己上来总结下.
先来看DHCP的工作原理.DHCP (Dynamic Host Configuration Protocol)下面的部分是google找的....~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~DHCP来自ITwiki,开放的信息技术大百科DHCP是Dynamic Host Configuration Protocol的…