当前位置: 首页 > 编程日记 > 正文

网红 AI 高仿坎爷发布说唱情歌,歌迷:堪比真人原声

来源 | Hyper超神经

头图 | 下载于视觉中国

近日,一个基于 Tacotron2 和 Transformer 实现文字转声音的 AI 应用——Uberduck.AI 破圈了,不少 TikTok 、YouTube 网红博主都在推荐这一神器。

YouTube 的网红音乐艺术创意机构 Herr Fuchs 发布了一首新歌,基于Uberduck.AI 合成了知名嘻哈歌手坎爷 Kanye West 的声音,并创作了这首《The Breakup》。

这首融合了流行音乐元素和 AI 技术的《The Breakup》一经发布,就收到了乐迷和开发者们的关注。

网友们盛赞这首歌的品质堪比坎爷本爷的作品,声线也如假包换,还有不少网友留言:「这首歌应该放到坎爷的新专辑里」、「我觉得这首秒杀了坎爷的其他歌」、「坎爷被打脸」等等。

UberDuck AI 携语音合成技术出圈

这首听起来制作精良、几乎接近坎爷本人声线的歌曲,是在作词后,经由 Uberduck AI 将歌词文本转换为语音,这一步通过 Tacotron 2 将歌词生成语音,并进行声音风格迁移,对侃爷的声音进行模仿输出。

配合上 Herr Fuchs 的两位艺术家作曲和制作,最终形成了这首作品。

Uberduck AI(项目地址 https://uberduck.ai/)在官网中介绍,这是一个始于 2020 年的社区共建的开源项目,发起人希望可以打造一个友好、创意、开放的对话服务。

在 Uberduck AI 的官网上,只要输入语言文本,选择你想要模仿声音的角色,就可以生成他们的声音。

帮助 UberDuck AI 实现文本到语音生成的 Tacotron2 是 Google 发布的基于深度学习的端到端的语音生成模型,模型分为:具有注意力的循环序列到序列特征预测网络,该网络根据输入字符序列预测梅尔谱帧的序列,和 WaveNet 的修改版,可生成以预测的梅尔谱帧为条件的 time-domain waveform 样本,效果更接近自然人声。

Tacotron2 模型结构

Uberduck AI 通过 Discord 和 Github 维护项目,目前已经有 20 多个代码贡献者,近千名成员,开发者可以优化生成模型、贡献角色语音语料库,还可以为生成出的声音增加效果比如唱歌、说唱、语气等等。

在项目网站上可以选择模仿生成的角色,这些语音语料和模型优化,也都是由代码贡献者一起参与的。目前支持直接生成的角色,包括动画人物:米老鼠、海绵宝宝、疯狂动物城里的狐狸 Nick 等;还可以选择诸如神秘博士、小黄人等影视剧里的角色。

YouTube 网友上传的各个角色语音生成效果(英文)

还可以选择游戏里的人物,比如《2077赛博朋克》里的银手、《侠盗猎车手》里的 NPC 还有超级玛丽。当然也包括现实中的知名人物,比如坎爷、阿姆和几位演员。

Uberduck 还开放了项目的 Colab,有兴趣的小伙伴可以继续深入了解:

词曲作者:瑞士的网红先锋艺术家

这首歌的成功,也依赖于词曲作者的不凡才华。

艺术家 Reto Hüttenmoser 和 Gina Pigagnelli 来自于瑞士苏黎世,两个人组成了 Herr Fuchs 这家创意广告机构,他们的主业是为汽车品牌商设计广告和营销方案,副业是 YouTube 上的网红博主。

这首《The Breakup》的歌词不仅非常符合 Hiphop 和 Rap 的审美标准,说唱歌词里还设计了非常有坎爷个人风格的表达,比如吐槽和卡戴珊的婚姻、竞选美国总统等等。

词曲作者 Herr Fuchs 团队

近期他们还创作了一首《Dogecoin Song - To the Moon 》(涨到月球——狗狗币之歌),获得 Elon Musk 的转发,在 YouTube 上播放量破百万次。

相关链接:

《The Breakup》:https://www.youtube.com/watch?v=G9UHNaeutNs

Uberduck AI:https://uberduck.ai/

Uberduck AI colab:https://colab.research.google.com/drive/1WTilMdm9Vf7KE79gzkeeTBigAN6iv3Bg

相关文章:

设计模式C#描述——抽象工厂模式

设计模式C#描述——抽象工厂模式 阅读此文应先阅读简单工厂模式与工厂方法模式 抽象工厂模式是对象的创建模式,它是工厂方法模式的进一步推广。 假设一个子系统需要一些产品对象,而这些产品又属于一个以上的产品等级结构。那么为了将消费这些产品对象的责…

怎样才能学好Vue,听听尤雨溪怎么说?

如果你想问前端最值得学习的框架是什么,我一定会毫不犹豫地告诉你是Vue。无论你是技术小白还是前端工程师,Vue的重要性自不必多说。从首个Commit的提交到破茧重生的Vue3、Vite2,Vue凭借轻量级、简单易学等优势,不仅荣登GitHub Rep…

如何彻底卸载mysql(xp)

如何彻底卸载mysql 完整的卸载MySQL 5.x 的方法: 1、控制面板里的增加删除程序内进行删除 2、删除MySQL的安装文件夹C:\Program Files\MySQL,如果备份好,可以直接将文件夹全部删除 3、开始->运行-> regedit 看看注册表里这几个地方删…

(一)JNDI基础

一、简介 在Tomcat 4.1.27之后,在服务器上就直接增加了数据源的配置选项,直接在服务器上配置好数据源连接池即可。在J2EE服务器上保存着一个数据库的多个连接。每一个连接通过DataSource可以找到。DataSource被绑定在了JNDI树上(为每一个Data…

C# Idioms: Enum还是Enum Class(枚举类)

原文排版格式:http://www.marshine.com) reversion:2004/5/28 修改说明:感谢Ninputer提到的CLS兼容问题,同时修改了原来版本没有提及的Equals改写,以及修改""重载的不完善代码,和增加enum struct内容 reversion:2004/6…

构建第三代人工智能核心能力,清华、阿里、RealAI等联合发布最新AI安全评估平台

科技是发展的利器,也可能成为风险的源头。近日,张钹院士在智源大会上表示,AI的发展带来了科技是发展的利器,也可能成为风险的源头。近日,张钹院士在智源大会上表示,AI的发展带来了新的风险和安全隐患。 在…

Java 事件响应

按钮按钮(JButton)在界面设计中用于激发动作事件。按钮可显示文本,当按钮被激活时,能激发动作事件。JButton常用构造方法有:JButton():创建一个没有标题的按钮对象;JButton(String s):创建一个标题为s的按钮…

C# Idioms: Safely方法

(原文排版格式 http://www.marshine.com) 名称 Safely Method 意图 通过方法保证返回有效(不为空引用,null或Nothing)的对象或抛出异常,当存在多个调用者时简化调用者需要处理null返回值的代码。 动机 一个存放对象的集合或类似功…

Akka的Actor编程

2019独角兽企业重金招聘Python工程师标准>>> ActorSystem(“companyname”) 相当于注册一家公司一样,负责: 通用配置 如:dispatchers, deployments, remote capabilities and addresses 创建Actor和搜索actor 通常一个应用一个…

干货!机器学习中,如何优化数据性能

作者 | 中国农业银行研发中心 张梓聪出品 | AI 科技大本营(ID:rgznai100)头图 | 下载于视觉中国得益于覆盖各种需求的第三方库,Python在今天已经成为了研究机器学习的主流工具。不过由于其解释型语言的特性,在运行速度上往往和传统…

JavaScript深入理解对象方法——Object.entries()

Object.entries() Object.entries()方法返回一个给定对象自身可枚举属性的键值对数组,其排列与使用 for...in 循环遍历该对象时返回的顺序一致(区别在于 for-in 循环也枚举原型链中的属性)。 语法 Object.entries(obj) 参数 obj可以返回其可枚…

C#非对称加密程序

using System; using System.Drawing; using System.Collections; using System.ComponentModel; using System.Windows.Forms; using System.Data; using System.IO; using System.Text; using System.Security.Cryptography; namespace 非对称加密 { /// <summa…

Exchange Server2013 系列十:证书的配置

Exchange Server2013 系列十&#xff1a;证书的配置杜飞经过前面的配置&#xff0c;基本上可以进行简单的邮件通讯了&#xff0c;但是当用户通过OWA连接邮箱时会报下面的提示&#xff1a;其他一些服务&#xff0c;如 Outlook Anywhere 和 Exchange ActiveSync&#xff0c;也要求…

高级程序员到底高级在哪里?

身为一名技术人&#xff0c;你是否遇到过这些情况&#xff1f;工作效率低&#xff1a;别人1小时就能修复的bug&#xff0c;你需要3小时没有存在感&#xff1a;技术趋势看不透&#xff0c;和同事聊天完全插不上话技术提升慢&#xff1a;苦熬996&#xff0c;但升职加薪仍然遥遥无…

AlexNet 网络详解及Tensorflow实现源码

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 1. 图片数据处理2. 卷积神经网络 2.1. 卷积层2.2. 池化层2.3. 全链层3. AlexNet4. 用Tensorflow搭建完整的AlexNet5. 用AlexNet识别猫狗图片 5.1. 定义分类5.2. 训练网络5.3. 验证1. 图片数据处理 一…

.net反射详解(转)

摘自&#xff1a;http://www.cnblogs.com/knowledgesea/archive/2013/03/02/2935920.html 概述反射 通过反射可以提供类型信息&#xff0c;从而使得我们开发人员在运行时能够利用这些信息构造和使用对象。 反射机制允许程序在执行过程中动态地添加各种功能。 运行时类型标识 …

C# 多网卡 Server Listen

VC和BCB中做一个Server的监听程序,只需要指定端口,然后监听(Listen)就行了.在C#找不到这个函数了,慢慢看MSDN,怎么需要指定IP和Port才能监听,那么多网卡的机器应该怎么写程序呢?下面的程序可以解释怎么去做. TcpListener 类别会提供简易的方法&#xff0c;用以在封锁的同步模式…

赠书 | 一文了解预训练语言模型

来源 | 博文视点头图 | 下载于视觉中国近年来&#xff0c;在深度学习和大数据的支撑下&#xff0c;自然语言处理技术迅猛发展。而预训练语言模型把自然语言处理带入了一个新的阶段&#xff0c;也得到了工业界的广泛关注。通过大数据预训练加小数据微调&#xff0c;自然语言处理…

写了六个相同功能的函数之后,我学到了什么

本文讲的是写了六个相同功能的函数之后&#xff0c;我学到了什么&#xff0c;几周之前&#xff0c;一个社区在 Free Code Camp’s Forum 上发起了非官方的算法大赛。 这个题目看似很简单&#xff1a;返回小于数字 N 的所有 3 或者 5 的倍数的和&#xff0c;N 是函数的参数。 但…

libevent介绍

libevent是一款事件驱动的网络开发包 由于采用 c 语言开发 体积小巧&#xff0c;跨平台&#xff0c;速度极快。 通常我们在建立服务器的处理模型的时候,主要是下面集中模型;(1) a new Connection 进来&#xff0c;用 fork() 产生一个 Process 处理。 (2) a new Connecti…

蓝色起源载人火箭7月首飞,贝索斯即将实现儿时愿望

整理 | 寇雪芹出品 | AI 科技大本营&#xff08;ID:rgznai100&#xff09;头图 | 下载于ICphoto美国当地时间6月7日早&#xff0c;亚马逊创始人、世界首富贝索斯&#xff08;Jeff Bezos&#xff09;在社交媒体上发帖表示&#xff0c;自己将在7月20日乘坐蓝色起源&#xff08;Bl…

使用jquery.more.js来实现点击底部更多后, 底部加载出新的数据

<div class"bus-nav-bar ft12"><div class"navt bor-r-c pos-rel {if $int 0}fwbold{/if}"><a href"portal.php?modmerchant&actionvoucherlist&int0">全部订单</a><em class"pos-abs"></…

ios开发学习-手势交互(Gesture)效果源码分享

qianqianlianmengios开发学习-手势交互&#xff08;Gesture&#xff09;效果源码分享 All Around Pull View 介绍&#xff1a;实现视图四个方向&#xff08;上下左右&#xff09;都能够拖动更新&#xff08;pull to refresh&#xff09;。 编译测试&#xff0c;测试环境…

通过C#实现集合类纵览.NET Collections及相关技术

概述&#xff1a;在真正的对象化开发项目中&#xff0c;我们通常会将常用的业务实体抽象为特定的类&#xff0c;如Employee、Customer、Contact等&#xff0c;而多数的类之间会存在着相应的关联或依存关系&#xff0c;如Employee和Customer通过Contact而产生关联、Contact是依赖…

TIOBE 6 月榜单: Python 有望超越 C 语言成为第一名

整理 | 苏宓出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;头图 | 下载于ICphotoTIOBE 官方最新发布了 6 月的编程语言榜单&#xff0c;这个月榜单中又有怎样的发展趋势&#xff1f;Python 有望成为第一名在本月榜单中&#xff0c;位居第二名的 Python 与第一名 C…

使用dom4j解析XML例子

包括三个文件&#xff1a;studentInfo.xml(待解析的xml文件), Dom4jReadExmple.java(解析的主要类), TestDom4jReadExmple.java(测试解析的结果) 代码运行前需先导入dom4j架包。 studentInfo.xml文件&#xff08;该文件放在本项目目录下&#xff09;内容如下&#xff1a; <?…

mkdir、rmdir命令、head、tail命令

mkdir-p 递归创建目录11里面都是空目录rmdir删除空目录 -p 当子目录被删除后使它也成为空目录的话&#xff0c;则一并删除步骤&#xff1a;先删除11/22/33 发现22目录空了&#xff0c;因为33删了&#xff0c;于是再删22&#xff0c;空了再删11head默认是前10行 –n指定几行tai…

Linux Find 命令精通指南

作者&#xff1a;Sheryl Calish Linux find 命令是所有 Linux 命令中最有用的一个&#xff0c;同时也是最混乱的一个。它很难&#xff0c;因为它的语法与其他 Linux 命令的标准语法不同。但是&#xff0c;它很强大&#xff0c;因为它允许您按文件名、文件类型、用户甚至是时间戳…

【安全运维】 linux 系统账户,网络,简易安全加固方案(第一部分),经测试可行...

前言讲到linux系统账户的管理以及安全&#xff0c;就必须涉及 /etc/passwd /etc/shadow 这2个文件这里以截图中文字说明的方式&#xff0c;来分析这2个文件的内容&#xff0c;并且给出一些实用的安全加固方案注意&#xff0c;本文会持续更新&#xff0c;后续加入的内容都以直…

不用深度学习,怎么提取图像特征?

来源 | 小白学视觉头图 | 下载于ICphoto图像分类是数据科学中最热门的领域之一&#xff0c;在本文中&#xff0c;我们将分享一些将图像转换为特征向量的技术&#xff0c;可以在每个分类模型中使用。VATboxVATbox&#xff0c;作为n一个我们所暗示的&#xff0c;涉及增值税问题&a…