当前位置: 首页 > 编程日记 > 正文

如何向非技术人员解释“稀疏傅里叶变换”算法?

【伯乐在线导读】:这个问题来自 Quora,下面是来自 Tanooj Luthra 的回复。

让我们来演奏一架想象中的钢琴。

钢琴的每个琴键都对应一个特定频率的声音。例如,一个比较有名的频率是国际标准音A(440赫兹)。当有琴键按下时,你听到的声音是一个完美的正弦波,振荡在440赫兹。同样,中央C对应的频率约为261赫兹声波。

不过,每次只演奏一个音符太单调了,我们来尝试几个音符同时演奏。有趣的是,两个各不相关的声音结合起来,就创造一个全新的独特声音。它不再只是单一的频率,这是两个频率的结合。如果琴键一起按下我们会发现,对应的频率也叠加在了一起。

三个音符组合形成的最终声音信号!

快速傅立叶变换(FFT)可以让我们将这个新的声音解构为原始的频率,从本质上得到这个和弦是由哪些琴键组成的。现在我们退一步,只演奏一个音符,看看这个原始信号及其FFT的示例图。

这幅图中的数字没有曲线形状所代表的意义那么重要。上面图中蓝色表示声音的波形,表示了其幅值相对于时间的关系。它是一个单一的频率,表示只演奏了音符A。FFT变换后,我们得到了一个很有趣的图形,幅值相对于频率的关系。此图中单个波峰表示原始信号中的单一频率,而大部分的频率不存在。前进一点点,在我们的和弦例子中有两个音符C和A,我们的FFT将有两个波峰!一个会出现在相同的位置,而另一个将出现在较低的频率。总体来说,一个信号的FFT将每个“纯”频率相加得到最终的输出结果。

我们给钢琴加一个歌手伴奏。

人的声音频率范围很宽,多种多样的频率组成了多种多样的声音(词语)。正如下面的图片,音频信号可能会非常非常复杂。相应的FFT在一定比例上有成千上万的非零频率(图上的红色曲线将有成千上万不同高度的峰值)。举个例子,即使是一个歌手想发出F音,最终也会产生许多不同的频率,因为人声不是一个理想的乐器。

说出不同词语时的音频信号。显然不像上面的标准音A那样光滑波动!

现在,我们已经有点明白FFT了,现在来看看MIT的稀疏FFT。当我们为钢琴加了歌手伴奏后,我们有一个C和A的和弦以及一个歌手努力维持唱出的F音,然后得到了一个参差不齐的音频信号及其FFT。原本的FFT将计算出每个频率的幅度,但我们也许可以利用这样一个事实,即大部分的频率将集中在C、A和F周围!因此,如果我们只计算组成最终音频信号的三个频率,可以复制出一个足够接近于原音乐乐谱的声音。这就是稀疏FFT在做什么。

这篇论文注意到一个事实,在视频信号中有89%的频率不是必须存在的。只计算11%的频率的稀疏FFT,信号质量不会恶化太多。虽然视频的频率和信号的相关概念更偏向技术性,但是理论同样适用于钢琴和歌手。

相关文章:

N皇后摆放问题

Description 在N*N的方格棋盘放置了N个皇后,使得它们不相互攻击(即任意2个皇后不允许处在同一排,同一列,也不允许处在与棋盘边框成45角的斜线上。你的任务是,对于给定的N,求出有多少种合法的放置方法。 Inp…

java线程的优先级是数字越大优先级越高_《深入理解Java虚拟机》5分钟速成:12章(Java内存模型与线程)...

第12章 Java内存模型与线程前言:1、物理机如何处理并发问题?2、什么是Java内存模型?3、原子性、可见性、有序性的具体含义和应用实现?4、volatile 关键字特性?5、基于volatile变量的运算在并发下是否是线程安全的&…

动软代码生成V2.74模版简介

最近发现很多人用动软代码生成,确实方便,有些经验记录下,以后查看回顾。 ..\Maticsoft\Codematic2\Template\TemplateFile 为模板文件夹,直接在目录下新建文件夹【我的自定义模版】,有个【模版示例.cmt】也直接复制到自定义文件下…

《少年先疯队》第九次团队作业:Beta冲刺第二天

2.1 今日完成任务情况 姚玉婷:房间管理功能测试文档的编写马丽莎:酒店系统中商品管理功能的完善张 琼:商品管理功能的测试孙苗坤:商品管理功能的测试2.2 明天任务安排 姚玉婷:酒店系统中剩余功能的完善马丽莎&#x…

傅里叶变换的参考文档

https://betterexplained.com/articles/an-interactive-guide-to-the-fourier-transform/ http://blog.jobbole.com/70549/

取消ssh密钥文件登录_Xshell密钥登入,增加安全

1.点击Xshell菜单栏的工具,选择新建用户密钥生成向导,进行密钥对生成操作。2.这个时候,你已经有了一对密钥,需要开始设定服务器的配置,启用密钥认证登录,同时为了系统安全着想,关闭密码认证的方…

20150726 填坑日记

三中内填坑: 1. 组合数递推什么的 C(m,n)C(m,n-1)C(m-1,n-1)。填了个大坑,以前没认真听课QAQ 2. 裸题过河卒 3. 缺角正方形摆放车统计,分上下部分,枚举上部分放几个即可,O(n) 4. 3d立体图统计表面积:先把上…

Word 2003文件保存和另存为操作是否熟练掌握的有关测试

提出问题本文内容不仅适用于Word,对于其他的文档(文字、图形、动画、声音等)编辑软件基本通用。对于操作上述各种编辑软件时,大家都应该注意到,我们第一次保存文件时系统出现的是“另存为”对话框。此后,再…

kdress学习

这两天看了一本书叫《linux二进制分析》,这里面提到的一个小工具kdress,这里分析一下 源码在:https://github.com/elfmaster/kdress kdress介绍 /boot目录下有一个vmlinux的文件,这是一个经过压缩的linux内核,不过缺少…

什么是DCI? 它有什么用?

当你学习LTE的物理帧(physicalframe)结构时,你肯定会有所体会:”靠,怎么这么复杂啊”.物理帧结构是时域 (Time Domain)、频域(Frequency Domain)和调制方式(modulation scheme)的组合。 你可能会有疑问:”接收方怎么知…

判断小数是否相等_四年级上册数学填空+计算+判断易错题整理练习,收藏练一练!...

四年级数学易错题练习一、填空题1、1.250.8表示( )。2、去掉0.25的小数点,就是把这个数扩大( );把50.4的小数点向左移动两位,就是把它缩小到原来的( )。3、两个因数相乘, 一个因数扩大10倍,另一个因数扩大…

jquery checkbox勾选/取消勾选的诡异问题

$("input[idsubmit2]").click(function() {   $("[idpostage2]").prop("checked", true); }); $("input[idsubmit3]").click(function() {   $("[idpostage2]").prop("checked", false); }); 解决办法&#x…

C#_uploadify_mvc_version

jQuery Uploadify在ASP.NET MVC3中的使用 1、Uploadify简介 Uploadify是基于jQuery的一种上传插件,支持多文件、带进度条显示上传,在项目开发中常被使用。 Uploadify官方网址:http://www.uploadify.com/ 2、ASP.NET MVC3中的使用Uploadify 搭…

Velocity Engine基础

回到顶部Velocity是一个基于Java的模板引擎,可以通过特定的语法获取在java对象的数据 , 填充到模板中,从而实现界面和java代码的分离!Velocity Template Language (VTL) , 是Velocity 中提供的一种模版语言 , 旨在提供最简单和最干净的方法来将动态内容合并到网页中。简单来说VTL可以将程序中的动态数展示到网页中注释非解析内容 , 引用和指令。

mysql唯一索引与null

根据NULL的定义,NULL表示的是未知,因此两个NULL比较的结果既不相等,也不不等,结果仍然是未知。根据这个定义,多个NULL值的存在应该不违反唯一约束,所以是合理的,在oracel也是如此。在mysql 的innodb引擎中,是允许在唯一索引的字段中出现多个null值的。有上面的表和数据可以看出,查询多条数据。

矩阵乘法递归求解

给定两个NN的矩阵,求乘积 如下图所示,乘法执行过程如下: 1.矩阵1先拿出一行,矩阵2先拿出一列 2.行与列相乘得到value1 3.行与剩下矩阵2相乘得到value2(递归过程) 4.剩下矩阵1与列相乘得到value3&#xff08…

What is acceptable cell and suitable cell in LTE?

The difference between acceptable cell and suitable cell in LTE is given below. acceptable cell In a area where UE is not able to find any suitable cell to camp on, it goes for acceptable cell. An “acceptable cell” is a cell on which the UE may camp to o…

appium 控件定位

转自:http://www.2cto.com/kf/201410/340345.html AppiumDriver的各种findElement方法的尝试,尝试的目标应用是SDK自带的Notepad应用。 1. findElementByName 1.1 示例 ?12el driver.findElementByName("Add note");assertThat(el.getText()…

android应用去掉状态栏_Android 显示、隐藏状态栏和导航栏

Android 显示、隐藏状态栏和导航栏控制状态栏显示,Activity的主题中配置全屏属性true控制状态栏显示,在setContentView之前设置全屏的flaggetWindow().setFlags(WindowManager.LayoutParams.FLAG_FULLSCREEN, WindowManager.LayoutParams.FLAG_FULLSCREE…

hdu1305Immediate Decodability(字典树)

这题看是否 这题能A是侥幸,解决的办法是先存一下输入的字符串,进行排序。 Problem DescriptionAn encoding of a set of symbols is said to be immediately decodable if no code for one symbol is the prefix of a code for another symbol. We will …

python isdigit()

isdigit(): Python isdigit() 方法检测字符串是否只由数字组成。如果字符串只包含数字则返回 True 否则返回 False。 实例 以下实例展示了isdigit()方法的实例: #!/usr/bin/python3str "123456"; print (str.isdigit()) str "Runoob example....wo…

Control Channel Element (CCE)

1. CCE是PDCCH的资源单元 (resourceunit)。 A PDCCH is transmitted on one CCE or anaggregation of several consecutive CCEs, where a CCE corresponds to 9 Resource ElementGroups (REGs). In PDCCH transmission, only those REGs are used which are notassigned …

phpstrom+xdebug调试PHP代码

众所周知开发PHP的IDE种类繁多,然而开发PHP并不能像开发其他语言一样,调试PHP代码对诸多新手来说,搭建调试环境就比较麻烦!其实哈,我发现NuSphere-phped-16.0很强大,集成了很强大的debug功能,只…

ubuntu 设置开机执行脚本_ubuntu-18.04 设置开机启动脚本

ubuntu-18.04 设置开机启动脚本参阅下列链接ubuntu-18.04不能像ubuntu14一样通过编辑rc.local来设置开机启动脚本,通过下列简单设置后,可以使rc.local重新发挥作用。1、建立rc-local.service文件sudo vi /etc/systemd/system/rc-local.service2、将下列内…

Web Api单元测试写法

例如我们在Web Api项目中有个Controller public class SomeController : ApiController { public HttpResponseMessage Get() { // 一些操作 return Request.CreateResponse(HttpStatusCode.OK, someModel); } }如果你在单元测试中直接调用 SomeController 的Get()方…

数据挖掘深入理解和学习路径

上一篇文章中分享了数据分析的学习全景路径 其中最关键的部分就是数据挖掘,那什么是数据挖掘呢? 数据挖掘就是通过分析采集而来的数据源,从庞大的数据中发现规律,找到宝藏。 一,数据挖掘的基本流程 数据挖掘可分为6个步…

3G重选至4G--基于优先级

3G重选至4G--基于优先级 1. Specification 1.1 Measurementrules 是否需要开启测量 3GPP 25.304 - 5.2.6.1.2aMeasurement rules for inter-frequency and inter-RAT cell reselection when absolutepriorities are used 1.2 Evaluation/ ReselectionCriteria 对测量结…

C#_Socket网络编程实现的简单局域网内即时聊天,发送文件,抖动窗口。

C#_Socket网络编程实现的简单局域网内即时聊天,发送文件,抖动窗口。 最近接触了C#Socket网络编程,试着做了试试(*^__^*) 实现多个客户端和服务端互相发送消息 发送文件抖动窗口功能 服务端: using System; using System.Colle…

移动端大图缩放模糊_关于移动端小图标模糊问题的解决方法

前言之前给大家讲到图片和文字垂直方向不对齐的问题,其中举的小例子中用到了一个小图标,这个小图标我用的是背景图来显示:.del .icon{ display: inline-block; width: 20px; height: 25px; margin-right: 5px;vertical-align: middle; backgr…

T-SQL WITH 分号问题

使用with 前面有sql语句时候 运行 with tempTbale(id) as ( select ..... )select * from tempTbale 运行上面语句 提示下面错误 Incorrect syntax near the keyword with. If this statement is a common table expression, an xmlnamespaces clause or a change tracking con…