PS:由浅入深,慢便是快。

本篇总结下音频基础知识,音视频相关文章如下:

  • 音视频开发基础知识
  • 音频帧、视频帧及其同步
  • Camera2、MediaCodec录制mp4
  • Android原生编解码接口MediaCodec详解

下面将从以下几个方面进行介绍:

  1. 声响的发生
  2. 声响的三要素
  3. 模数转化
  4. 原始音频数据
  5. PCM与Wav
  6. 音频处理流程

声响的发生

声响是由物体振荡发生的,通过空气、固体、液体等介质进行传输的一种声波,能够被人耳识其他声波的规模是 20Hz~20000Hz 之间,也叫做可听声波,这种声波称之为声响,根据声波频率的不同能够首要分为:

  • 可听声波:20Hz~20kHz
  • 超声波:> 20kHz
  • 次声波:< 20Hz

此外,人的发声规模一般是 85Hz~1100Hz。

声响的三要素

声响的三要素分别是腔调、音量、音色,详细如下:

  • 腔调:指的是声响频率的高低,表明人的听觉分辨一个声响的调子高低的程度,物体振荡的快,宣布的声响的腔调就高,振荡的慢,宣布的腔调就低。
  • 音量:又称音强、响度,指声响的振幅巨细,表明人耳对所听到的声响巨细强弱的片面感触。
  • 音色:又称音品,指不同声响表现在波形方面总是有异乎寻常的特性,不同的物体振荡都有不同的特色,反映每个物体宣布的声响的特有的质量,音色详细由谐波决议,好听的声响绝不仅仅是一个正弦波,而是谐波。

模数转化

声响是一个模仿音频信号,假如要将声响数字化,则需求将模仿音频信号转化为数字信号,这便是模数转化,首要流程包括采样、量化、编码,如下图所示:

音频基础知识

  • 采样:连续信号转化为离散信号的进程,每个必定时刻的信号值来替代原来时刻段连续的信号值,这个 1s 内的采样次数便是采样率,如 8KHz 是电话信号的采样率,能够满意通话需求,音频 CD 一般是 44.1kHz,数字电视一般是是 48kHz,采样率越高声响的还原成度越高。
  • 量化:将采样后 的模仿信号转化为数字信号的进程,量化分为均匀量化和非均匀量化,上图中明显运用了均匀量化,量化级数是 8。
  • 编码:将量化后的信号转化为对应的二进制代码,最简略便是自然二进制码,其他编码方法感兴趣自行去了解,上图中编码指的是信源编码,除此之外还有信道编码。

原始音频数据

PCM((Pulse Code Modulation)是脉冲编码调制,实际上便是将模仿音频信号转化为数字音频信号,音视频中的 PCM 指的是未经压缩的音频采样数据,是音频信号经采样、量化、编码生成的原始音频数据,PCM 数据要害量化目标如下:

  • Sample Size:采样巨细,也是量化级数,表明一个采样用多少位 bit 存放,常用的是 16 位。
  • Sample Rate:采样率,表明每次采样的次数,单位 Hz,常见的采样率有 8k、16k、32k、44.1k、48k 等。
  • Number of Channels:声道数,表明当前 PCM 数据中包括的声道数,如单声道、双声道、多声道等。
  • Byte Ordering:字节序,表明 PCM 数据存储的字节序是大端存储(big-endian)还是小端存储(little-endian),为了数据处理效率的高效,一般为小端存储。
  • Sign:表明当前 PCM 数据是否有符号位
  • Integer Or Floating Point:表明当前 PCM 数据运用整型还是浮点型来表明。

了解了表明 PCM 数据的量化目标之后,那么码率怎么核算呢,码率便是一秒钟采样数据的多少,核算方法如下:

采样率 * 采样巨细 * 声道数

举个比如:

音频基础知识

采样率 44.1KHz,采样巨细为 16bit,双声道的 PCM 编码的 WAV 文件,其码率为 44.1K *_16 *_2 = 1411.2Kb/s,假设传输上述音频,每秒将超过 1M 的数据量,再加上在数据传输进程中,上行速率往往远小于下行速率,这就需求压缩音频数据了。

PCM与WAV

PCM 能够查看前面小结,WAV 是一种无损的音频文件格局,其对音频的编码没有硬性规定,能够是 PCM 也能够是其他编码方法,比如 MP3编码等,简略总结一下:

  • PCM:一种编码方法,在音视频领域则理解为原始音频数据裸流;
  • WAV:一种音频文件格局,可存储 PCM 数据,相当于在 PCM 基础上添加了 WAV 头部。

最终附上一张 WAV 的 Header 示意图:

音频基础知识

更多细节后续研究后补充。

音频处理流程

简略讲一下音频的处理流程,一是音频文件的生成,如在 Android 中运用 AudioRecordMediaRecord 等采集到的音频数据便是 PCM 数据,这种数据属于数字音频信号,是原始的 PCM 裸流,PCM 数据通过编码也便是将 PCM 数据压缩,在通过复用生成对应的音频文件,二是音频文件的播放,经解复用、解码转化成 PCM 进行播放。

本文正在参加「金石计划 . 瓜分6万现金大奖」