音频的产生
物体振动产生声音,声音是一种波,可以在介质中传播,并被人或动物感知。(小知识:声波在水和空气中传播时是纵波,也就是介质是顺着声波的传播方向压缩和膨胀的,但声波在金属等固体中传播则是横波和纵波都有,并且两种波的传播速度不一样,参考地震波。)
音频三要素
音调:音频的快慢,也就是振动频率,单体赫兹(Hz)。
音量:振动的幅度,单位分贝(dB)。
音色:声音的谐波成份,比如用不同的乐器演奏同一份乐谱,每种乐器发出的声音都不一样,这就是由谐波成份不一致导致的。



常用的声音指标
人耳听觉范围20Hz~20kHz。小于20Hz的是次声波,大于20kHz的超声波。
人声的频率范围在100Hz(男低音)到10000Hz(女高音)范围内,正常语音频率范围是300Hz~3400Hz(这也解释了为什么电话的采样率到8k就够用了,参考奈奎斯特采样定理)。
人耳可听的声压幅值波动范围为0.00002Pa~20Pa,对应分贝值是0dB~120dB。
常见环境下的声音分贝数与声压对应:

模数转换
简称ADC,用于声音采样与量化,将自然的模拟音频转换成计算机可处理的数字信号。采样必须满足奈奎斯特采样定理,也就是采样频率必须大于等于最高信号频率的两倍。
ADC的相关参数有采样率与量化精度,比如常见的8k 16bit量化,表示按8k采样率采样,每次采样的数据使用2字节进行量化。


