音频参数

来自泡泡学习笔记
跳到导航 跳到搜索

对于本文而言,我们希望基于AI(Artificial Intelligence,人工智能)可以实时生成适用于每个人的大脑音频,这就需要使用到数字音频技术。

音频的基本参数对于音频的生成、编辑和播放都至关重要。我们从采样率、帧、采样个数、编码、音高、音量、音色和音长,这几个参数进行简要说明。

(1)采样率

定义:采样率是指每秒钟采样的次数,用于将模拟信号转换为数字信号。

公式:采样率(f_s)= 1 / T 其中T是采样间隔。

案例:CD音质的标准采样率为44.1 kHz,意味着每秒钟记录44100个样本。

(2)帧

定义:在音频处理中,帧是一段短时间内的音频样本集合,用于音频编码和解码。

案例:当使用MP3格式编码时,音频通常被分成多个帧,每个帧包含一定数量的采样,并添加了用于错误检测和纠正的额外数据。

(3)采样个数

定义:采样个数是指在一个特定时间段内的样本数量。

案例:如果采样率为44.1 kHz,那么一秒钟的音频包含44100个样本。

(4)编码

定义:编码是将模拟音频信号转换成数字信号的过程,常用的格式包括PCM、MP3、AAC等。

案例:MP3是一种流行的有损压缩格式,它通过舍弃人耳不易察觉的音频信息来减少文件大小。

(5)音高

定义:音高是声音的频率,以赫兹(Hz)计量。

公式:f = 音高

案例:A4音符的标准音高为440 Hz,这意味着它的波形每秒钟振动440次。

(6)音量

定义:音量是声音的响度,与声波的振幅相关。

公式:L = 20 * log10(p/p0) 其中L是声压级(分贝),p是测量声压,p0是参考声压。

案例:对话的典型录音音量约为-20 dB,而音乐会则可能在+4 dB左右。

(7)音色

定义:音色是由音频波形的形状决定的,它区分了具有相同音高和音量的两个不同的声音。

案例:钢琴和小提琴即使演奏相同音高的音符,它们的音色也明显不同,因为波形的形状和谐波内容不同。

(8)音长

定义:音长是音符持续的时间长度。

公式:T = 音长

案例:在音乐制作中,调整音符的持续时间可以影响节奏和旋律的感觉。