1 / 42

第 3 章 音频信息及处理

第 3 章 音频信息及处理. 音频信号 数字音频原理 电子合成音乐 音频卡及音频播放 数字音频编辑与处理. 分类. 规则声音. 音效. 指人类熟悉的其他声音, 如动物发声、机器产生的声音、自然界的风雨雷电等。. 音乐. 规范的符号化了的声音. 注释. 视听效果. 不规则声音. 一般指不携带信息的噪声. 语音. 是指具有语言内涵和人类约定俗成的特殊媒体. 一、音频信号. 音频信号的分类. 一 . 音频信号. 1. 音频信号的特征. 音调与基频. 音阶与基频的对应关系. 音色与谐波 音强与幅度

summer-dean
Download Presentation

第 3 章 音频信息及处理

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第3章 音频信息及处理 • 音频信号 • 数字音频原理 • 电子合成音乐 • 音频卡及音频播放 • 数字音频编辑与处理

  2. 分类 规则声音 音效 指人类熟悉的其他声音, 如动物发声、机器产生的声音、自然界的风雨雷电等。 音乐 规范的符号化了的声音 注释 视听效果 不规则声音 一般指不携带信息的噪声 语音 是指具有语言内涵和人类约定俗成的特殊媒体 一、音频信号 音频信号的分类

  3. 一. 音频信号 1.音频信号的特征

  4. 音调与基频 音阶与基频的对应关系

  5. 音色与谐波 • 音强与幅度 用动态范围来定义音频信号的相对强度: 动态范围=2 0×lg(信号的最大强度 / 最小强度(dB)

  6. 次声带 超声带 音频(Audio)带宽 语音(Speech)带宽 20 300 3K 20K f(Hz) 音宽与频带

  7. CD-DA FM 广播 AM 广播 电话 10 20 50 200 3.4K 7K 15K 22K f( Hz ) 2. 音频信号的指标 • 频带宽度 声音质量等级与信号带宽

  8. 动态范围 2 0×lg(信号的最大强度 / 最小强度)(dB) • 信噪比

  9. 声音质量 MOS标准

  10. t t t 二、 数字音频原理 1. PCM(脉冲编码调制)编码原理 模拟声波的数字化示意图

  11. 采样时钟 t 0 模拟输入 t t X(0) X(1)… X(n)… 0 0 量化,编码 t

  12. 2. 数字音频的技术指标 • 采样频率 1秒钟内采样的次数, 标准频率: 44.1kHz,22.05kHz, 11.025kHz • 声道数:单声道,双声道

  13. 量化位与动态范围

  14. 音频数据率 未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数 音频数据量(Byte)= 数据率(bit/s)×持续时间(s) / 8 例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率=11.025(KHz)×8(bit) = 88.2 (Kbit/s) 音频数据量=11.025(KHz)×8(bit) ×1 ×60(s)/8 = 0.66 (MByte)

  15. 编码算法与音频数据压缩比

  16. 采样率(kHz) 量化位(bit) 声道 编码算法 容量(MB/min) 等效 音质 11.025 8 单 PCM 0.66 语音 22.05 16 双 PCM 5.292 FM广播 44.1 16 双 PCM 10.584 CD唱盘 不同的采样指标与容量和效果的关系

  17. 3. 音频的压缩与文件格式 • PCM编码与WAV文件格式 PCM:一种最通用的无压缩编码, CD-DA采用的方式 ADPCM:一种通用的有损压缩编码 压缩比达1:4 WAV文件:一种通用的音频数据文件, 采用PCM,ADPCM编码

  18. MP3编码与MP3文件 编码算法:MPEG Audio Layer 3 压缩比:1:10 ~ 1:12 音质失真很小,适合网络传播

  19. Real Audio编码与RA文件 Real networks推出的一种音乐压缩格式, 压缩比达 1:96,效果一般 流媒体控制(边下载边播放 ),适合低速网传播

  20. 4. 不同的参数与压缩效果比较

  21. 三. 电子合成音乐 1. 电子合成音乐( MIDI )的原理 MIDI(Musical Instrument Digital Interface) 采用音乐符号记录和解释乐谱,并合成相 应的音乐。 MIDI不是把音乐的波形进行数字化采样和 编码,而是将数字式电子乐器的弹奏过程记录 下来,如按键、力度、时间多度等等。当需要 播放这首乐曲时,根据记录的乐谱指令,通过 音乐合成器生成音乐声波,经放大后由扬声器 播出。

  22. 2. 计算机上合成音乐的产生过程 PC机 音频卡 扬声器 合成器 MIDI乐器 MIDI接口 模拟音 频信号 MIDI指令 音序器 MIDI文件

  23. 3. MIDI音乐合成器 • FM ( Frequency Modulation ) 合成 通过硬件产生正弦信号,再经处理合成音乐。 一般声卡采用的方式,音色与硬件有关,音 色较单薄 • 波形表(Wavetable)合成 专业声卡采用的方式。在声卡的ROM中预 存各种实际乐器的声音采样,通过调用相应的 实际声音数据合成乐音。ROM存储器的容量越 大,合成的效果越好。

  24. 容量5KB,53秒 容量3.6MB,42秒 容量2MB, 1分钟 容量37KB, 2分钟 MIDI WAVE 文件 内容 MIDI指令 数字音频数据 音 源 MIDI乐器 Mic,磁带,CD唱盘,音响 容 量 小 与音质成正比 效 果 与声卡质量有关 与编码指标有关 适用性 易编辑,声源受限, 数据量很小 不易编辑,声源不限, 数据量大 实例1 实例2 4. WAVE与MIDI文件的比较

  25. 四. 音频卡及音频播放 • 音频卡的功能 • 音频信号的播放 • 录制生成WAVE和MIDI文件 • 声音信号的混合和处理

  26. 2. 音频卡的接口

  27. 3. 音频播放的控制 水平滑键 静音控制 垂直滑键控制

  28. 五. 数字音频编辑与处理 1. CoolEdit PRO 的功能 • 声音文件的录制 • 音频数据的简单编辑 • CD音乐提取 • 音频的修复 • 声音效果处理 • 音频文件的格式转换 • 声音文件的合成

  29. 2.界面与窗口 设备控制窗口

  30. 音频录制控制

  31. 六、提高数字录音质量 1、选择一支合适的话筒 • 按传输方式分类:有线和无线 • 按能量转换方式分类: 动圈话筒 电容话筒

  32. 动圈话筒:由磁场中运动的导体产生电信号的话筒。是由振膜带动线圈振动,从而使在磁场中的线圈感应出电压。电容话筒:这类话筒的振膜就是电容器的一个电极,当振膜振动,振膜和固定的后极板间的距离跟着变化,就产生了可变电容量,这个可变电容量和话筒本身所带的前置放大器一起产生了信号电压。驻极体话筒:价廉物美的电容话筒。驻极体话筒不需要两块外加极化电压的极板,它使用的电容器在厂家制造时己进行了极化,并能保持永久性电荷。驻极体话筒需要—个放大/阻抗变换器来代替低压电源。动圈话筒:由磁场中运动的导体产生电信号的话筒。是由振膜带动线圈振动,从而使在磁场中的线圈感应出电压。电容话筒:这类话筒的振膜就是电容器的一个电极,当振膜振动,振膜和固定的后极板间的距离跟着变化,就产生了可变电容量,这个可变电容量和话筒本身所带的前置放大器一起产生了信号电压。驻极体话筒:价廉物美的电容话筒。驻极体话筒不需要两块外加极化电压的极板,它使用的电容器在厂家制造时己进行了极化,并能保持永久性电荷。驻极体话筒需要—个放大/阻抗变换器来代替低压电源。 • 电容话筒中有前置放大器,当然就得有一个电源,由于体积关系,这个电源一般是放在话筒之外的。除了供给电容器振膜的极化电压外,也为前置放大器的电子管或晶体管供给必要的电压。我们称它为幻象电源。 • 附属设备有:防震架、防风罩、防喷罩、话筒架

  33. 话筒的指向:心型、过心型、超心型、全向指向型、 8字形、半球型

  34. 心形(单指向形)话筒:使用这种话筒时,应将它们直接指向你要拾取的声音所在的位置。心形话筒对于声乐演唱及其他近距离拾音效果很好,因为它们不受其后面声音的影响。因此在扩声和声增强应用中,心形话筒是一个较好的选择。那些对来自后面的声音也敏感的话筒不适用于舞台演出,因为它们会接收来自扬声器的反馈声音而产生自激和其他不利影响。心形(单指向形)话筒:使用这种话筒时,应将它们直接指向你要拾取的声音所在的位置。心形话筒对于声乐演唱及其他近距离拾音效果很好,因为它们不受其后面声音的影响。因此在扩声和声增强应用中,心形话筒是一个较好的选择。那些对来自后面的声音也敏感的话筒不适用于舞台演出,因为它们会接收来自扬声器的反馈声音而产生自激和其他不利影响。 • 过心形话筒:保留了心形话筒的前方偏向性,它的后方灵敏度增加了。这种话筒在拾取需要通过后方反射音获得的乐器声和室内气氛声时效果很好。 • 超心形话筒:这个指向特性使话筒在前方的拾音范围很宽,呈稍微前倾的180,而后方拾音范围只是窄窄的一束。超心形话筒适合于拾取管号类演奏或仅用一个话筒的合唱。

  35. 全向形话筒:对各个方向都同等响应。其指向特性图在二维坐标中是—个圆,在三维坐标中是一个球。这类话筒在有回声的室内大合唱和大合奏中拾音效果很好,让你有身临卡内基音乐厅的感觉。全向形话筒:对各个方向都同等响应。其指向特性图在二维坐标中是—个圆,在三维坐标中是一个球。这类话筒在有回声的室内大合唱和大合奏中拾音效果很好,让你有身临卡内基音乐厅的感觉。 • 8字形(双向性话筒):前面和后面的灵敏度高 ;左面和右面的灵敏度很低,选用8字形话筒拾取师生对话,两排乐队演奏,会议双方讨论的声音 • 半球话筒:对平板一侧整个半球区域内声压的响应特性都一样。

  36. 频率响应特性:话筒对不同音高信号的灵敏度

  37. 2、保证良好的录音环境: • 隔音与吸音 • 混响时间在0.2-0.5s之间 • 混响时间:当室内声场达到稳态,声源停止发声后,声压级降低60dB所经历的时间。

  38. 演播室混响时间设计准则:“短”、“平”、”均”演播室混响时间设计准则:“短”、“平”、”均” • “短”:混响时间短;也绝非越短越好,就是供语言用的小演播室,混响时间不宜少于0•30秒。 • “平”:频率特性曲线平。 • “均”.传声器拾音的好坏与传声器位置混响特性密切相关,故要求演播室混响声场均匀。这样可根据剧种,乐队等不同条件合理安排话筒的远近。 • 小型演播室吸声系数大致是0.45~0.5,若地面铺设化纤地毯,对高频有一定吸音量,这就要求用复合结构来获得频带宽,效率高的吸声量。 • 电视演播室内有光滑平整的天幕,平顶上有庞大的空调设备和装有大量演出用的照明灯具,在演播过程中布景、道具摄象机、监视设备和演员,工作人员的活动,都会影响混响频率特性。故混响设计虽要求考虑多方因素,但重要的首先控制好低频混响。

  39. 3、选择一块好声卡

  40. Digi 002 Rack 音频接口 :一个功能完备的集成式制作系统,可工作在Window XP Home及Mac OS9.x系统的电脑上。 提供制作MIDI和音频各种必备的工具和功能。它由一个单个的控制单元构成,其中包含了综合控制台, 带模拟、数字和MIDI输入/输出接口。Digi 002通过一条FireWire火线连接电脑并传送数据。 控制台与Pro Tools LE软件共同组成了系统,软件提供32个音轨的录音和播放能力,128个MIDI轨并支 持实时插件处理及其他功能。

More Related