300 likes | 457 Views
多媒体技术及应用. 第三章 音频技术与应用. 3.1 数字音频技术基础. 声音 : 是振动的波,随时间连续变化的物理量 。 声音的 3 个重要指标:振幅、周期和频率 。 声音的可听域: 20Hz ~ 20KHz 部分声源的频带宽度. 声音的三要素: ( 1 ) 音调 代表声音的高低。频率越高,音调越高。 ( 2 ) 音色 声音的特色,判别声源的主要依据。 ( 3 ) 音强 声音的强度或音量。. 3.1.2 数字音频与数字音频技术. 数字音频信号: 数字化的声音称为数字音频信号
E N D
多媒体技术及应用 第三章 音频技术与应用
3.1 数字音频技术基础 • 声音:是振动的波,随时间连续变化的物理量。 • 声音的3个重要指标:振幅、周期和频率。 • 声音的可听域:20Hz~20KHz 部分声源的频带宽度
声音的三要素: (1)音调 代表声音的高低。频率越高,音调越高。 (2)音色 声音的特色,判别声源的主要依据。 (3)音强 声音的强度或音量。
3.1.2 数字音频与数字音频技术 • 数字音频信号: 数字化的声音称为数字音频信号 • 数字音频信号不仅包含自然界中的所有声音,还可以通过计算机处理,如编辑、合成、调整频率等方式获得自然界中没有的声音。
声音的数字化过程 采样、量化和编码 采样:声音信号在时间上离散化 量化:采样后的声音在幅值上离散化 编码:将量化后的数值用二进制代码表示
数字音频质量 主要取决与采样频率、量化位数、声道数量以及编码算法 • 声音数据量 数据量=(采样频率×量化位数)÷8×声道数×时间÷ 压缩率
例 3-1 • 数字激光唱盘CD-DA的标准采样频率为44.lkHz,量化位数为16位,立体声。计算每分钟CD音乐的数据量是多少? 解:数据量=(44100×l6)÷8×2×60 ≈10 Mb
例 3-2 • 一首长度为3分钟的MP3音乐,采样频率为44.lkHz,量化位数为16位,立体声,压缩比为10:1。计算这首音乐的数据量是多少? 数据量=(44100×l6)÷8×2×3×60 ÷ 10 ≈ 3 Mb
3.1.3 音频文件格式 • WAV:微软公司开发用于windows平台,是最早的数字音频格式。 • MIDI: Musical Instrument Digital Interface,乐器数字接口 是数字音乐/电子合成乐器的统一国际标准。MIDI文件中存储的是一些指令,由声卡按照指令将声音合成出来。 • CDA:CD音乐格式。 • MP3: MPEG-1 Audio Layer 3缩写,压缩比约为10:1。
WMA: Windows Media Audio缩写,微软公司开发的网络音频格式。 • MP4: 采用“知觉编码”为关键技术的压缩技术,只有特定用户才可播放。 • QuickTime:苹果公司推出的数字流媒体。 • RealAudio: Real Networks公司推出的文件格式,可实时传输信息。 主要有RA、RM、RMX三种,随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较宽的听众获得更好的音质。
3.1.4 音频格式转换 • 音频格式转换原理 首先用解码器将音频文件解码为波形,然后用新的编码器编码。 • 音频格式转换工具 Awave Studio,Adobe Audition,千千静听等。
例 3-3 • 使用“千千静听”音频播放软件,将WMA音乐格式转换为MP3音乐格式 。
3.2 声音艺术 • 贝多芬 :“音乐是比一切智慧、一切哲学更高的启示”。 • 多媒体艺术创作不仅需要丰富多彩的视觉艺术,还需要优美的听觉艺术。因此,欣赏音乐和创作音乐是实现多媒体声音艺术的关键。
3.3 音频素材采集 • 直接采集数字音频 • 外部录制 • 内部录制 • MIDI合成
输入 编辑 输出 音频输入设备 音频编辑设备 音频输出设备 3.3.2 简单的数字音频采集与制作系统 • 输入设备:采集音频信号,如麦克风、声音播放设备和MIDI设备 • 编辑设备:安装有声卡的计算机 • 输出设备:监听编辑后的音频效果,如音箱和耳机。
3.3.3 实时音频录制 例3-4 • 使用“AD Sound Recorder”软件,将QQ网络视频或语音聊天过程中的语音录制下来,保存为MP3音频文件。
3.4 语音合成技术 • 语音合成技术 利用计算机合成出清晰、自然、连续的人类语音的一种技术。 • 语音合成技术使得计算机具有同人类一样的说话能力。
例3-5 • 使用“方正畅听”软件朗读word文档,并将声音保存为MP3文件。
3.5 语音识别技术 • 语音识别技术 指计算机通过识别和理解过程将语音转变为相应文本或命令的技术。 • 有了语音识别技术,计算机就可以“听懂” 人类的语言内容并理解语言的含义。
例3-6 • 使用ViaVoice9.0软件,以语音朗读的方式向Word文档中输入文字 。
例3-7 • 使用Adobe Audition3.0软件,录制卡拉OK并制作为MP3。
3.6.4 音频编辑 • 音频编辑 主要是对音频波形进行剪切、复制、删除、分离、合并、锁定、包络编辑和时间伸缩等处理。
例 3-8 • 移花接木--将声音文件 “我喜欢音乐”编辑为“我我喜欢音乐音乐音乐”。
例 3-9 • 为音频制作淡入淡出效果。
3.6.6 使用音频插件 例 3-10 • 使用插件进行卡拉OK后期效果制作。
实验 • 实验一 使用Audition为视频配乐 • 实验二 使用Audition消除mp3中的原唱声音 • 实验三 使用Audition实现音乐变速和变调效果
题目 1.不属于声音三要素的是_____。 A. 频率 B. 音调 C. 音强 D. 音色 2.以下_____是近似无损的音频格式。 • MP3 B. WAV C. WMA D. MP4 3 3. 以下_____是能够实现语音合成技术的应用软件。 A. ViaVoice B. 方正畅听 C. 千千静听 D. Audition
题目 4. 为了使计算机能够“听懂”人类的语言所采用的技术是_____? • 语音合成技术 B. 语音识别技术 C. 文语转换技术 D. 模式识别技术 5. 为音频制作淡入淡出效果需要对效果面板中的_____进行设置? • 选择“振幅和压限”中的“振幅/淡化” • 选择“振幅和压限”中的“硬性限制” • 选择“振幅和压限”中的“标准化” • 选择“振幅和压限”中的“包络”
答案:ABBBA Thank You !