多媒體簡介
Download
1 / 68

多媒體簡介 - PowerPoint PPT Presentation


  • 120 Views
  • Uploaded on

多媒體簡介. 陳 政 雄. 大綱. 音訊媒體 聲音 基本原理 音訊檔案格式 影像媒體 影像 基本原理 影像檔案 格式 視訊媒體 視訊 基本原理 視訊檔案 格式. 音訊媒體. 聲音的基本原理 . 聲音產生的原理 當介質(如空氣、水)中產生了震動,此震動對介質造成壓力,而此壓力會以 波 的形式藉由介質向外擴散,當這些波傳到人的耳朵且頻率範圍在人耳可感應的範圍內 ( 20Hz~20kHz ) ,耳膜會因感應而聽見聲音 真空中聽不見聲音 震動愈強 ,人耳「聽見」的 聲音就會愈大 ;反之,則聲音就會相對的微弱 . 聲音的頻率. 聲音的頻率

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' 多媒體簡介' - mayes


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

多媒體簡介

陳政雄


大綱

  • 音訊媒體

    • 聲音基本原理

    • 音訊檔案格式

  • 影像媒體

    • 影像基本原理

    • 影像檔案格式

  • 視訊媒體

    • 視訊基本原理

    • 視訊檔案格式



聲音的基本原理

  • 聲音產生的原理當介質(如空氣、水)中產生了震動,此震動對介質造成壓力,而此壓力會以波的形式藉由介質向外擴散,當這些波傳到人的耳朵且頻率範圍在人耳可感應的範圍內(20Hz~20kHz),耳膜會因感應而聽見聲音

  • 真空中聽不見聲音

  • 震動愈強,人耳「聽見」的聲音就會愈大;反之,則聲音就會相對的微弱


聲音的頻率

  • 聲音的頻率

    • 聲波每秒的振動次數稱為頻率

    • 頻率在20hz~20khz之間稱為聲波

    • 頻率大於20khz稱為超聲波

    • 頻率小於20hz稱為次聲波

  • 超聲波和次聲波人耳是聽不到的,地震波和海嘯都是次聲波。有些動物的耳朵比人類要靈敏得多,比如蝙蝠就能“聽到”超聲波

  • 人的語音頻率範圍主要在200 hz到4000 hz之間

  • 在語音範圍中

    • 通常把1000 hz以上的區域稱為高頻區

    • 500 hz -1000 hz的區域稱為中頻區

    • 低於500 hz的區域稱為低頻區


聲音的量化

  • 物理中用來表示聲音強弱的單位為分貝(dB)

  • 分貝是以「對數」的方式來訂定的

  • 聲音的強弱單位是「比」出來的,兩個聲音之間的強弱差異代表的是「它們傳遞到接收端能量強度的比值」

  • 例如:A、B兩聲音,其強弱差距為

    NABdB=10㏒(A/B)



Analog to digital
Analog to Digital 的流程

  • 首先聲音的波動透過介質進入到收音麥克風

  • 這些聲音波動轉換成一連串高低變化的電壓波,傳入到電腦

  • 將此波透過一低通濾波器濾除其高頻雜訊

  • 透過類比數位轉換器(Analog Digital Converter,ADC)將聲音波型數位化

  • 將數位化音訊存入記憶體


Digital to analog
Digital to Analog 的流程

  • 將數位化音訊讀出記憶體

  • 透過數位類比轉換器(Digital Analog Converter, DAC)將數位訊號還原

  • 還原波再經過一低通濾波器將高次諧波濾除,聲音波形就會比較平滑。

  • 透過擴大線路輸出至揚聲器


Sampling rate
取樣頻率 (sampling rate)

  • 聲音數位化最重要的就是將類比訊號取樣

  • 取樣所記錄到的值為「樣本」

  • 取樣頻率越高,亦即取樣間隔時間越短,所擷取後的數位音訊資料也就越準確,也愈耗儲存空間

※「週期」是每隔取樣一次所需時間

※每秒鐘的取樣次數稱為「頻率」

※頻率=1/週期


取樣頻率(續)

  • 一般我們常見的取樣頻率為11.025kHz、22.05kHz、44.1kHz

  • CD音質則為44.1kHz、16bits位元深度(解析度)

  • 取樣頻率越高與越高的位元深度會有越好的音質


量化-位元深度(解析度 )

  • 取樣在每一個上升邊緣時,ADC (Analog Digital Converter)會將當時的值紀錄下來,而此紀錄的値稱為樣本,單位為bit(或稱為解析度),此動作即為量化

  • 例如:CD音質,16位元深度聲音區間有216=65,536個區間,範圍-32,768~+32,767

  • 愈高的位元深度,愈接近真實的聲音


量化失真

  • 無論採用多高的位元深度來取樣,也不可能完全無誤差的紀錄原本輸入的類比訊號(這也是數位、類比間的鴻溝),此即所謂的「量化失真」


音訊檔案容量

  • 容量計算公式:

    • 取樣率(Hz) * 時間(s) * 位元深度(bit) / 8 * 聲道數量

      • 【其中位元深度 / 8 的8是因為一個位元組(byte)有8個bit】

  • 例: 30秒的CD音質錄製下的立體聲檔案大小為5292000bytes

    • 44100 * 30 * 16 / 8 * 2 = 5,292,000bytes(位元組)

    • 44100 *240* 16 / 8 * 2 = 42,336,000bytes(位元組)

      ≒ 42 MB(wav 檔格式)


多聲道音訊

  • 廣泛用於DVD Movie的多聲道音訊編碼格式為

    • Dolby Digital(AC3)

    • Digital Theater Systems(DTS)

  • 兩種格式均為破壞性壓縮6聲道系統,包含中央、前右、前左、後右、後左與重低音

  • AC3:位元率448kbps、較廣大的市場使用

  • DTS:位元率1536bps、有較佳的音質


音訊檔案格式

  • 未壓縮的波形音訊格式

  • 破壞性壓縮格式

  • 網路串流格式

  • MIDI


未壓縮的波形音訊格式

  • .wav

    • 由微軟制定,採PCM編碼的未壓縮波形格式

    • 主要用於Windows PC中,副檔名為.wav

    • 符合RIFF(Resource Interchange File Format)規範

    • 具有檔案標頭,記載檔案的編碼參數

    • 通常採用PCM編碼,但也可使用其他方式編碼

  • .au

    • 是UNIX系統下的一種常用的格式

    • 為昇陽(SUN)所開發,其副檔名為.au

    • 支援多種壓縮模式,現在少用了


未壓縮的波形音訊格式

  • .aiff

    • AIFF是Apple的標準格式,其副檔名為.aiff

    • QuickTime就是使用aiff作為音訊的軟體

    • AIFF為功能很強的格式

    • 支援多種壓縮技術,但為MacOS專用格式,PC少見

    • 仍有其佔有率


破壞性壓縮格式(1/4)

  • .mp3

    • MP3(MPEG Audio Layer 3)屬於MPEG標準的一環,其副檔名為.mp3

    • MP3因有高效率的資料壓縮與音質效果,再加上便利的播放程式以及編碼程式支援,使得MP3的使用者越來越多,逐漸成為多媒體影音標準的趨勢

    • 可以藉由調整位元傳輸速率來改變壓縮比率,範圍16k bps~320k bps都有

    • 在標準128k bps模式下,可以將一分鐘的MP3壓縮成不到1MB的檔案,播放效果接近原來音效


破壞性壓縮格式(2/4)

  • .wma

    • WMA就是Windows Media Audio,由微軟開發,其副檔名為.wma

    • 其最大特色就是比MP3容量還要小一半,且音質不輸mp3

    • 支援無失真、有失真、語音,全方面的需求支援

    • 網路串流品質極佳

    • 因 Windows 系統內建播放器Windows media player,這幾年迅速竄起


破壞性壓縮格式(3/4)

  • .aac

    • 繼MP3後的新一代音訊壓縮標準

    • AAC => Advanced Audio Coding,屬於 MPEG-2規格的一部份(part 7)

    • 由 Fraunhofer IIS, Dolby, Apple, AT&T, SONY 等公司共同開發

    • MPEG-4加入AAC並整合,故又稱 MPEG-4 AAC,即 m4a

    • 壓縮比較MP3高,並提供多聲道立體環場音效,勝過雙聲道的MP3


破壞性壓縮格式(4/4)

  • .ogg(Ogg Vorbis)

    • 類似於 MP3 的破壞性壓縮格式

    • 有更佳的聲學模型

    • 與AAC相同,可以藉由更複雜的壓縮解壓縮演算法達到更加的音質與壓縮比

    • OGG的使用尚不普遍


非破壞性壓縮格式(1/3)

  • .APE(Monkey’s Audio)

    • 是一種常見的非破壞性音訊壓縮格式

    • 壓縮後的音質與未壓縮前一樣

    • 使用.ape為副檔名

    • 目前廣泛地用於音樂CD數位保存

    • 官網:http://www.monkeysaudio.com/


非破壞性壓縮格式(2/3)

  • .FLAC

    • Free Lossless Audio Codec 縮寫

    • 為著名的自由音訊壓縮編碼

    • 亦為非破壞性壓縮,可以還原音樂CD品質

    • 官網:http://flac.sourceforge.net/


非破壞性壓縮格式(3/3)

  • True Audio(縮寫TTA)

    • 是一種自由又簡單的實時無損音頻編解碼器

    • 一種基於自適應預測過濾的無損音頻壓縮

    • 與目前主要的其他格式相比,能有相同或更好的壓縮效果

    • 相關網站:http://www.true-audio.com/


網路串流格式

  • 網路上傳輸音/視頻等多媒體資訊:主要有下載和串流傳輸兩種方案

  • 串流傳輸時,聲音、影像或動畫等影音媒體由音視頻伺服器向用戶電腦的連續、 即時傳送,用戶不必等到整個檔全部下載完畢,而只需經過幾秒或十數秒的啟動延時即可進行觀看

  • 當聲音在客戶機上播放時,剩餘部分將在背景從伺服器內繼續下載。串流不僅縮短等待時間,而且不需要太大的緩存容量。

  • 串流傳輸避免了用戶必須等待整個檔全部從Internet上下載才能觀看的缺點。

  • 串流傳輸實作有兩種方法:

    • 順序串流傳輸(Progressive streaming)

    • 即時串流傳輸(Realtime streaming)


網路串流格式 - RA 格式

  • RA 格式

    • RealNetwork公司所發展的 RealAudio 格式

    • 副檔名為 .ra

    • 屬於串流(Streaming)型式,播放時不需完全下載便可開始收聽

    • 安裝RealPlayer播放器才可以播放此聲音格式

    • 使用串流通道協定 RTSP (Real-Time Streaming Protocol) 的技術,達成線上音訊的播放

    • 相關網址:http://www.real.com


網路串流格式 - WMA 格式

  • 微軟所開發的網路串流音訊格式

  • 副檔名為 .wma

  • 具良好的壓縮能力,壓縮率一般都可以達到 1:18 左右

  • 以減少數據流量但保持音質的方法來達到比 MP3 壓縮率更高的目的

  • Windows 系統中預設的編碼格式

  • 錄製時可對音質進行調整

    • 音質 - 可與 CD 媲美

    • 網路應用 – 可調高壓縮率讓資料能順暢播放


Realnetworks
RealNetworks

  • 1994年,最早在網際網路上使用媒體播放技術

  • 網路上常見格式



MIDI樂器數位界面

  • 1983年世界著名電子音樂製造廠商共同制訂MIDI(Musical Instrument Digital Interface)標準,使各種與電子音樂有關的設備能相互連接與訊息交流

  • MIDI是一種數位化的界面,對於電子設備如何發音訂出了一套統一的規格。不同廠商所設計製造的軟、硬體,只要符合MIDI的規格,便具有互通性

  • 微軟的作業系統自Window 3.1起,把MIDI列為支援的規格之後,使得MIDI成為電腦音樂軟體必須遵循的標準格式


MIDI相關

MIDI像是一份純文字物件,主要記載哪項樂器在哪個時間要用哪種演奏方法、演奏節拍、音量大小等等資訊

MIDI制訂的樂器聲音都已經內建在支援的MIDI音效卡中

MIDI檔案通常很小(小於10Kbytes)

MIDI有統一的格式與標準,現今的電腦均可播放,沒有相容性的問題



影像的記錄方式(1)

  • 向量式

    • 記錄影像的座標、圖形種類與相關參數,於顯示時才將它「畫」(Rendering) 出來

  • 優點

    • 以向量與物件觀念表示影像,使用上較具彈性

    • 儲存圖形所需的空間小、處理速度快

  • 缺點

    • 不規則內容影像的表現困難

    • 影像的色彩層次感表現不佳

    • 不方便進行影像特效處理

  • 應用領域

    • 建築、機械製圖、流程圖等規律性的形體、線條組成的圖面



影像的記錄方式(2)

點陣式

將影像分割成棋盤狀的方格點,再儲存每個點的資訊

優點

影像的色彩層次感表現逼真

可作各種影像處理,呈現逼真的效果

缺點

無法以物件來記錄影像內的個別圖像,後續的編修較為不便

縮放時,影像會失真

應用領域

可表達任何形式圖案、應用範圍廣



基本原理-從點陣影像談起(1)

像素(pixel)

「點」是構成影像的基本單位,稱為「像素」

影像大小

影像的長度和寬度,單位為像素的個數

解析度

在攝製影像時,單位長度所包含的像素個數,稱為解析度

解析度愈高,影像看起來就愈精細

深度

一個像素所需使用的位元數


基本原理-從點陣影像談起(2)

單色影像,基本色彩為黑、白兩色。彩色影像則根據光的合成原理。

根據影像的色彩與像素深度,常見的色彩分為:

單色(Mono) :一個像素只有黑或白,需要1位元

256 灰階 (256 Gray level) :共256層次、需要8位元

16 色 :16色、需4位元

256 色 :256色、一像素需8位元

65536 種顏色 (又稱為 Hi-Color) :共65536色、一像素需16位元

全彩模式 (又稱 True Color) :一像素需24位元


色彩及解析度的平衡與取捨(1)

不同的色彩模式,顏色的表現能力不同

256灰階

單色

16色

全彩


色彩及解析度的平衡與取捨(2)

不同的解析度,影響整個影像細緻的程度

72點/cm

18點/cm


色彩及解析度的平衡與取捨(3)

影像的品質取決於它的解析度和所用的色彩模式

愈高的解析度與愈深的色彩模式所需要的記憶儲存容量也愈大

儲存影像資訊所需的記憶空間大小可以用下列公式來計算

影像儲存所需空間=影像高(點數) ×影像寬(點數) ×像素深度(位元組)


影像壓縮概念

影像壓縮的基本原理是

將影像中重複的部份去掉(無損壓縮)

不重要的部分去掉(略損壓縮)

影像壓縮方法

變動長度編碼法(Run Length Encoding)

只記錄資料中重複多次內容的細節與出現的次數

離散餘弦轉換(Discrete Cosine Transform)

將影像中較不重要的部分去掉,僅保留重要資訊


影像格式(1)

影像檔

影像說明部分

通常在檔案的前面部分,稱為檔頭(Heading),儲存影像的長度、寬度、色彩模式及壓縮方式等

影像資料部分

儲存各個像素的資料


影像格式(2)

常見的影像檔格式

BMP

微軟公司所提出的點陣圖格式,支援 RGB 全彩、索引色、灰階及黑白等色彩類型

BMP 格式支援全彩、索引色、灰階及黑白等


影像格式(3)

GIF

1987 年由Compu-serve 所提出的影像壓縮格式,是網頁上最常用的圖形格式

可存成透明圖、交錯圖和動畫

最多只能儲存256 色的色彩深度(缺點)

提供「非破壞性壓縮」,存檔體積小、不失真

適合單純少數顏色的影像,如網頁文字與商標


影像格式(4)

PNG

主要應用於 Internet 上, 用來取代 GIF 格式

PNG可說是結合了 JPG 與 GIF 的優點

可以存成交錯圖、透明圖

支援RGB 全彩影像、索引色、灰階及黑白模式

採「非破壞性壓縮」,檔案減小不失真


影像格式(5)

PCD

柯達(Kodak) 公司制定的相片光碟(Photo CD) 格式

存成相片光碟可以直接相底片「沖洗」成數位影像

品質高,可達4096 x6144像素,還可以配上聲音與文字

TIF

TIF 是影像處理界普遍支援的圖檔格式,適用於印刷輸出

跨平台

提供「非破壞性壓縮」

適用印刷輸出

大部分影像處理軟體及排版軟體皆支援


影像格式(6)

UFO

UFO 是 PhotoImpact 專用的檔案格式

可以包含物件、路徑、選取區等

支援各種色彩

提供非破壞性壓縮

適合用來儲存「未完成」的影像作品

缺點:其他影像軟體不支援


影像格式(7)

JPG

一種影像壓縮檔案格式,具有相當好的壓縮品質

屬於略損壓縮的格式(破壞性壓縮)

支援全彩影像壓縮,是目前應用最為廣泛的壓縮格式

存檔可以選擇壓縮層級:高壓縮,影像品質降低;高品質壓縮,較不失真


影像格式(8)

特定影像軟體的儲存格式

PhotoImpact 的 UFO

Paint Shop Pro 的 PSP

PhotoShop 的 PSD

一般影像軟體相容格式

JPEG、GIF、BMP、PCX、TIF、TGA、PNG…


影像來源

  • 掃描器

  • 數位相機

  • 光碟片的影像圖庫

  • 網際網路多采多姿的網頁圖片

  • 電腦螢幕畫面擷取



視訊原理

電影的英文叫 “Motion Picture”,字面上為「動畫」的意思。其原理就是當我們快速翻閱一張張記錄連續場景的圖片時,由於人眼有「視覺暫留」的特性,會將這些獨立的圖片感覺成連續、活動的影片,也因此才會將連續播放的圖片稱為動畫。


視訊原理

電視系統的類比視訊規格

美規:NTSC,為「美國國家規格委員會」所制定,每秒29.97個畫面(fps, frames per second);北美、台灣、菲律賓、日本...等國採用

歐規:PAL,為歐盟各國所共同制定,每秒25個畫面;歐洲、澳洲、東南亞(菲律賓除外) 、大陸等國採用

其它:SECAM,由法國所制定,每秒25個畫面;法國、蘇聯、非洲等國採用


視訊數位化 (量化)

單一像素儲存

將R、G、B 三原色光分別以8位元表示、儲存

合成後共使用24位元,可有224=1677萬種顏色組合;這個組合幾乎可將大自然的所有顏色以數字化方式加以有效的表達

畫面儲存(以NTSC標準計算,29.97fps)

每個畫面的大小(如352x240個點)

每秒儲存的畫面數(如每秒30張)

一分鐘的資料量為 352x240x30x60x3 (共約435MB) 龐大的資料量


視訊資料壓縮

數位化視訊資料處理的重要課題

目標

有效減少視訊資料的儲存空間

又能同時保留視訊資料的內涵

影響視訊資料儲存空間的主要因素

單一影像畫格 (Frame) 的儲存空間

儲存影像的張數


視訊資料壓縮

作法

減少單一影像的儲存空間:套用影像壓縮的部分,利用影像壓縮技術以比較簡潔的方式來儲存每一張單一的影像

減少儲存的影像張數:視訊資料具連續性與相似性

記錄關鍵畫格 (key frame)

而介於關鍵畫格之間的其他畫格,只需儲存與關鍵畫格影像之間的差異資訊


Streaming media
流視訊 (Streaming Media)

當前在網際網路應用上最主要的一種多媒體傳遞與播放方式

藉由串流視訊技術,視訊資料可以在網際網路上進行傳輸,而使用者僅需接收到部分的多媒體資料之後便可以開始播放,不用苦等完整檔案下載成功

目前較常見的格式有 RealVideo、WMV、MPEG4、H.264…等格式


Mpeg 1
MPEG-1

MPEG-1為最早發表的MPEG格式

標準解析度

NTSC系統:352x240

PAL 系統:352x288

採樣位元率 (bit rate)

可由 90Kbit/sec~5Mbit/sec


Mpeg 2
MPEG-2

MPEG-2沿用了MPEG-1的標準,並且加以擴充:

標準解析度

NTSC系統:720 × 480

PAL 系統:720 × 576

色差比例

由MPEG-1的4:2:0 擴增為4:2:2 以及4:4:4兩種模式,色彩儲存較MPEG-1豐富

畫面掃描方式

除了原先MPEG-1所使用的逐列掃描之外,也增加了交錯式 (Interlace) 的掃描方式

採樣位元率

可由2Mbps至15Mbps


Mpeg 4
MPEG-4

MPEG-4 標準

將視訊資料壓縮到極低的位元比率

提供了使用者與視訊內涵之間的互動編輯能力

將視訊當中各種不同的資料以各式各樣的「視訊物件」 (VOP,Video Object Plane) 表示,而所有的壓縮以及資料傳遞過程都是以「物件」作為基本的單位來加以處理

適用的位元率範圍亦可從5Kbps到2Mbps

主要應用:視訊傳遞、編輯


AVI格式

微軟公司(Microsoft)所開發出來的一種視訊格式

將各種媒體資料以資料流 (data stream)的方式儲存,並將音訊資料是與視訊資料一起交錯安排,使得它們可以天衣無縫的一起播放

由於 Windows 作業系統的普及目前在 Windows 作業平台上最廣泛被運用的音訊/視訊格式

AVI 的格式中只描述了音訊以及視訊資料流儲存在檔案之中的結構,並未特別指定它編碼的方式,因此它可以透過許多不同的編碼方式加以儲存

壓縮編碼的種類繁多,目前較常被使用的有Motion-JPEG、DivX以及MPEG-4等


Quicktime
QuickTime 格式

Apple公司在 1991 年開發出來的視訊檔案格式

必須要搭配使用QuickTime播放軟體觀看其內容

如AVI一樣,QuickTime並沒有限定視訊資料必須使用何種壓縮格式,它只定義了視訊的結構

現階段QuickTime多半還是使用Apple本身的視訊編碼技術,具備有串流的效果,類似於 RealVideo的格式


MKV 格式

Matroska(俄語:матроска)是一種新的多媒體封裝格式

可把多種不同編碼的視頻及16條或以上不同格式的音訊和語言不同的字幕封裝到一個Matroska Media檔內。

是其中一種開放原始碼的多媒體封裝格式。

mkv只是Matroska媒體系列的其中一種檔案格式。


MKV 格式

Matroska媒體定義了三種類型的檔:

MKV (Matroska Video File):視訊檔,可以包含音訊和字幕;

MKA (Matroska Audio File):單一的音訊檔,可以有多條及多種類型的音軌;

MKS (Matroska Subtitles):字幕檔案。

這三種檔案中以MKV最為常見。



串流視訊

透過通信網路,由伺服器將影音檔案傳送並分解成許多小封包(Packets),產生連續不間斷的訊號流;訊號流到用戶端之後,再利用媒體播放程式將這些封包一一重組與呈現,藉由不斷由伺服器往客戶端傳送視訊的小封包,產生一個連續且持續不斷的訊號流,故名為串流媒體

常見的串流視訊格式包括了有前述需要較高頻寬的MPEG-1、MPEG-2外,另有在網際網路上常見的 RealVideo、QuickTime、WMV、MPEG4及H.264等視訊格式

串流媒體最大的功用:在於即時的將壓縮後的視訊與音訊資料傳遞到客戶端,讓客戶端可以在尚未完全接收到全部的資料內容之前便開始透過用戶端的程式加以解壓縮,並且將視訊與音訊內容加以播放