1 / 68

多媒體簡介

多媒體簡介. 陳 政 雄. 大綱. 音訊媒體 聲音 基本原理 音訊檔案格式 影像媒體 影像 基本原理 影像檔案 格式 視訊媒體 視訊 基本原理 視訊檔案 格式. 音訊媒體. 聲音的基本原理 . 聲音產生的原理 當介質(如空氣、水)中產生了震動,此震動對介質造成壓力,而此壓力會以 波 的形式藉由介質向外擴散,當這些波傳到人的耳朵且頻率範圍在人耳可感應的範圍內 ( 20Hz~20kHz ) ,耳膜會因感應而聽見聲音 真空中聽不見聲音 震動愈強 ,人耳「聽見」的 聲音就會愈大 ;反之,則聲音就會相對的微弱 . 聲音的頻率. 聲音的頻率

mayes
Download Presentation

多媒體簡介

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 多媒體簡介 陳政雄

  2. 大綱 • 音訊媒體 • 聲音基本原理 • 音訊檔案格式 • 影像媒體 • 影像基本原理 • 影像檔案格式 • 視訊媒體 • 視訊基本原理 • 視訊檔案格式

  3. 音訊媒體

  4. 聲音的基本原理 • 聲音產生的原理當介質(如空氣、水)中產生了震動,此震動對介質造成壓力,而此壓力會以波的形式藉由介質向外擴散,當這些波傳到人的耳朵且頻率範圍在人耳可感應的範圍內(20Hz~20kHz),耳膜會因感應而聽見聲音 • 真空中聽不見聲音 • 震動愈強,人耳「聽見」的聲音就會愈大;反之,則聲音就會相對的微弱

  5. 聲音的頻率 • 聲音的頻率 • 聲波每秒的振動次數稱為頻率 • 頻率在20hz~20khz之間稱為聲波 • 頻率大於20khz稱為超聲波 • 頻率小於20hz稱為次聲波 • 超聲波和次聲波人耳是聽不到的,地震波和海嘯都是次聲波。有些動物的耳朵比人類要靈敏得多,比如蝙蝠就能“聽到”超聲波 • 人的語音頻率範圍主要在200 hz到4000 hz之間 • 在語音範圍中 • 通常把1000 hz以上的區域稱為高頻區 • 500 hz -1000 hz的區域稱為中頻區 • 低於500 hz的區域稱為低頻區

  6. 聲音的量化 • 物理中用來表示聲音強弱的單位為分貝(dB) • 分貝是以「對數」的方式來訂定的 • 聲音的強弱單位是「比」出來的,兩個聲音之間的強弱差異代表的是「它們傳遞到接收端能量強度的比值」 • 例如:A、B兩聲音,其強弱差距為 NABdB=10㏒(A/B)

  7. 各種分貝與功率之範例

  8. Analog to Digital 的流程 • 首先聲音的波動透過介質進入到收音麥克風 • 這些聲音波動轉換成一連串高低變化的電壓波,傳入到電腦 • 將此波透過一低通濾波器濾除其高頻雜訊 • 透過類比數位轉換器(Analog Digital Converter,ADC)將聲音波型數位化 • 將數位化音訊存入記憶體

  9. Digital to Analog 的流程 • 將數位化音訊讀出記憶體 • 透過數位類比轉換器(Digital Analog Converter, DAC)將數位訊號還原 • 還原波再經過一低通濾波器將高次諧波濾除,聲音波形就會比較平滑。 • 透過擴大線路輸出至揚聲器

  10. 取樣頻率 (sampling rate) • 聲音數位化最重要的就是將類比訊號取樣 • 取樣所記錄到的值為「樣本」 • 取樣頻率越高,亦即取樣間隔時間越短,所擷取後的數位音訊資料也就越準確,也愈耗儲存空間 ※「週期」是每隔取樣一次所需時間 ※每秒鐘的取樣次數稱為「頻率」 ※頻率=1/週期

  11. 取樣頻率(續) • 一般我們常見的取樣頻率為11.025kHz、22.05kHz、44.1kHz • CD音質則為44.1kHz、16bits位元深度(解析度) • 取樣頻率越高與越高的位元深度會有越好的音質

  12. 量化-位元深度(解析度 ) • 取樣在每一個上升邊緣時,ADC (Analog Digital Converter)會將當時的值紀錄下來,而此紀錄的値稱為樣本,單位為bit(或稱為解析度),此動作即為量化 • 例如:CD音質,16位元深度聲音區間有216=65,536個區間,範圍-32,768~+32,767 • 愈高的位元深度,愈接近真實的聲音

  13. 量化失真 • 無論採用多高的位元深度來取樣,也不可能完全無誤差的紀錄原本輸入的類比訊號(這也是數位、類比間的鴻溝),此即所謂的「量化失真」

  14. 音訊檔案容量 • 容量計算公式: • 取樣率(Hz) * 時間(s) * 位元深度(bit) / 8 * 聲道數量 • 【其中位元深度 / 8 的8是因為一個位元組(byte)有8個bit】 • 例: 30秒的CD音質錄製下的立體聲檔案大小為5292000bytes • 44100 * 30 * 16 / 8 * 2 = 5,292,000bytes(位元組) • 44100 *240* 16 / 8 * 2 = 42,336,000bytes(位元組) ≒ 42 MB(wav 檔格式)

  15. 多聲道音訊 • 廣泛用於DVD Movie的多聲道音訊編碼格式為 • Dolby Digital(AC3) • Digital Theater Systems(DTS) • 兩種格式均為破壞性壓縮6聲道系統,包含中央、前右、前左、後右、後左與重低音 • AC3:位元率448kbps、較廣大的市場使用 • DTS:位元率1536bps、有較佳的音質

  16. 音訊檔案格式 • 未壓縮的波形音訊格式 • 破壞性壓縮格式 • 網路串流格式 • MIDI

  17. 未壓縮的波形音訊格式 • .wav • 由微軟制定,採PCM編碼的未壓縮波形格式 • 主要用於Windows PC中,副檔名為.wav • 符合RIFF(Resource Interchange File Format)規範 • 具有檔案標頭,記載檔案的編碼參數 • 通常採用PCM編碼,但也可使用其他方式編碼 • .au • 是UNIX系統下的一種常用的格式 • 為昇陽(SUN)所開發,其副檔名為.au • 支援多種壓縮模式,現在少用了

  18. 未壓縮的波形音訊格式 • .aiff • AIFF是Apple的標準格式,其副檔名為.aiff • QuickTime就是使用aiff作為音訊的軟體 • AIFF為功能很強的格式 • 支援多種壓縮技術,但為MacOS專用格式,PC少見 • 仍有其佔有率

  19. 破壞性壓縮格式(1/4) • .mp3 • MP3(MPEG Audio Layer 3)屬於MPEG標準的一環,其副檔名為.mp3 • MP3因有高效率的資料壓縮與音質效果,再加上便利的播放程式以及編碼程式支援,使得MP3的使用者越來越多,逐漸成為多媒體影音標準的趨勢 • 可以藉由調整位元傳輸速率來改變壓縮比率,範圍16k bps~320k bps都有 • 在標準128k bps模式下,可以將一分鐘的MP3壓縮成不到1MB的檔案,播放效果接近原來音效

  20. 破壞性壓縮格式(2/4) • .wma • WMA就是Windows Media Audio,由微軟開發,其副檔名為.wma • 其最大特色就是比MP3容量還要小一半,且音質不輸mp3 • 支援無失真、有失真、語音,全方面的需求支援 • 網路串流品質極佳 • 因 Windows 系統內建播放器Windows media player,這幾年迅速竄起

  21. 破壞性壓縮格式(3/4) • .aac • 繼MP3後的新一代音訊壓縮標準 • AAC => Advanced Audio Coding,屬於 MPEG-2規格的一部份(part 7) • 由 Fraunhofer IIS, Dolby, Apple, AT&T, SONY 等公司共同開發 • MPEG-4加入AAC並整合,故又稱 MPEG-4 AAC,即 m4a • 壓縮比較MP3高,並提供多聲道立體環場音效,勝過雙聲道的MP3

  22. 破壞性壓縮格式(4/4) • .ogg(Ogg Vorbis) • 類似於 MP3 的破壞性壓縮格式 • 有更佳的聲學模型 • 與AAC相同,可以藉由更複雜的壓縮解壓縮演算法達到更加的音質與壓縮比 • OGG的使用尚不普遍

  23. 非破壞性壓縮格式(1/3) • .APE(Monkey’s Audio) • 是一種常見的非破壞性音訊壓縮格式 • 壓縮後的音質與未壓縮前一樣 • 使用.ape為副檔名 • 目前廣泛地用於音樂CD數位保存 • 官網:http://www.monkeysaudio.com/

  24. 非破壞性壓縮格式(2/3) • .FLAC • Free Lossless Audio Codec 縮寫 • 為著名的自由音訊壓縮編碼 • 亦為非破壞性壓縮,可以還原音樂CD品質 • 官網:http://flac.sourceforge.net/

  25. 非破壞性壓縮格式(3/3) • True Audio(縮寫TTA) • 是一種自由又簡單的實時無損音頻編解碼器 • 一種基於自適應預測過濾的無損音頻壓縮 • 與目前主要的其他格式相比,能有相同或更好的壓縮效果 • 相關網站:http://www.true-audio.com/

  26. 網路串流格式 • 網路上傳輸音/視頻等多媒體資訊:主要有下載和串流傳輸兩種方案 • 串流傳輸時,聲音、影像或動畫等影音媒體由音視頻伺服器向用戶電腦的連續、 即時傳送,用戶不必等到整個檔全部下載完畢,而只需經過幾秒或十數秒的啟動延時即可進行觀看 • 當聲音在客戶機上播放時,剩餘部分將在背景從伺服器內繼續下載。串流不僅縮短等待時間,而且不需要太大的緩存容量。 • 串流傳輸避免了用戶必須等待整個檔全部從Internet上下載才能觀看的缺點。 • 串流傳輸實作有兩種方法: • 順序串流傳輸(Progressive streaming) • 即時串流傳輸(Realtime streaming)

  27. 網路串流格式 - RA 格式 • RA 格式 • RealNetwork公司所發展的 RealAudio 格式 • 副檔名為 .ra • 屬於串流(Streaming)型式,播放時不需完全下載便可開始收聽 • 安裝RealPlayer播放器才可以播放此聲音格式 • 使用串流通道協定 RTSP (Real-Time Streaming Protocol) 的技術,達成線上音訊的播放 • 相關網址:http://www.real.com

  28. 網路串流格式 - WMA 格式 • 微軟所開發的網路串流音訊格式 • 副檔名為 .wma • 具良好的壓縮能力,壓縮率一般都可以達到 1:18 左右 • 以減少數據流量但保持音質的方法來達到比 MP3 壓縮率更高的目的 • Windows 系統中預設的編碼格式 • 錄製時可對音質進行調整 • 音質 - 可與 CD 媲美 • 網路應用 – 可調高壓縮率讓資料能順暢播放

  29. RealNetworks • 1994年,最早在網際網路上使用媒體播放技術 • 網路上常見格式

  30. Microsoft

  31. MIDI樂器數位界面 • 1983年世界著名電子音樂製造廠商共同制訂MIDI(Musical Instrument Digital Interface)標準,使各種與電子音樂有關的設備能相互連接與訊息交流 • MIDI是一種數位化的界面,對於電子設備如何發音訂出了一套統一的規格。不同廠商所設計製造的軟、硬體,只要符合MIDI的規格,便具有互通性 • 微軟的作業系統自Window 3.1起,把MIDI列為支援的規格之後,使得MIDI成為電腦音樂軟體必須遵循的標準格式

  32. MIDI相關 MIDI像是一份純文字物件,主要記載哪項樂器在哪個時間要用哪種演奏方法、演奏節拍、音量大小等等資訊 MIDI制訂的樂器聲音都已經內建在支援的MIDI音效卡中 MIDI檔案通常很小(小於10Kbytes) MIDI有統一的格式與標準,現今的電腦均可播放,沒有相容性的問題

  33. 影像媒體

  34. 影像的記錄方式(1) • 向量式 • 記錄影像的座標、圖形種類與相關參數,於顯示時才將它「畫」(Rendering) 出來 • 優點 • 以向量與物件觀念表示影像,使用上較具彈性 • 儲存圖形所需的空間小、處理速度快 • 缺點 • 不規則內容影像的表現困難 • 影像的色彩層次感表現不佳 • 不方便進行影像特效處理 • 應用領域 • 建築、機械製圖、流程圖等規律性的形體、線條組成的圖面

  35. 向量圖範例

  36. 影像的記錄方式(2) 點陣式 將影像分割成棋盤狀的方格點,再儲存每個點的資訊 優點 影像的色彩層次感表現逼真 可作各種影像處理,呈現逼真的效果 缺點 無法以物件來記錄影像內的個別圖像,後續的編修較為不便 縮放時,影像會失真 應用領域 可表達任何形式圖案、應用範圍廣

  37. 點陣圖範例

  38. 基本原理-從點陣影像談起(1) 像素(pixel) 「點」是構成影像的基本單位,稱為「像素」 影像大小 影像的長度和寬度,單位為像素的個數 解析度 在攝製影像時,單位長度所包含的像素個數,稱為解析度 解析度愈高,影像看起來就愈精細 深度 一個像素所需使用的位元數

  39. 基本原理-從點陣影像談起(2) 單色影像,基本色彩為黑、白兩色。彩色影像則根據光的合成原理。 根據影像的色彩與像素深度,常見的色彩分為: 單色(Mono) :一個像素只有黑或白,需要1位元 256 灰階 (256 Gray level) :共256層次、需要8位元 16 色 :16色、需4位元 256 色 :256色、一像素需8位元 65536 種顏色 (又稱為 Hi-Color) :共65536色、一像素需16位元 全彩模式 (又稱 True Color) :一像素需24位元

  40. 色彩及解析度的平衡與取捨(1) 不同的色彩模式,顏色的表現能力不同 256灰階 單色 16色 全彩

  41. 色彩及解析度的平衡與取捨(2) 不同的解析度,影響整個影像細緻的程度 72點/cm 18點/cm

  42. 色彩及解析度的平衡與取捨(3) 影像的品質取決於它的解析度和所用的色彩模式 愈高的解析度與愈深的色彩模式所需要的記憶儲存容量也愈大 儲存影像資訊所需的記憶空間大小可以用下列公式來計算 影像儲存所需空間=影像高(點數) ×影像寬(點數) ×像素深度(位元組)

  43. 影像壓縮概念 影像壓縮的基本原理是 將影像中重複的部份去掉(無損壓縮) 不重要的部分去掉(略損壓縮) 影像壓縮方法 變動長度編碼法(Run Length Encoding) 只記錄資料中重複多次內容的細節與出現的次數 離散餘弦轉換(Discrete Cosine Transform) 將影像中較不重要的部分去掉,僅保留重要資訊

  44. 影像格式(1) 影像檔 影像說明部分 通常在檔案的前面部分,稱為檔頭(Heading),儲存影像的長度、寬度、色彩模式及壓縮方式等 影像資料部分 儲存各個像素的資料

  45. 影像格式(2) 常見的影像檔格式 BMP 微軟公司所提出的點陣圖格式,支援 RGB 全彩、索引色、灰階及黑白等色彩類型 BMP 格式支援全彩、索引色、灰階及黑白等

  46. 影像格式(3) GIF 1987 年由Compu-serve 所提出的影像壓縮格式,是網頁上最常用的圖形格式 可存成透明圖、交錯圖和動畫 最多只能儲存256 色的色彩深度(缺點) 提供「非破壞性壓縮」,存檔體積小、不失真 適合單純少數顏色的影像,如網頁文字與商標

  47. 影像格式(4) PNG 主要應用於 Internet 上, 用來取代 GIF 格式 PNG可說是結合了 JPG 與 GIF 的優點 可以存成交錯圖、透明圖 支援RGB 全彩影像、索引色、灰階及黑白模式 採「非破壞性壓縮」,檔案減小不失真

  48. 影像格式(5) PCD 柯達(Kodak) 公司制定的相片光碟(Photo CD) 格式 存成相片光碟可以直接相底片「沖洗」成數位影像 品質高,可達4096 x6144像素,還可以配上聲音與文字 TIF TIF 是影像處理界普遍支援的圖檔格式,適用於印刷輸出 跨平台 提供「非破壞性壓縮」 適用印刷輸出 大部分影像處理軟體及排版軟體皆支援

  49. 影像格式(6) UFO UFO 是 PhotoImpact 專用的檔案格式 可以包含物件、路徑、選取區等 支援各種色彩 提供非破壞性壓縮 適合用來儲存「未完成」的影像作品 缺點:其他影像軟體不支援

  50. 影像格式(7) JPG 一種影像壓縮檔案格式,具有相當好的壓縮品質 屬於略損壓縮的格式(破壞性壓縮) 支援全彩影像壓縮,是目前應用最為廣泛的壓縮格式 存檔可以選擇壓縮層級:高壓縮,影像品質降低;高品質壓縮,較不失真

More Related