1 / 61

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Υπάρχουσες εφαρμογές: Αναπαραγωγή αποθηκευμένου οπτικοακουστικού υλικού (εκπαιδευτικές/ψυχαγωγικές π.χ. video on demand )

Download Presentation

VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. VIDEO ΚΑΙ ΕΦΑΡΜΟΓΕΣ • Υπάρχουσες εφαρμογές: • Αναπαραγωγή αποθηκευμένου οπτικοακουστικού υλικού (εκπαιδευτικές/ψυχαγωγικές π.χ. video on demand) • Οπτικοακουστική επικοινωνία πραγματικού χρόνου (ένας-προς-έναν π.χ. ενημέρωση διευθυντή από υπαλλήλους ή ένας-προς-πολλούς π.χ. σεμινάριο για υπαλλήλους ή φοιτητές)

  2. ΣΥΛΛΗΨΗ VIDEO • Υποσυστήματα γραφικών: σύνθετο σήμα RGB, σάρωση raster • Τηλεοράσεις: σύνθετο σήμα YUV ή YIQ, πλεκτή (interlaced) σάρωση • Συμπέρασμα: απαιτείται ειδικό υλικό για μετατροπή σήματος

  3. ΣΥΛΛΗΨΗ VIDEO • Κάρτες υπέρθεσης video (video overlay boards): παρουσίαση εικόνας σε τμήμα οθόνης, συγχρονισμός, μίξη με κείμενο, γραφικά (όχι ψηφιοποίηση) • Ψηφιοποιητές: ψηφιοποιούν το σήμα PAL ή NTSC από video player, camera, δυνατότητα editing, παρουσίαση οπουδήποτε στην οθόνη • Κάρτες συμπίεσης: DVI (Intel 1989) πρότυπο για εφαρμογές κινούμενης εικόνας, MJPEG (Motion JPEG), MPEG.

  4. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ • Χωρικό και χρονικό πλεόνασμα πληροφορίας • Συμπίεση κινούμενης εικόνας: εκμετάλλευση χωρικού (π.χ. MJPEG) ή και χρονικού πλεονάσματος(π.χ. MPEG) • MJPEG: ευκολία επέμβασης σε πλαίσια και ανθεκτικότητα σε λάθη • MPEG: συσχέτιση πλαισίου με προηγούμενα (άρα λάθη), αλλά μεγαλύτεροι λόγοι συμπίεσης

  5. Η ΑΝΑΓΚΗ ΓΙΑ ΨΗΦΙΑΚΗ ΣΥΜΠΙΕΣΗ • Στόχος: οικονομία στο εύρος φάσματος • Ασυμπίεστο τηλεοπτικό σήμα PAL: 5 MHz • Ψηφιακή μετάδοση: 10 MHz (θεώρημα Nyquist) • Τουλάχιστον 8 bits/δείγμα (256 επίπεδα) • Έγχρωμη εικόνα: τρία κανάλια χρώματος • Συνολικά: 3*10*8=240 Mbits/sec • Transfer rate από/προς επεξεργαστή (PCI bus): 133Mbits/sec • Transfer rate CD-ROM: 60 Mbits/sec • Συμπέρασμα: αδύνατη αποθήκευση/αναπαραγωγή

  6. Η ΑΝΑΓΚΗ ΓΙΑ ΨΗΦΙΑΚΗ ΣΥΜΠΙΕΣΗ • Τυπική κινηματογραφική ταινία 90 min (5400 sec): 162 GB (μεγαλύτερο από συνήθη χωρητικότητα σκληρού δίσκου) • CD-DA: 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου στα 44.1 KHz με 16 bit/sample → 650 ΜΒ • Αποθήκευση ψηφιακού video στο CD: 30 sec • DVD (Digital Versatile Disk): 4.7 GB (θέλω 35 DVD!)

  7. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG (Moving Picture Experts Group): ομάδα ISO/IEC JTC1/SC29/WG11 (1988) • Συντονιστής επιτροπής MPEG: Leonardo Chiariglione («πατέρας» του MPEG) • MPEG: οικογένεια τυποποιήσεων (MPEG-1, MPEG-2, MPEG-4, MPEG-7, MPEG-21)

  8. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG-1 (Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/sec): • ανάλυση 352240 pixels (NTSC) ή 352288 pixels (PAL) • ποιότητα VHS video • Αποθήκευση σε CD-ROM, Video-CD, CD-i • Εφαρμογές με ρυθμό μετάδοσης 4-5 Mbits/sec (όχι καλά αποτελέσματα)

  9. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG-2 (Generic coding of moving pictures and associated audio information): • Ανάλυση 704480 pixels (NTSC) ή 704576 pixels (PAL) (broadcast quality) • Εικόνα πλεκτής σάρωσης (interlaced) • Ρυθμός μετάδοσης 3-10 Mbits/sec • Εφαρμογές στην καλωδιακή τηλεόραση (CableTV), στη δορυφορική (Direct Broadcasting Satellite TV), αποθήκευση ταινιών σε DVD.

  10. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG-4 (Coding of audio-visual objects): • Audio-visual objects (AVO): οντότητες που απαρτίζουν την εικόνα (σχήματα, ήχοι κλπ.) • Ανάλυση εικόνας 176144 pixels • Ρυθμός μετάδοσης 4.8-64 Kbits/sec (δίκτυα με μικρό bandwidth) • Εφαρμογές επικοινωνίας πολυμέσων (video-phone, video-conference, video e-mail, electronic news κλπ.)

  11. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG-7: πρότυπο κωδικοποίησης με αναπαράσταση περιεχομένου (content representation) για αναζήτηση πληροφοριών σε εφαρμογές πολυμέσων • CPB (Constrained Parameters Bitstream): ορίζει διαστάσεις MPEG σημάτων (επιτρέπονται και υψηλότερες αναλύσεις, χωρίς εγγυημένη αναπαραγωγή) • MPEG-2 έως 19201080 pixels, MPEG-1 έως 40954095 pixels

  12. ΠΡΟΤΥΠΟ ΣΥΜΠΙΕΣΗΣ MPEG • MPEG-2 προσφέρει καλύτερη εικόνα και λόγους συμπίεσης από το MPEG-1 και είναι συμβατό (backwards compatible) • MPEG-3 προοριζόταν για Τηλεόραση Υψηλής Ευκρίνειας (HDTV – High Definition TV) αλλά MPEG-2 κάλυψε τις απαιτήσεις

  13. ΠΟΙΟΤΙΚΗ ΑΝΟΧΗ • Δεχόμαστε ένα ποσοστό παραμόρφωσης • Αναβαθμίζουμε το μέσο όρο ανάλυσης σκηνών • Χρυσή τομή ανάμεσα σε ποιότητα και bandwidth • Υποκειμενικές μετρήσεις που βασίζονται σε έμπειρους εκτιμητές • Αποδεκτή συμπίεση: ανεκτές ατέλειες (artifacts) εικόνας • Ήχος προσφέρεται για μεγαλύτερα ποσοστά συμπίεσης

  14. ΠΛΕΟΝΑΣΜΟΣ • Στατικός πλεονασμός (Spatial Redundancy): Γειτονικές περιοχές στο ίδιο frame είναι παρόμοιες. • Υποκειμενικός πλεονασμός (Temporal Redundancy): Αντίστοιχες περιοχές σε διαδοχικά frames είναι παρόμοιες. • Εκμετάλλευση υποκειμενικού πλεονασμού στην αναλογική τηλεόραση παλιότερα και τώρα σε ψηφιακή μετάδοση

  15. DCT Coding (Discrete Cosine Transform Coding) • Διακριτός μετασχηματισμός συνημίτονου (DCT): Όπου • Κάθε συντελεστής μεταφέρει πληροφορία που αντιστοιχεί σε τμήμα του φάσματος • Ανθρώπινη όραση αντιλαμβάνεται περισσότερο χαμηλές συχνότητες

  16. DCT Coding (Discrete Cosine Transform Coding) • Αντίστροφος διακριτός μετασχηματισμός συνημίτονου (IDCT): • Λαμβάνεται σχεδόν ανέπαφη η αρχική πληροφορία (εκτός από σφάλματα στρογγυλοποίησης)

  17. ΚΒΑΝΤΟΠΟΙΗΣΗ • Απαλλασσόμαστε από σημαντικό μέρος της πληροφορίας • Μετατροπή σήματος άπειρων τιμών σε σήμα ορισμένων διακριτών τιμών • Παράδειγμα: κβαντοποίηση εικόνας εκατομμυρίων χρωμάτων σε εικόνα 256 τιμών (πρότυπο JPEG)

  18. ΚΒΑΝΤΟΠΟΙΗΣΗ • Παράδειγμα: • 45 στο δυαδικό 101101 (6 bits) • Με 4 bits είναι 1011 (δηλ. 11) • Με 3 bits είναι 101 (δηλ. 5) κτλ. • Συμπέρασμα: εισάγεται σφάλμα ανάλογο του πλήθους bits που απορρίπτονται (lossy compression) • Διαίρεση τιμών με σταθερές τιμές (uniform quantization) ή με τιμές από πίνακα (quantization table) όπως στο MPEG (intra-frame και inter-frame)

  19. ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION) • Αποτελεσματική περιγραφή εικόνων με κίνηση • Δια-πλαισιακή (inter-frame) κωδικοποίηση • Περιγραφή με τμήματα που παραμένουν ίδια και διανύσματα που δείχνουν μετακίνηση άλλων τμημάτων • Προβλήματα: τμήματα αλλάζουν θέση αλλά και χρώμα, εμφανίζονται νέα τμήματα • MPEG: καθορίζεται η αναπαράσταση με διανύσματα κίνησης (motion vectors) αλλά δεν καθορίζεται η μέθοδος εύρεσής τους

  20. ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION) • Συνήθως χρησιμοποιείται το απόλυτο λάθος (Absolute Error): • f(i,j) το τρέχον μπλοκ και g(i,j) το macroblock αναφοράς (περιοχή αναζήτησης) • Το macroblock που δίνει ελάχιστο σφάλμα αντιστοιχεί στο διάνυσμα κίνησης (dx,dy) • Πλήρης αναζήτηση (full search): Απλή αλλά υπολογιστικά πολύπλοκη

  21. ΤΜΗΜΑΤΙΚΗ ΠΡΟΒΛΕΨΗ ΚΙΝΗΣΗΣ (BLOCK MOTION COMPENSATION) • Αναζήτηση τριών βημάτων (TSS – Three Step Search): • Υπολογίζεται το AE στο κέντρο και σε οκτώ περιοχές της περιοχής αναζήτησης (μεγέθους 3232 pixels) • Περιοχή με ελάχιστο AE γίνεται κέντρο νέας αναζήτησης (μισού μεγέθους) • Επανάληψη διαδικασίας τρεις φορές (three steps)

  22. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG • Τρία επίπεδα ρεύματος (stream) MPEG:

  23. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG • Επίπεδο system: πληροφορίες σχετικά με συγχρονισμό, ροή σήματος, σημεία αναφοράς για τυχαία προσπέλαση και για διαχωρισμό video και audio και συγχρονισμένη απεικόνιση • Επίπεδα video και audio: κωδικοποιημένη εικόνα και ήχος αντίστοιχα • Κωδικοποίηση επιπέδων ταυτόχρονη είτε ξεχωριστή • Συνένωση δεδομένων με πολυπλεξία (multiplexing) (real time είτε όχι)

  24. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG • MPEG coding/decoding γίνεται με hardware ή software • Λύση software: φθηνή αλλά χειρότερη ποιότητα εικόνας και απαίτηση υπολογιστικής ισχύος • Λύση hardware: ακριβότερη, αλλά αυτόνομα συστήματα (encoders/decoders) και καλύτερη ποιότητα • Κωδικοποιήσεις όπως Cinepak, Indeo, MJPEG στηρίζονται στο JPEG.

  25. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG • Κωδικοποίηση MPEG επεκτείνει βασικές αρχές JPEG παραμετροποιώντας την κίνηση (μεγαλύτερα ποσοστά συμπίεσης) • Τα πλαίσια (frames) χωρίζονται σε τμήματα (slices) • Τα slices περιέχουν macroblocks (και αυτά με τη σειρά τους blocks μεγέθους 88 pixels) • Τα slices περιορίζουν διάδοση σφαλμάτων (error propagation) - βοηθούν στην απόκρυψη σφαλμάτων (error concealment)

  26. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG

  27. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG • Δειγματοληψία χρωματικών συνιστωσών αναλογικού σήματος τηλεόρασης (Cr και Cb) στα 6,75 MHz • Δειγματοληψία φωτεινότητας (Υ) στα 13,5 MHz (διπλάσια συχνότητα) • Και τα δύο πολλαπλάσια του 2,25 MHz (ΕΚΠ ρυθμού σάρωσης γραμμών σε PAL και NTSC) • Στην ψηφιακή τους μορφή για κάθε macroblock τρεις πίνακες (ένας 1616 και δύο 88 pixels) • Στους πίνακες αυτούς εφαρμόζεται ο DCT, οι άλλες διαδικασίες συμπίεσης και η πρόβλεψη κίνησης

  28. ΑΝΑΤΟΜΙΑ ΣΗΜΑΤΟΣ MPEG

  29. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • Ενδο-πλαισιακή κωδικοποίηση (Intra-frame Coding):κάθε εικόνα αντιμετωπίζεται και κωδικοποιείται ανεξάρτητα από τις υπόλοιπες (όπως στο JPEG) • Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):λαμβάνονται υπόψη ομοιότητες πλαισίων, κωδικοποιείται η διαφορά τους (με block motion compensation) → μεγαλύτερη συμπίεση

  30. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • I (Intra frames): • κάνει χρήση intra-frame coding • Κωδικοποιείται ολόκληρο το πλαίσιο • Μεγάλο μέγεθος • Σημεία αναφοράς • Μεταδίδονται ανά τακτό αριθμό πλαισίων (ανά 15 τουλάχιστον) • Εικόνα χωρίζεται σε macroblocks και εκτελείται για καθένα DCT, κβαντοποίηση, zig-zag scanning, run-length encoding, Huffman encoding

  31. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • P (Predicted frames): • Βασίζονται σε προηγούμενο I ή P πλαίσιο • Κωδικοποιείται ο αριθμός του macroblock και το διάνυσμα κίνησης (motion vector) • Αποτελούν κι αυτά σημεία αναφοράς για επόμενα P πλαίσια • Είναι μικρότερα από τα I frames (μεγαλύτερη συμπίεση) • Σύγκριση macroblocks, γραμμικός συνδυασμός παρόμοιων, δημιουργία motion vector, DCT σε κάθε block, κβαντοποίηση, run-length encoding, Huffman encoding

  32. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • P (Predicted frames):

  33. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • B (Bi-directional frames): • Μέσος όρος (σε επίπεδο macroblock) προηγούμενου και επόμενου πλαισίου I και P • Δεν αποτελούν σημεία αναφοράς • Δεν διαδίδουν σφάλματα όσο τα άλλα • Δεν περιέχουν αυθύπαρκτη πληροφορία • Αφαίρεση μέσου όρου macroblocks (προηγούμενου κι επόμενου πλαισίου) από το τρέχον πλαίσιο, συνδυασμός motion vectors (μέσος όρος), και κωδικοποίηση όπως τα I και P πλαίσια

  34. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • B (Bi-directional frames):

  35. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • Χρησιμότητα πλαισίων B: για τις περιπτώσεις που πληροφορία σε επόμενα πλαίσια δεν υπάρχει σε προηγούμενα (π.χ. ανοίγει πόρτα που αποκαλύπτει νέα αντικείμενα) • Συμπεράσματα: • Τα πλαίσια I πρέπει να στέλνονται πριν τα αντίστοιχα P • Τα πλαίσια P και I πρέπει να στέλνονται πριν τα αντίστοιχα Β • Πολλές φορές παρεμβάλλονται περισσότερα Β πλαίσια και τα Ι πλαίσια απέχουν περισσότερο

  36. ΕΙΔΗ ΠΛΑΙΣΙΩΝ

  37. ΕΙΔΗ ΠΛΑΙΣΙΩΝ • GOP (Group of Pictures): • Η μικρότερη μονάδα που αποκωδικοποιείται ανεξάρτητα. • Περιέχει όλα τα Ι,Ρ,Β πλαίσια που χρειάζονται για αποκωδικοποίηση (χωρίς αναφορά σε άλλα GOP) • Αναλογία πλαισίων σε σήμα MPEG:

  38. ΠΑΡΑΔΕΙΓΜΑ: ΣΚΗΝΗ 3 ΠΛΑΙΣΙΩΝ

  39. ΠΛΑΙΣΙΑ ΠΡΟΒΛΕΨΗΣ ΚΑΙ ΑΝΑΦΟΡΑΣ

  40. ΑΝΤΙΣΤΑΘΜΙΣΗ ΚΙΝΗΣΗΣ

  41. ΠΛΑΙΣΙΑ ΔΙΠΛΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

  42. RUN LENGTH ΚΑΙ HUFFMANCODING • Δε μεταβάλλονται οι τιμές των δειγμάτων • Μειώνεται το πλήθος bits • Run-Length-Encoding: • Πολλά μηδενικά σε διαδοχικές θέσεις • Flags δείχνουν ότι ακολουθεί ομάδα τιμών • Huffman Coding: • Συχνότερα εμφανιζόμενες τιμές -> λίγα bits • Λεξικό για αντιστοίχιση (μαζί με το σήμα)

  43. ADAPTIVE CODING • Δύο είδη κωδικοποίησης: inter-frame και intra-frame • Απαιτείται μετάδοση ενός Ι πλαισίου κάθε 15 πλαίσια • Το βίντεο μπορεί να έχει γρήγορες αλλαγές σκηνικών και χρωμάτων • Κωδικοποιητής επιλέγει είδος κωδικοποίησης (πολύπλοκη υλοποίηση) • MPEG-2: μεταβαλλόμενος ρυθμός μετάδοσης

  44. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Παράδειγμα: κωδικοποίηση ενός Ι-frame

  45. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Εφαρμόζεται ο μετασχηματισμός DCT:

  46. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Κατωφλίωση (thresholding):

  47. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Κβαντισμός (π.χ. στρογγυλοποίηση):

  48. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Σάρωση σε σχήμα zig-zag:

  49. ΔΙΑΔΙΚΑΣΙΑ ΚΩΔΙΚΟΠΟΙΗΣΗΣ • Εικόνα μετά από αποκωδικοποίηση:

  50. ΠΡΟΤΥΠΟ MPEG-2 • Υποστηρίζει μεγαλύτερους ρυθμούς μετάδοσης δεδομένων (2-80Mbits/sec) • Χρησιμοποιείται για υψηλής ποιότητας ψηφιακό video (καλωδιακή, δορυφορική μετάδοση, DVD) • Υποστηρίζονται ιεραρχικά/κλιμακωτά προφίλ • Κάθε προφίλ υποστηρίζει χαρακτηριστικά συγκεκριμένης ομάδας εφαρμογών

More Related