Predavanja 8 i 9 multimedijalni procesori dr velizar pavlovi dipl ing
Download
1 / 47

MULTIMEDIJALNI SISTEMI - PowerPoint PPT Presentation


  • 132 Views
  • Uploaded on

Predavanja 8 i 9 Multimedijalni procesori Dr. Velizar Pavlović dipl. Ing. MULTIMEDIJALNI SISTEMI. Br zo procesiranje kod multimedijalnih aplikacija - MMA. Arhitekturna podrška za MMA se klasifikuje u sledeće tri kategorije: aplikaciono-specifični procesori/kola – ASIP i ASIC

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' MULTIMEDIJALNI SISTEMI' - kami


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Predavanja 8 i 9 multimedijalni procesori dr velizar pavlovi dipl ing

Predavanja 8 i 9

Multimedijalni procesori

Dr. Velizar Pavlović dipl. Ing

MULTIMEDIJALNI SISTEMI


Brzo procesiranje kod multimedijalnih aplikacija - MMA

Arhitekturna podrška za MMA se klasifikuje u sledeće tri kategorije:

  • aplikaciono-specifični procesori/kola – ASIP i ASIC

  • multimedijalna proširenja za GPP – GPP sa SIMD ekstenzijama

  • media procesori – VLIW mašine


Karakteristike MMA u odnosu na GPA

  • odziv u realnom vremenu: MMA kakve su video konferencije i elektronsko poslovanje zahtevaju odziv u realnom vremenu. Pored toga, dodatno se zahteva i ispunjenje određenog nivoa QoS ( Quality of Service, recimo procena kašnjena slika-govor).

  • procesiranje streaming podataka: kod MMA-ova program za obradu (kôd) je upisan u čip (on-chip), a niz podataka (stream of data) dolazi (prihvata se) van čipa (off-chip).

  • sitno-zrnasti i krupno-zrnasti paralelizam: obično MMA-ovi obavljaju istu operaciju nad različitim stavkama podataka (tj. pixel-a), kakvo je median filtriranje. Pored toga, veći broj funkcija treba da se istovremeno obavlja nad ovim vrednostima podataka (tipično je to za skaliranje obima slike). Imajući u vidu da su ove operacije i funkcije u velikoj meri međusobno nezavisne moguće je koristiti kako SIMD tako i Thread Level Parallelism (TLP).


Karakteristike MMA u odnosu na GPA – prod.

  • Izrazita reorganizacija podataka: Pored SIMD načina procesiranja, kod velikog broja aplikacija javlja se potreba za reorganizacijom elemenata podataka kako bi se obezbedili efikasni data-stream layout-i (recimo reorganizacija podataka kod SA). U principu MMA-ovi nisu pogodni za realizaciju SIMD arhitekture u slučajevima kada hardver i cena koja se plaća za reorganizaciju podataka treba da je velika.

  • Male programske petlje: MMA-ovi troše 95% od svog vremena izvršenja na izvršenja ugneždenih petlji. Petlje se karakterišu većim brojem iteracija, obično 10 i više, a neke imaju na stotinu ili 1000 iteracija.

  • Zahtevi za velikom memorijskom propusnošću: Kod MMA-ove procesiraju se skupovi podataka velikog obima što u principu postavlja stroga ograničenja na rad memorijskog sistema.

  • Podaci malog obima: Kod MMA-ova koriste se integer-i malog obima, najčešće 16 bita ili manje.


Distribucija operacija kod MMA-ova

Preovladjuju Integer operacije


Odnos funkcionalnih resursa

Odnos Integer prema FP je 4:1


Obim korišćenih podataka kod MMA

Karakteristike podataka kod MMA-ova su važne iz sledeća dva razloga:

  • Paralelizam na nivou pod-reči koristi podatke manjeg obima kako bi se eksploatisao SIMD paralelizam (tipično je to za MMX instrukcije)

  • Media procesori imaju staze-podataka (data path) užeg obima u odnosu na GPP-ove jer manipulišu sa podacima manjeg obima. Najveći broj instrukcija operiše sa 8- ili 16-bitnim podacima. Izuzetak su grafičke aplikacije koje operišu sa single precision FP brojevima.

Najveći broj operanada manji od 16 bitova


Procesorske arhitekture koje podržavaju MMA

Nalaze se počev od:

  • fully custom do

  • fully programmable dedicated arhitektura

Veći broj programabilnih DSP-ova (PDSP) se koristi od 1980. godine.

Ove arhitekture podržavaju rad sa specifičnim instrukcijama kakve su MAC, REPEAT, SHIFTADD, i dr


Klasifikacione šeme - prva

Po prvoj od klasifikacionih šema koja se zasniva na različitim implementacionim metodama PDSP-ovi se mogu podeliti na:

  • PDSP čipovi – TMS320C55xx, TMS320C67x, ...

  • PDSP core-ovi – soft i hard jezgra

  • multimedia PDSP – audio i video aplikacije – Trimedia TM1000

  • native signal procesori (NSP) – proširuju skup instrukcija GPP-ova za multimedia procesiranje, Intel-MMX, Intel Streaming SIMD, ....


Klasifikacione šeme - druga

Po drugoj klasifikacionoj šemi koja se bazira na evoluciji procesnih arhitektura postojeće arhitekture za media porcesiranje se mogu

podeliti na:

  • programabilne procesore,

  • namenske implementacije,

  • rekonfigurabilne procesore.


Klasifikacione šeme - treća

Osobine kakve su paralelizam, fleksibilnost i intenzivno procesiranje memorijskih podataka omogućavaju nam da klasifikujemo media procesore na osnovu arhitektura koje koriste:

  • paralelizam,

  • iterativnu prirodu operacija,

  • tehnike za redukciju off-chip memorijskih transakcija.


Klasifikacione šeme - četvrta

Interesantna klasifikacija je ona koja deli PDSP-ova na:

  • namenske,

  • programabilne.


Klasifikacione šeme - peta

Kod pete klasifikacione šeme PDSP delimo na osnovu tipa procesiranja u sledeće tri kategorije:

  • vektorski procesori,

  • superskalarni procesori,

  • multimedia procesori.


Klasifikacione šeme - šesta

Kod šeste klasifikacione šeme procesorske arhitekture koje podržavaju MMA se mogu podeliti na:

  • namenske arhitekture – od fully custom do programmable dedicated arhitekture,

  • GPP sa multimedia ekstenzijom.


Namenski muldimedia procesori

DMP-ovi (Dedicated Multimedia Processors) su predviđeni da obavljaju specifične multimedia funkcije kakve su video i audio kompresija, dekompresija, 2D i 3D grafičke aplikacije, i td. DMP-ovi koriste različite arhitekturne šeme koje mogu biti zasnovane na većem broju funkcionalnih jedinica počev od single RISC core procesora pa sve do multi-procesora. U skorije vreme DMP-ovi koriste SIMD i VLIW arhitekture. Namenske aplikacije obično predstavljaju dobro izborno rešenje koje se zasniva na:

  • korišćenju mogućnosti koje pruža dostupna VLSI IC tehnologija,

  • ostvarivanju zahtevane računarske propusnosti, tj. moći izračunavanja,

  • optimalnoj realizaciji ciljnog algoritma.

    Dizajn rešenja DMP-ova se protežu od:

  • fully custom – arhitektura sa minimalnom programabilnošću, poznate kao function oriented arhitekture

  • fully programmed arhitekture.


Function-oriented arhitekture

Funkcijsko-specifična implementacija se odnosi na direktno preslikavanje zadataka za multimedijalno procesiranje u hardversku implementaciju koja je optimizirana za izvršenje specifičnih funkcija.

Uparivanje individualnih hardverskih modula sa zahtevima za procesiranjem rezultira silicon area efikasnim implementacijama

Neke od karakteristika ovih DSP procesora su:

  • veći broj magistrala za podatke i instrukcije,

  • paralelno izvršenje MAC operacija,

  • ograničen broj instrukcija,

  • efikasno izvršenje petlji (efficient loop control),

  • low-cost alternative za specifične aplikacije,

  • DSP-ovi su optimizirani da obavljaju regularne, predvidljive, i računsko-intenzivne zadatke.


Prednosti i nedostaci funkcijsko orijentisanih arhitektura

Prednosti su sledeće:

  • hardverski ovrhead koji se odnosi na upraljačku jedinicu procesora je mali,

  • potrošnja energije je mala,

  • za određene aplikacije DSP-ovi ostvaruju visoke performanse.

    Nedostaci su sledeće:

  • pogodne su samo za izvršenje specifičnih funkcija,

  • kasnije ekstenzije nisu moguće bez redizajna hardvera,

  • fleksibilnost i prilagodljivost za nove aplikacije je veoma ograničena.



Programabilne arhitekture

Programabilne arhitekture za procesiranje MMA se dele na:

  • fleksibilne programabilne arhitekture – karakteriše ih prosečna do jako izražena fleksibilnost,

  • adapted (prilagođene za datu aplikaciju) – visoka efikasnost alii slabije izražena fleksibilnost.


Programabilne arhitekture eksploatacija mogućnosti

  • Data Level Parallelism – DLP

  • Instruction Level Parallelism – ILP

  • Thread Level Parallelism – TLP, ili primena specijalnih karakteristika algoritama putem implementacije specijalizovanih instrukcija i namenskih hardverskih modula. Pomenute primene, za ograničenu aplikacionu oblast, rezultiraju većoj efikasnosti.

    Programabilne arhitekture imaju veći broj prednosti kakve su:

    fleksibilnost, visoke performanse, potpuna podrška multimedijalnom okruženju, i niska cena.

    Programabilnim arhitekturama se mogu implementirati različiti zadaci koji se realizuju softverski.

    Glavnu prednost programabilnih arhitektura predstavlja povećana funkcionalnost. Ipak, hardver za upravljanje izvršenjam programa, zbog postojanja paralelizma, i manipulacije sa keš memorijom je dosta složen, a takođe i vreme razvoja softvera kao i njegova verifikacija su vremenski duge aktivnosti.


Operacija množenja kod FxP aritmetike

Operacija množenja kod FxP aritmetike

Operacija množenja kod FxP aritmetike

Tipičan primer – Multimedi Video Processor - MVP


Adapted (prilagođene) programabilne arhitekture – APA

  • APA obezbeđuje izrazitu efikasnost prilagođavajući arhitekturu specifičnim zahtevima koji se odnose na aplikacije kod video kodiranja.

  • Ove arhitekture poseduju namenske module za izvršenje zadataka tipa video kodiranje/dekodiranje (codec) kakvi su DCT modul ili VLC modul.

  • Tipično rešenje iz ove grupe je video RISC procesor (VRP) proizvod firme C-cube Microsystem.

  • Savremeni namenski multimedia procesori, u cilju eksploatacije paralelizma, koriste SIMD i VLIW arhitekturne šeme kao i njihove različite varijante izvođenja (2D i 1D unidirekciona i bidirekciona SA, 2, 4, 6, ili 8 procesorski VLIW).



VLIW

  • VLIW procesori imaju veći broj nezavisnih funkcijskih jedinica, FU-e, koje istovremeno paralelno izvršavaju po nekoliko operacija.

  • Operacije kod VLIW mašina se grupišu u veoma duge instrukcione reči koje se nazivaju svežanj (bundle).

  • Zadatak kompajlera je da pronađe nezavisne instrukcije koje se mogu grupisati u jedan svežanj.

  • Visoke performanse kod VLIW-a se mogu postići zahvaljujući korišćenju ILP-a i DLP-a. Jedna tipična VLIW arhitektura je prikazana na slici 5



Prednosti i nedostaci VLIW arhitekture

  • Operation scheduling se izvodi od strane kompajlera, što znači da brzina izvršenja programa i ostvareni paralelizam u radu, u osnovi, zavise od mogućnosti kompajlera.

  • Sve operacije koje se specificiraju u okviru VLIW svežnja su nezavisne, što znači da je VLIW funkcionalni hardver veoma obiman i skup. Tako na primer, kod pakovane SIMD arhitekture koristi se isti ALU hardver da bi izvršio veći broj operacija nad pod-rečima svežnja, dok se kod VLIW-a zahteva ugradnja većeg broja FU-ova, da bi se postigao isti nivo paralelizma (SIMD koncept koristi protočnost, a VLIW paralelizam u radu).

  • Povezljivost (konektiranje) VLIW registara je mnogo složenije u odnosu na SIMD rešenje. Pakovana SIMD arhitektura koristi jedinstveni RF (register file) port za čitanje ili upis većeg broja vrednosti, dok se kod VLIW zahteva ugradnja većeg broja RF portova. Tako na primer, kod VLIW arhitekture, koja ima ugrađeno N dvo-ulaznih/jedno-izlaznih FU-ova, po jednom instrukcionom ciklusu ostvaruju se 2N operacija tipa Read i N operacija tipa Write. Ako je RF jedinstveni to znači da treba da postoje 2N portova za Read i N portova za Write operaciju (vrlo složen dizajn).

  • Prenosivost kôda za VLIW mašinu koja ima p FU-ova na VLIW mašinu koja ima q FU-ova nije moguća, tj. izvorni kôd treba ponovo rekompajlirati što je i veliki nedostatak VLIW pristupa.



Procesori opšte namene – GPP

  • GPP-ovi obično koriste MicroSIMD pristup koji se karakteriše time da su putevi (magistrale) za prenos podataka tipa integer i FP vrednosti isti.

  • Cilj projektovanja SIMD media ISA proširenja kod GPP-ova je usmeren ka tome da se sa postojećim hardverom iskoristi subword level parallelism (SLP), bez da se pri tome naruši opšta namena procesora.

  • SLP-om se ostvaruje small-scale SIMD paralelizam po zaista niskoj ceni kod word-oriented procesora koji su pre svega namenjeni da operišu sa 32/64-bitnim operandima (32-/64-bitna reč podatka se razlaže na 4/8 8-bitnih operanada).

  • Tako na primer, word-wide integer FU se može particionisati na paralelne sub-word jedinice, uz relativno male hardverske ovrhead-e.



Subword i ALU koja se može particionisati paralelizam

  • Subword paralelizam predstavlja oblik vektorskog procesiranja. GPP-ov registar se vidi kao mali vektor čiji su elementi manjeg obima od obima tog registra.

  • Drugim rečima podaci manjeg obima se smeštaju (čuvaju) u registre većeg obima.

  • Pri ovome, multimedia kerneli procesiraju tipove podataka manjeg obima, manipulišući pri tome sadržajem ovih podataka.

  • Ilustracije radi, double precision (64-bitni) FP registar može da čuva 8/4 8-/16-bitnih elemenata vektora. U datom trenutku ista operacija se može primeniti nad svim elementima vektora.

  • SLP predstavlja jeftino ali i efikasno rešenje za eksploataciju DLP-a kod MMA-ova


Prvobitne implementacije GPP-a i ALU koja se može particionisati

  • Prvobitna implementacija GPP-ova sa multimedia ekstenzijama su Intel-ov MMX, Sun-ov Visual Instruction Set (VIS), MIPS-ov Digital Media eXtension (MDMX), i dr.

  • Pomenute ekstenzije su uvedene početkom 90-ih godina prošlog veka.

  • U trenutku uvodjenja podržavale su samo rad sa integer tipovima podataka.

  • Sredinom 90-ih godina Intel je uveo streaming SIMD extension (SSE) i SSE2, a Motorola AltiVec koje su u stanju da manipulišu kako sa integer tako i FP brojevima.


Sumarni pregled nekih GPP-ova i ALU koja se može particionisati


Najvažnije osobine GPP-ova i ALU koja se može particionisati

  • procesori iniciraju izvršenje i izvršavaju dve ili veći broj instrukcija po instrukcionom ciklusu,

  • iniciranje instrukcija je van-redosledno (out-of-order), a da bi se isto obavljalo potrebno je ugraditi značajan iznos hardvera,

  • hardverske komponente zauzimaju veliku površinu na čipu što značajno dovodi do povećanja potrošnje energije,

  • procesori koriste tehniku dinamičke predikcije grananja,

  • keš mehanizam je projektovan da eksploatiše 1D lokalnost kod pristupa uzastopnim adresama, a kod media aplikacija uglavnom se zahteva multi-dimenziona lokalnost kod pristupa memorijskim lokacijama,

  • dužina reči ovih procesora je 32 ili 64 bita. Naglasimo da dužina reči kod multimedijalnih aplikacija je obično 8- ili 16-bita.

  • GPP sa multimedia ekstenzijama obično implementiraju 15 miliona pa i više tranzistora na čipu,

  • SIMD efikasnost ovih procesora obično nije velika,

  • multimedia proširenja obezbeđuju značajna performansna poboljšanja zahvaljujući korišćenju DLP-a koji je prisutan kod multimedia programa.


Ograničenja kod GPP-ova i ALU koja se može particionisati

  • problemi zbog memorijskog neporavnjanja (memory misalignemet) – sama priroda subword data uzrokuje probleme zbog memorijskog neporavnanja. Pristup podacima koji nisu poravnjani dovodi do izvršenja većeg broja instrukcija.

  • ograničenja koja se tiču paralelizma – fiksni obim multimedia registara ograničava iznos paralelizma koji se može postići jedinstvenom instrukcijom na najviše 8 (VIS, MMX) ili 16 (SSE, AltiVec) paralelnih operacija, dok je kod MMA prisutan znatno veći nivo paralelizma.

  • overhead instrukcija – implementacija multimedia kernela sa short-vector SIMD ekstenzijama dovodi do značajnog povećanja ovrhead-a (suvišnosti u kôdu i procesiranju) koji se javlja zbog konverzije između različitih tipova pakovanih podataka kao i izvođenja memorijskog poravnanja kod pristupa podacima. Nabrojane aktivnosti, u suštini, dovode do povećanja broja instrukcija u kôdu, tj. sporije brzine izvršenja. Overhead u povećanju broja instrukcija može biti i veći od 30%.

  • ne-krupni memorijski pristupi – najveći broj GPP-ova mogu da obave samo po jedan krupan memorijski pristup. U suštini, pristupi tipa koloni matrice su veoma neefikasni (elementi matrice su obično smešteni po vrstama, a pristup, u ovom slučaju, se zahteva po kolonama, što podrazumeva izvodjenje brojnih adresnih transformacija).

  • skalabilnost – skaliranje performansi se može jedino ostvariti dupliranjem obima reči što se postiže dupliranjem obima puteva (magistrala) za prenos podataka.

  • često puta ne postoji adekvatna podrška od strane kompajlera.


Uporedni pregled različitih rešenja i ALU koja se može particionisati


Efikasnost MicroSIMD arhitektura i ALU koja se može particionisati

Efikasnost MicroSIMD arhitektura definisaćemo uporedjujući ih sa karakteristikama MIMD, SIMD, Superskalarnog i VLIW procesora

Broj potrebnih instrukcija po mašinskom ciklusu da bi se ostvario paralelizam stepena 4


Složenost RF polja i ALU koja se može particionisati

Memorijski kapacitet i potrebna površina za fiksni broj bitova po registru kod RF polja


Vektor procesori i ALU koja se može particionisati

Vektorski procesor je procesor koji obrađuje ceo vektor pomoću jedne instrukcije.

Vektorske arhitekture su dobri kandiati za multimedia procesiranje jer one na efikasan način eksploatišu DLP.

Postoje sledeća dva pristupa za impelmentaciju vektorskog procesora:

  • Kod prvog pristupa repliciraju se FU-ovi, a paralelizam se ostvaruje na taj način što se svi elementi vektora istovremeno procesiraju. Cena koja se plaća za ovakav rad prvenstveno je diktirana složenom sprežnom mrežom i velikim brojem puteva (magistrala) od memorije do procesora. Ove arhitekture se nazivaju paralelni vektorski procesori.

  • Drugi pristup se zasniva na egzistenciji jedne ili nekoliko protočno organizovanih FU-ova koje elemente vektora procesiraju na protočni način. Ovi procesori se nazivaju protočni-vektorski procesori. Drugi pristup se češće koristi u odnosu na prvi.


Programabilni multimedia procesori – PMP i ALU koja se može particionisati

Media procesori, sa ciljem da ostvare visoke performanse, standardno implementiraju nekoliko pristupa kavi su:

1) subword paralelizam;

2) ILP;

3) specijalizovane instrukcije; i

4) koprocesori (DCT, VLC, procena pokreta).

Druga tri pristupa, od prethodno četiri pomenuta, su usmereni ka tome da se poboljšaju performanse multimedijalnih sistema a baziraju se na:

a) povećanju frekvencije rada media procesora;

b) poboljšanju ILP-a korišćenjem efikasnijih algoritama; i

c) multicore i many-core pristupu.


Gain ILP-a i ALU koja se može particionisati

Da bi se ostvario performansni dobitak (gain) ILP obično zahteva veći broj resursa.

Sa druge strane, povećanje frekvencije rada i implementacija hardvera za dinamički scheduling dovodi do toga da se poveća potrošnja energije, poveća površina čipa kao i složenost procesora (složenost se ne odnosi samo na kompleksnost hardvera i softvera nego i produženje vremena potrebnog da se projektuje jedan složeni media procesor).

Povećanje frekvencije rada procesora uslovljava da:

a) se obrada realizuje korišćenjem dublje (deeper) protočnosti;

b) se javlja duža latentnost kod izvršenja instrukcija; i

c) dolazi do povećanja memorijske latencije.


Nedostaci postojećih pristupa za multimedia procesiranje i ALU koja se može particionisati

Funkcijsko-orijentisani pristupi (ASIC i ASIP) nude prednosti veće brzine i manje potrošnje energije, ali faze projektovanja i debugging ovih sistema traje dosta dugo. Pored toga, ova rešenja su pogodna samo za specifične funkcije, pri čemu buduće ekstenzije dizajna nisu moguće bez redizajniranja hardvera. Drugim rečima, ASIC rešenjima nedostaje fleksibilnost da se prilagode algoritamskim modifikacijama.

Programabilne arhitekture nude fleksibilnost u implementaciji, ali je disipacija snage kod ovih kola mnogo veća, često suviše velika i neprihvatljiva za mobilne aplikacije.

Samo nekoliko programabilnih procesora specijalne-namene se može programirati na nekom višem programskom jeziku, dok se kod najvećeg broja i dalje nudi programiranje na nivou firmware-a.


Nedostaci postojećih pristupa za multimedia procesiranje i ALU koja se može particionisati

Kod najvećeg broja arhitektura za MMA procesiranje ne nude se mogućnosti za eksploataciju TLP-a koji su esencijalni za efikasnu i fleksibilnu podrški rada procesora na višim nivoima aplikacije kakav je recimo slučaj kod MPEG-4.

Adapted programabilne arhitekture koriste nekoliko namenskih modula za izvršenje multimedijalnih zadataka, ali ova rešenja nisu pogodna da ispune zahteve koji se tiču multi-standardnih i multi-formatnih media aplikacija.

GPP-ovi koji imaju ugrađene multimedijalne ekstenzije su pogodni za GPA, ali to postižu po ceni uvođenja overhead instrukcija (SSE, MMX) pa zbog toga ne mogu u potpunosti efikasno da podrže DLP kod MMA.


Izazovi u projektovanju PMP-a i ALU koja se može particionisati

a) skalabilnost

b) fleksibilnost

c) korišćenje resursa

d) mogućnosti dinamičke adaptibilnosti, i

e) implementacije u realnom vremenu.


Prednosti u odnosu na diskretna i ALU koja se može particionisatifixed function multimedia rešenja

Cena programabilnih media procesora je niža iz razloga što se korišćenjem jedinstvenog programabilnog kola mogu zameniti veći broj diskretnih fixed function kola.

Programabilni media procesori sa aspekta proizvodnje i primene imaju veću fleksibilnost. Naime, jedinstvena hardverska platforma se može koristiti za različite potrebe tržišta, a to se obično izvodi promenom softvera.

Media procesori mogu naslediti (iskoristiti) veći broj karakteristika (osobina) koje su specifične za DSP arhitekture, kao što su DSP-ovi (brojni) putevi (magistrale) za prenos podataka. Tako na primer, media procesori standardno koriste direktne veze između FU-ova koje su tipične za MAC arhitekture kod DSP-ova.

Koriste se velika RF polja koja su namenjena za memorisanje međurezultata kod MMA-ova tipa video kompresija/dekompresija.


Dileme i izazovi i ALU koja se može particionisati

Istraživanje na polju činjenja kompromisa (trade-offs) između procesne moći, memorijske propusnosti, ulazno/izlazne propusnosti, sa jedne strane, i ograničene površine čipa, male potrošnje, i niske cene MMA, sa druge strane.

Sprovesti detaljnu analizu koja se odnosi na kompleksnost izračunavanja, korišćenja različitih tehnika, formata i standarda koji se tiču multimedia procesiranja.

Evaluacija (procena) ograničenja koja se odnose na rad u realnom vremenu, koja je potrebna za podršku rada narednim generacijama MMA-ova.

Sagledavanja i izbor različitih tipova paralelizma kakvi su DLP, ILP i TLP.

Razumevanje inter-procesorskih komunikacionih rešenja kod SoC dizajna.

Izbor najbolje memorijske organizacije koja se bazira na temporal i spatial ponašanju MMA-ova.  


Dileme i izazovi – prod. i ALU koja se može particionisati

Veći kapacitet on-chip memorije koja podržava streaming data.

Ugradnja većeg broja FU-ova polazeći od zahteva za MMA.

Obezbeđenje veće fleksibilnosti koristeći HLL programabilnost radi simultanog brzog izvršenja nekoliko multimedia funkcija.

Ispitivanja koja se odnose na izbor načina prezentacije podataka, tipova podataka, puteva za prenos podataka i njihovog obima, i načina hijerarhijske orgtanizacije memorije za podršku MMA-ova.

Izbor najbolje arhitekture za podršku budućih MMA-ova (MIMD, SIMD, MicroSIMD, superskalarne, i VLIW arhitekture)


Potrebe za rekonfigurabilnim media procesiranjem i ALU koja se može particionisati

Opšte pravilo kod projektovanja sistema/kola je sledeće:

Projektant koji želi da implementira neku aplikaciju mora da se odluči između performansi i generalnosti (opštosti rešenja).

U skorije vreme, kao opcija, na tržištu su se pojavila VLSI CMOS IC nazvana Field Programmable Gate Array (FPGA) sa statičkim RAM programskim mogućnostima. Ova kola omogućavaju veću prilagodljivost (customization) različitim MMA-ovima, kao i daleko bolje prilagođenje za izvršenje specifičnih funkcija u toku rada kola, tj. izvršenje aplikacija.

Rekonfigurabilna kola su relativno jeftina rešenja, imaju malu potrošnju, malu površinu čipa, i veliku fleksibilnost.

Kod rekonfigurabilnog sistema, hardver je fleksibilan. Glavna prednost rekonfigurabilnih arhitektura sastoji se u kombinaciji hardverske i softverske fleksibilnosti u cilju postizanja visokih performansi.


ad