50 likes | 194 Views
Unicoden Common Locale Data Repository (CLDR). Kotus 28.9.2004 - EIK. Unicode <www.unicode.org>. Juuret vuodelta 1986 (japanin ja kiinan merkistöongelmien ratkaisemiseksi); virallistettu 1991, jolloin myös sovittiin yhteistyöstä ISO/IEC:n UCS-standardin (10646) kanssa.
E N D
Unicoden Common Locale Data Repository (CLDR) Kotus 28.9.2004 - EIK
Unicode <www.unicode.org> • Juuret vuodelta 1986 (japanin ja kiinan merkistöongelmien ratkaisemiseksi); virallistettu 1991, jolloin myös sovittiin yhteistyöstä ISO/IEC:n UCS-standardin (10646) kanssa. • Siinä, missä UCS-standardi keskittyy määrittelemään merkit (nimet ja koodipositiot), Unicode-standardi myös määrittelee niiden toteutuksiin vaikuttavia ominaisuuksia. • Jäseninä lähinnä merkittävät ICT-alan yritykset, Suomesta liitännäisjäsenenä Nokia, nykyisin yhteistyöjäsenenä myös Kotus (”RILF”). • Huhtikuussa 2004 Unicode-liittymän tehtäväalue laajeni myös muihin kieli- ja kulttuurisidonnaisin merkintätapoihin, joita varten perustettiin Common Locale Data Repository ja sille oma tekninen komitea.
Common Locale Data Repository<http://www.unicode.org/cldr/> • Rekisteriin määritellään mm. seuraavia paikallisasetuksia: • Kielten ja maiden yms. nimet, eräitä avainsanoja • Kirjoitussuunta, merkistö, erottimet, vastaukset • Aakkostus, myös esim. erityisesti puhelinluetteloa varten • Mittajärjestelmä, päivämäärät ja kellonajat • Numeeristen suureiden esitys, valuutat • Määritykset esitetään XML-muodossa, jotta niitä voidaan haluttaessa käyttää (myös selektiivisesti) suorituspohjana; meidän kannaltamme tärkeintä on kuitenkin rekisteröidyn tietosisällön käyttö teknisestä toteutuksesta riippumatta.
Common Locale Data RepositoryKotuksen rooli • Periaatteessa kuka tahansa voi toimittaa CLDR-tekniselle komitealle ns. Bug-raportteja, joiden perusteella tietoja päivitetään, mikäli niissä esitetty lähde hyväksytään. • Unicoden yhteistyöjäsenenä Kotusta kuitenkin pidetään sellaisena luotettavana tahona, joka voi tietolähteekseen nimetä tarvittaessa myös tämän kansallisen työryhmän (joten esimerkiksi rajoittuneet tai peräti vanhentuneet kansalliset standardit voidaan sivuuttaa ongelmitta). • Kotuksen tulee kuitenkin osallistua myös kehitystyöhön. • Uusi painos tietokannasta ilmestyy n. 6 kk:n välein, nyt seuraavan (V.1.2) päivitysaika päättyi 3. syyskuuta.
Eräitä muita mahdollisia työkohteitaMm. näiden toteutuminen riippuu paljolti mm. OPM:n päätöksistä • Kansallisten standardien päivitys: toimistostandardit, näppäimistökaavio, lajittelu kv. standardeihin nivoutuvaksi • Kansallisten merkkien käyttö internet-osoitteissa • Väestörekisterissä yms. sallitun merkistön laajennus • Osallistuminen UCS/Unicode-merkistötyöhön (erit. UPA) • Suomen kielen taivutusmuotojen runsaasta käytöstä hakukoneille aiheutuvien tarpeiden määrittely, myös tavutussääntöjen ja oikolukualgoritmien määrittely • Translitterointikäytäntöjen selvitys ja sovellusohjeet • Sähköisen kaupan ja asioinnin monet edellytykset