210 likes | 297 Views
Language Engineering for European Security EU-Forskningsprojekt 1998 - 2000. SENSUS Sprogteknologi i kampen mod international kriminalitet. Barbara Dragsted Inge Gorm Hansen Benjamin Kjeldsen Henrik Selsøe Sørensen Copenhagen Business School. Baggrund, fokus og mål. Baggrund
E N D
Language Engineeringfor European Security EU-Forskningsprojekt 1998 - 2000 SENSUS Sprogteknologi i kampen mod international kriminalitet Barbara Dragsted Inge Gorm Hansen Benjamin Kjeldsen Henrik Selsøe Sørensen Copenhagen Business School
Baggrund, fokus og mål • Baggrund • Tidligere politiprojekter i EU-regi(Inge Gorm Hansen, Henrik Selsøe Sørensen: LinguaNet) • Fokus • International organiseret kriminalitet, herunder menneskesmugling, narkotikahandel, hvidvaskning af penge, efterretninger generelt • Engelsk, tysk, fransk, spansk, italiensk, svensk, portugisisk • Overordnet mål • At nedbryde sproglige barrierer og forbedre kommunikationen i international kriminalitets- og terrorbekæmpelse
SENSUS-konsortiet • Amt für Auslandsfragen – Koordinator (DE) • Europol (EU) • Copenhagen Business School (DK) • ILSP (Institute for Language & Speech Processing) (GR) • Datamat – Ingeneria dei Sistemi S.P.A. (IT) • Incyta Ingeneria SL (ES) • Officeware Information Systems GmbH (DE) • Sail Labs GmbH (DE) • Zylab France S.A.R.L. (FR) • meVisto GmbH (DE)
SENSUS-brugergruppe EUROPOL (EU) Kriminalpolizeidirektion Nürnberg (DE) Bundesministerium für Inneres (AU) Rikspolisstyrelsen Stockholm (SE) Ministero dell'Interno (IT) Direction Générale de la Police Nationale (FR) Dirección General de la Policia (ES) Serviço de Estrangeiros e Fronteiros (PT) Grampian Police, Scotland (UK)DK manglede!
Perpetrator Police Courts Victim Other Other Activities Activities Activities Procedures Procedures Procedures Objects Objects Objects Docu-ments Docu-ments Docu-ments Evidence Evidence Evidence Knowledge model 6 Rules & Regulations 1 2 Person Authorities Event 3 Time/ Place 4 MO 5 Physical Objects
Burglar Police Courts Victim Other Other Activities Activities Activities Procedures Crime scene investigation Procedures Objects Objects Objects Docu-ments Police report Docu-ments Evidence Evidence Evidence Knowledge model 6 Rules & Regulations 1 2 Person Authorities Burglary 3 Time/ Place 4 MO 5 Crowbar
Interaktion med brugergruppen • Workshops og seminarer med politi og politioversættere • Bedre forståelse for terminologiske principper • Løsning af tekniske og metodiske problemer
Vidensbase Traditioneloversættelse DataanalyseMaskinoversættelse SENSUS-databaser Termerne i SENSUS-databasen anvendes til: Terminologiske artikler med detaljeret lingvistisk og encyklopædisk information på flere sprog, videreført inden for rammerne af Terminologiske artikler med oplysninger, der er specifikt beregnet på automatisk bearbejdning
9 TKE in Transnational Law EnforcementBarbara Dragsted, Inge Gorm Hansen, Henrik Selsøe Sørensen Modellering af begrebssystemer
10 TKE in Transnational Law EnforcementBarbara Dragsted, Inge Gorm Hansen, Henrik Selsøe Sørensen Flersproget termbearbejdning, eksempel på synonymbearbejdning på engelsk (American English AmE, British English BrE, EU English EE, General English GE, Plain Bad English PBE) • Dec 04 / Jul 05 / Nov 2007 • people smuggling (GE, BrE) 66,900 / 70,700 / 196,000 • human smuggling (GE) 48,000 / 60,500 / 227,000 • alien smuggling (AmE) 39,900 / 45,900 / 130,000 • smuggling of migrants (GE) 20,100 / 25,800 / 69,700 • migrant smuggling (AmE) 13,000 / 20,100 / 51,300 • smuggling of human beings (PBE) 1,120 / 907 / 10,100 • organised immigration crime (BrE) 1,040 / 756 / 9,110 • smuggling of aliens (PBE) 901 / 909 / 849 • aliens smuggling (PBE) 718 / 677 / 624 • organised illegal immigration (EE) 252 / 237 / 754 • facilitation of unauthorised entry and residence (EE) 167 / 290 / 290 • facilitated illegal immigration (EE) 108 / 120 / 325
CBS-resultater • Konkret output af terminologiarbejdet • MultiTerm-database med 13.000 artikler og 50.000 termer • 200 gennembearbejdede nøglebegreber på engelsk, fransk, tysk og spansk • Metodeudvikling og erfaringer • Procedure for terminologiudveksling • “Knowledge model” til politi- og efterretningsterminologi med universelt anvendelsespotentiale • Erfaringer med interaktion mellem oversættere, brugere og softwareudviklere
Demonstration af SENSUS Fremsøgning af potentielt interessante facts i store flersprogede tekstmængder
Perspektiver • Flersproget database med relevant terminologi på nettet • Nye emneområder og nye sprog • Flersprogede kommunikationsværktøjer • Nye fælles internationale regler, definitioner og straframmer? • Analyse og udveksling af efterretninger • Effektivisering af politi- og efterretningssamarbejde på tværs af sproggrænser