1 / 33

Segundo HAREM

Segundo HAREM. Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota. Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008. Desafios.

cachez
Download Presentation

Segundo HAREM

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Segundo HAREM Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008

  2. Desafios • HAREM clássico (seguindo genericamente o modelo de classificação proposto no Primeiro HAREM, mas refinando algumas distinções, quer ao nível da segmentação das EM quer da sua classificação) • Pista para identificação e normalização de expressões temporais (Hagège et al., 2008) • Pista ReRelEM, para a identificação de relações semânticas entre EM

  3. Calendário do HAREM (2007) Versão preliminar das directivas do Segundo HAREM Primeira chamada para o Segundo HAREM Data-limite para registo no HAREM Data-limite para discussão sobre os moldes do Segundo HAREM

  4. Calendário do HAREM (2008) Directivasfinais e material de treino Colecção HAREM Primeira versão da Colecção Dourada • Primeira versão da mini-CD do TEMPO e a versão final CD • Primeira versão da mini-CD do ReRelEM • Versão final da mini-CD do TEMPO • Resultados preliminares do HAREM clássico • Resultados preliminares da pista do TEMPO • Resultados da pista ReRelEM • Relatórios de desempenho Versão final da mini-CD do ReRelEM Encontro do Segundo HAREM

  5. Caracterização do HAREM • EM em contexto Regressou então a <EM ID="hub-67792-106" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Portugal</EM>, onde iniciou meteórica carreira na experimentação de novas formas de expressão O acordo político quanto à revisão foi obtido durante a <EM ID="aa46996-48" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Presidência Alemã</EM> , tendo cabido a <EM ID="aa46996-54" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Portugal</EM> concluir o processo de revisão. Este debate passou completamente ao lado de <EM ID="H2-dftre765-8" CATEG="PESSOA" TIPO="POVO">Portugal</EM> «o problema do <EM ID="hub-24360-322“ CATEG="ORGANIZACAO|ABSTRACCAO" TIPO="INSTITUICAO|DISCIPLINA">PSD</EM> é começar a ter só um <EM ID="hub-24360-323" CATEG="ABSTRACCAO" TIPO="IDEIA">Portugal</EM> ou dois dentro de si» <EM ID=“Ex-1GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO">Portugal</EM> perdeu com a <EM ID=“Ex-2GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO“>Suíça</EM> por <EM ID=“Ex-3GM" CATEG=“VALOR" TIPO=“CLASSIFICACAO">2-0</EM>

  6. Caracterização do HAREM • EM vagas Pela mão do <EM ID="aa66435-107" CATEG="PESSOA" TIPO="INDIVIDUAL">ministro Freitas do Amaral</EM>, e sem necessidade alguma, <EM ID="aa66435-108" CATEG="ORGANIZACAO|PESSOA" TIPO="ADMINISTRACAO|POVO">Portugal</EM> foi enxovalhado, coberto de vergonha e de cobardia, por um dos mais tristes textos políticos que já alguém escreveu. <EM ID="hub-28874-31" CATEG="VALOR" TIPO="QUANTIDADE">Mais de 32 mil</EM> pessoas poderiam morrer se uma pandemia de gripe humana de origem aviária atingisse <EM ID="hub-28874-32" CATEG="PESSOA|LOCAL" TIPO="POVO|HUMANO" SUBTIPO="|PAIS">Portugal</EM> os dois reinos católicos, <EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT><EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos do <EM ID="aa66435-54" CATEG="LOCAL|LOCAL" TIPO="FISICO|HUMANO" SUBTIPO="REGIAO|DIVISAO">Novo Mundo</EM>

  7. Caracterização do HAREM • Análises alternativas (ALT) • Ambiguidadeestrutural: • aproximava a <ALT><EM ID="H2-dftre765-106" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja de Inglaterra</EM> | <EM ID="H2-dftre765-106-aa" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja</EM> de <EM ID="H2-dftre765-16" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Inglaterra</EM></ALT>do calvinismo. • Possibilidade de uma expressão poder ser reconhecida como EM, ou não: • <EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO“ TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT><EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios</ALT>marítimos;

  8. Novidades no Segundo HAREM • Uso extensivo de ALT para representação sistemática da estrutura interna das EM constituídas por outras EM <ALT> <EM ID="aa55968-473" CATEG="PESSOA" TIPO="CARGO">presidente da Câmara de Nova Iorque</EM> | presidente da <EM ID="aa55968-7" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara de Nova Iorque</EM> | presidente da <EM ID="aa55968-475aa" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara</EM> de<EM ID="aa55968-475" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="DIVISAO">Nova Iorque</EM> </ALT>

  9. Novidades no Segundo HAREM • ALT sistematicamente aplicados

  10. Novidades no Segundo HAREM • Não reconhecimento de certas palavras em maiúsculas como EM • Quando ocorrem no âmbito de uma unidade lexical composta que não constitui, ela própria, uma EM • pastéis deBelém; amêijoas à Bulhão Pato • Se os restantes constituintes (grafados em minúscula) dessa unidade lexical integrarem a lista das minúsculas permitidas no âmbito desta avaliação, toda a unidade lexical deverá ser reconhecida como EM • <EM ID="ric-19806-172" CATEG="ABSTRACCAO“ TIPO="ESTADO">doença de Chagas</EM>

  11. X ESCOLA, OBRA, PLANO X SUB X PERIODO, CICLICO X VARIADO

  12. Colecção HAREM DOCS: 1040 Parágrafos: 15737 Palavras: 670610 Distribuição dos documentos por género na CD

  13. CD em números (1) DOCS: 129 Parágrafos: 2274 Palavras: 147991 Entidades: 7836 Entidades vagas: 633 [52 classes] Distribuição de categorias

  14. CD em números (2) Classes de vagueza(21 mais frequentes) Categorias associadas às entidades

  15. Processo de anotação da CD • Anotação da CD, usando o Etiquet(h)arem

  16. Processo de anotação da CD • Comparação automática das anotações, usando o Alinhador • Análise e discussão das diferenças encontradas • Validação da sintaxe, usando o validador desenvolvido para o efeito • Revisão manual da CD • Revisão sequencial dos documentos • Revisão por categoria • Revisão das análises alternativas (ALT)

  17. Avaliação do HAREM clássico • Melhorias em relação ao Primeiro HAREM • Contabilização de entidades parcialmente identificadas como incorrectas • Possibilidade de avaliação estrita dos ALT • Casos conceptualmente distintos, representados de forma diferente: ignorância, certeza de ser diferente, erro • Sistematização no tratamento das EM

  18. Avaliação da classificação semântica N = número de diferentes classificações na CD de acordo com o cenárioM = número de classificações espúrias enviadas pelo sistemaα, β, γ = pesos das categorias (1), tipos (0.5) e subtipos (0.25) (c, t, st)_certo = 1, se estiver certo; caso contrário, (c, t, st)_certo = 0 (c, t, st)_espuria= 1, se for espuria; caso contrário, (c, t, st)_espuria= 0

  19. Programas de avaliação do HAREM clássico: entradas CDHAREM.xml participacao.xml • <?xml version="1.0" encoding="ISO-8859-1" ?> • <colHAREM versao="SegundoHarem"> • … • <DOC DOCID="Xyz"> • O <ALT> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> | <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> | <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> de <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> </ALT> vai começar no <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM>. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão. • </DOC> • … • </colHAREM> • <?xml version="1.0" encoding="ISO-8859-1" ?> • <colHAREM versao="CD"> • … • <DOC DOCID="Xyz"> • O Tour de <EM ID="Xyz_1" CATEG="LOCAL" TIPO=“FISICO“ SUBTIPO=“REGIAO">França</EM> <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> vai começar no <EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de Fórmula 1. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão. • </DOC> • </colHAREM>

  20. Programas de avaliação do HAREM clássico: Alinhador CDHAREM.xml participacao.xml Alinhador EMs na CD DOC Xyz <ALT> <ALT1> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT1> <ALT2> <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>] <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT2> <ALT3> <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null] <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>] <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>] <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>] <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null] <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>] EMs na participação

  21. Programas de avaliação do HAREM clássico: Avaliador de alinhamentos CDHAREM.xml participacao.xml Alinhamentos classificados como: Correctos, Espurios, Em Falta ou Parcialmente Correctos Avaliador de alinhamentos Alinhador DOC Xyz <ALT> <ALT1> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Parcialmente_Correcto_por_Defeito(0.1; 0.9), Parcialmente_Correcto_por_Defeito(0.2; 0.8)] </ALT1> <ALT2> <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Parcialmente_Correcto_por_Defeito(0.16666666666666666; 0.8333333333333334)] <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto] </ALT2> <ALT3> <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]::[Em_Falta] <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto] <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]::[Correcto] <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]::[Em_Falta] <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]::[Correcto] EMs parcialmente correctas são removidas na próxima fase EM em falta

  22. Tipos de cenário • Cenário total: elenco completo de categorias, tipos e subtipos propostos para o Segundo HAREM. • Cenário selectivo de avaliação: sub-conjunto de categorias, tipos e subtipos do cenário total que é alvo de avaliação. • Cenário selectivo de participação: sub-conjunto de categorias, tipos e subtipos do cenário total que cada participante se propôs a utilizar.

  23. Programas de avaliação do HAREM clássico: Véus HAREM CDHAREM.xml participacao.xml Alinhamentos filtrados de acordo com o cenário pretendido Véus (HAREM) Avaliador de alinhamentos Alinhador #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM CATEG="ESPURIO">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Espurio] </ALT1> <ALT2> </ALT2> <ALT3> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto] </ALT3> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] Dentro desta alternativa, a EM é espúria Remoção de alinhamentos parcialmente correctos

  24. Programas de avaliação do HAREM clássico: Organizador de ALTs CDHAREM.xml participacao.xml Véus (HAREM) Avaliador de alinhamentos Organizador de ALTs Alinhador #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]^1 </ALT1> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto] A EM espúria desapareceu porque alinhava correctamente com a alternativa seguinte Peso • Remoção de alternativas vazias/duplicadas, surgidas depois da aplicação de véus • Remoção de EMs alinhadas mais do que uma vez dentro do mesmo ALT- Atribuição do peso1/total de ALT a cada EM dentro de um ALT

  25. Programas de avaliação do HAREM clássico: Avaliador semântico CDHAREM.xml participacao.xml Avaliador semântico Véus (HAREM) Avaliador de alinhamentos Organizador de ALTs Alinhador Precisão Medida-F Abrangência #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <ALT> <ALT1> <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875) PALT(1.0)}] </ALT1> </ALT> <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}] • Avaliação dos atributos semânticos. Peso ALT Classificação máxima da EM na CD Classificação máxima da EM na participação Classificação efectiva

  26. Programas de avaliação do HAREM clássico: Selector de ALTs CDHAREM.xml participacao.xml Avaliador semântico Véus (HAREM) Avaliador de alinhamentos Organizador de ALTs Alinhador Selecção da melhor alternativa (melhor medida-F e melhor classificação) Selector de ALTs #LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA}) DOC Xyz <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875)}] <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}] Ficou a única alternativa que existia

  27. Participação no Segundo HAREM • Manifestações de interesse: 22 • Sistemas inscritos: 16 • Sistemas participantes: 10 • Saídas: 27 (máx. 4 por participante)

  28. Cenários selectivos de participação CAT – apenas CATEGORIA C/T – apenas CATEGORIA e TIPO F+H – apenas locais FISICOs e HUMANOs NORM – normalização das expressões temporais Identificação Classificação

  29. Resultados • Cenário total com avaliação estrita de ALTs

  30. Resultados • Cenário total com avaliação relaxada de ALTs

  31. Resultados Cenário próprio com avaliação relaxada de ALTs 33

  32. Avaliação por categorias (melhores sistemas) Precisão Abrangência Medida-F

  33. Agradecimentos • A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.

More Related