1 / 21

A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN

A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN. PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS. Stéphane Rodrigues Dias. O Modelo de Pesquisa. Abordagem por interfaces: Metateoria das Interfaces (COSTA, 2007) Linguagem: objeto complexo – Linguística/Ciências formais

Download Presentation

A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. A GRAMÁTICA NA INTERFACE LÍNGUÍSTICA-PLN PROGRAMA DE PÓS-GRADUAÇÃO EM LETRAS Stéphane Rodrigues Dias

  2. O Modelo de Pesquisa • Abordagem por interfaces: Metateoria das Interfaces (COSTA, 2007) • Linguagem: objeto complexo – Linguística/Ciências formais • Interfaces externas: Linguística/Ciência da Computação • Interfaces internas: Sintaxe /Processamento Automático de Línguas Naturais (PLN) e/ou Linguística Computacional (LC) • Objeto: conceito de gramática

  3. Objetivo geral • Tendo em vista a diversidade de conceitos, de terminologia e de representações subjacentes a diferentes teorias gramaticais de base linguística e computacional, este artigo objetiva explicitar os fundamentos epistemológicos de gramática subjacentes às propostas de Gramática Categorial (TAG) e de Dependências (Gramática de Valências) na relação com a formalização para PLN, observando: (i) diferenças e semelhanças em termos de interfaces internas (morfologia/sintaxe, sintaxe/semântica; (ii) a relação gramática/léxico (abordagem (bi)lexical, categorial) e (iii) a explicitude dessas escolhas na interface amigável teoria lingüística/ aplicação computacional, parte do compromisso teórico dos pesquisadores para uma interface clara e relevante para ambas as áreas).

  4. Interface Linguística/Ciência da Computação • Linguística computacional como sinônimo de PLN • LC como matriz e PLN como interface • LC como subárea da Inteligência Artificial (IA) – interface homem/máquina via linguagem natural • LC como subárea da Linguística Aplicada • LC como interseção entre Linguística e Ciências da Computação (DIAS-DA-SILVA, 2006) • Processamento computacional de língua natural, tanto no modo escrito quanto oral, “registrada em meio escrito” (DIAS-DA-SILVA, 2009) • Abordagem linguisticamente motivada: especificação explícita de propriedades e de regras ou padrões regulares de comportamento linguístico (idem). • “Processamento automático das línguas naturais” > “automatic natural languageprocessing”, Inteligência Artificial e das Ciências da Computação. “Natural languageprocessing” (PLN e o estudo do processamento da linguagem humana, no âmbito da Ciência Cognitiva (Garret, 1990).

  5. “Tomando por base o fato de os falantes processarem as estruturas lingüísticas instantaneamente e os resultados obtidos com a implementação computacional da “Teoria Padrão” (Chomsky, 1965), Gazdar (1982) mostra que as gramáticas gerativas, com seu grande número de dispositivos formais, são completamente inadequadas para servir de modelo de processamento das estruturas lingüísticas pelos falantes. A partir dessa análise, constrói um novo modelo de gramática, sem as clássicas “transformações” e o denomina Gramática Sintagmática Generalizada, origem da gramática Head-drivenPhraseStructure Grammar, mais conhecida pela sigla HPSG (Pollard & Sag, 1994). Esses dois exemplos evidenciam que a argumentação de base computacional pode trazer novos recursos para se repensar as teorias lingüísticas “ (DIAS-DA-SILVA, 2009).

  6. Formalismo na interface “A representação de uma ontologia pode variar segundo o grau de formalização. Uma ontologia formal, em especial, apresenta os conceitos e as relações (entre conceitos) explicitamente definidas, ou seja, “legíveis pela máquina” (GRUBER, 1995). Gramáticas: “sistemas formais que , (i) descrevem as estruturas das sentenças de uma dada língua, e (ii) permitem, juntamente com o léxico, reconhecer e gerar sentenças dessa língua” (KAPLAN, 2004). Numa abordagem segundo a concepção linguisticamente motivada, “ o computador não poderá emular uma língua natural se não conseguir , em alguma medida, compreender o assunto que está em discussão” (DIAS-DA-SILVA, 2009, 188p.)

  7. Três fases para o desenvolvimento de sistemas especialistas e para uma metodologia para PLN (DIAS-DA-SILVA, 1999): Linguística: construção do corpo de conhecimentos sobre a própria linguagem, dissecando e compreendendo os fenômenos linguísticos necessários para o desenvolvimento do sistema. Linguístico-computacional: construção conceitual do sistema, envolvendo a seleção e/ou proposição de sistemas formais de representação para os resultados propostos pela fase anterior. Implementacional (computacional): codificação das representações elaboradas em termos de linguagens de programação e planejamento global do sistema.

  8. Pires de Oliveira (2009), esclarece sobre o metatermoformal: O linguista deve construir teorias capazes de formalização metalinguística unívoca. O linguista pode ser formal no sentido de defender a autonomia da sintaxe (gerativismo (autonomia pura), funcionalismo compatível (sintaxe, semântica – decorrência de funções). Funcionalismo: raciocínio indutivo, parte dos dados, das manifestações efetivas produzidas por falantes reais, e elabora generalizações que os explicam. Gerativismo: raciocínio abdutivo, as regras são elaboradas a partir da intuição do falante sobre um caso particular e devem ser confrontadas com outros casos. Porém, não somente testa uma hipótese, mas reconhece aquilo que não é possível (dado negativo). Como os gerativistas, os gramáticos categoriais abordam a língua natural como um cálculo.

  9. Gramática: Linguística • Assim, têm-se o manual de gramática e o dicionário como os inventários descritivos de gramática e léxico, sendo que "o que é geral e regular na língua integra a gramática, e o que é particular e irregular integra o léxico" (p. 71). Entretanto, visto que o léxico tanto faz parte da gramática quanto da semântica e os vocábulos funcionam tanto na zona gramatical quanto não-gramatical, essa divisão muitas vezes acaba tornando-se irreal (PEREIRA DE ANDRADE)

  10. A análise gramatical grega baseava-se na palavra. Platão fez a classificação de nome e verbo. Aristóteles acrescentou as conjunções à classificação de Platão. Os estóicos acrescentaram o artigo. Dionísio da Trácia descreve oito partes do discurso: substantivo, verbo, particípio, artigo, pronome, preposição, advérbio e conjunção. A sintaxe estava ausente e sua gramática tinha um fim pedagógico. Já Apolônio Díscolo (séc. II a.C.) chegou a fazer um estudo sintático. Na Idade Média, sob influência aristotélica, passa-se a estudar a língua cientificamente, portanto, de forma universal. Suas gramáticas, chamadas especulativas, viam a língua como um meio de analisar a realidade. Assim, privilegiavam o estudo da significação. Após os estudos comparativistas, surge no século XX o estruturalismo: adoção dos princípios behaviorista e empirista, explicação dos atos lingüísticos como resposta a um estímulo e do processo de aquisição da língua como um processo de imitação e memorização, análise lingüística em constituintes imediatos, caráter taxionômico.

  11. Chomsky se interessa pelas características universais, as quais são um componente da mente humana. Ele acrescenta a noção de transformação gramatical à análise de estrutura em constituinte. O objeto de estudo da lingüística gerativa é duplo, envolve tanto a faculdade de linguagem, quanto a gramática específica das línguas. (PEREIRA DE ANDRADE)

  12. GRAMÁTICA: INTERFACE Gramática de Valência (Lucien Tesnière) - química Construído em torno do conceito de valência, este modelo perspectiva uma estruturação hierarquizada dos elementos que compõem uma frase, sendo que o núcleo, o elemento central, é o verbo, à volta do qual "gravitam" os seus satélites. Uma frase é pois uma unidade autônoma e independente que possui um verbo. O verbo funciona como um elemento regente e hierarquicamente superior, do qual dependem outras palavras, ou satélites, que são regidas por esse verbo. Neste momento surge o conceito de valência, que é a "capacidade de as palavras estabelecerem, com base no seu significado léxico, determinadas relações com outras palavras" (Vilela, 1999: 34).

  13. Quando os elementos estabelecem relações fortes com o seu núcleo designam-se por actantes, ou dependentes da valência. Não criam dependências com o núcleo: circunstantes, ou complementos livres. Complementos que dependem do verbo, que preenchem os lugares vazios previstos pela estrutura semântico-sintáctica do verbo constituem os seus actantes, que podem ser obrigatórios ou facultativos. Os actantes obrigatórios não podem ser suprimidos, ao passo que os actantes facultativos podem ser elididos sem risco de agramaticalidade (noção sintática). Dependencygrammar is a differenttypeof approach in whichstructure is determinedbytherelations (such as grammaticalrelations) between a word (a head) and its dependents, ratherthanbeingbased in constituentstructure. For example, syntacticstructure is described in termsofwhether a particular noun is thesubjectoragentoftheverb, ratherthandescribingtherelations in termsoftrees (one version ofwhich is theparse tree) orotherstructural system. (http://www.worldlingo.com/ma/enwiki/en/Syntax#Categorial_grammar)

  14. Desafio conceitual {[Ann], [Betty] and [Chloe]} had supper. He said, "Hello, one, two, three, testing, testing, testing." Não é frase no sentido de uma cadeia de dependência sintático-semântica. Regra especial de coordenação: (4) {[word*]* conjunction [word*]}, where * = 1 or more and […] is a conjunct. Hudson, Word Grammar, English Word Grammar. (HUDSON, 1990).

  15. That-clauses The problem: that must be the head of its clause (because it is the word selected), but it is optional. How can this simple fact be stated without referring to 'clause' (or CP)? I know (that) you are tired. I know that you are tired. I know you are tired. Solução: relação de representação (o argumento é o verbo, cujo valor pode ser tanto o“that”, na relação de dependência, quanto o próprio verbo). “A questão que se coloca é se a noção de dependência é assumida para ser não somente necessária, mas também suficiente para a análise sintática de estruturas em língua natural”.

  16. “As conexões entre suportes teóricos e sistemas computacionais são indiretas em relação a análises baseadas em dependência, provavelmente mais do que em relação a teorias e parsers baseados em análise de constituintes. Provavelmente, o problema se relaciona com o baixo grau de formalização da gramática de dependências, e essa é parte da razão por optarmos por descrever parsers com representação de dependência, ao invés de parsers com gramática de dependência” (NIVRE). “Most versions of dependency grammar follow Tesniere in assuming that the nodes of a dependency structure are not linearly ordered in themselves but only in relation to a particular surface realization of this structure”. Que visão de linguagem/língua está comprometida? O artigo traz definições conceituais, visão não-normativa da formalização, mas descritiva no sentido de adequada às realizações.

  17. Problemas de critérios • Syntactic versus semantic heads. Quando há divergência: I believe in the system. Sintático: in como dependente de believe e como head de system. • Semântico: é mais natural tratar system como dependente direto debelieve e in como dependente de system. • I believe in the system. (3)

  18. The distinction between projective and non-projective dependency grammar often made in the literature thus refers to the issue of whether this constraint is assumed or not. Broadly speaking, we can say that whereas most practical systems for dependency parsing do assume projectivity, most dependency-based linguistic theories do not. CAPTURAR A REALIDADE DA LÍNGUA. Isso pressupõe assumir uma abordagem mais holista ou atomista dos fenômenos. Se a formalização assumida vai assumir um potencial maior de generalidade ou vai dar conta de um certo número de casos considerados canônicos. • More precisely, most theoretical formulations of dependency grammar regard projectivity as the norm but also recognize the need for nonprojective representations of certain linguistic constructions, e.g. long-distance dependencies (Mel’ˇcuk, 1988; Hudson, 1990). It is also often assumed that the constraint of projectivity is too rigid for the description of languages with free or flexible word order. (aspects of representation -2)

  19. Benefícios da interface Ter uma representação mais restrita, onde o número de nós é fixado pela sequência de entrada em si, deve permitir métodos conceitualmente mais simples e computacionalmente mais eficientes para análise. Ao mesmo tempo, é claro que uma representação mais restrita é uma representação menos expressiva e que as representações apresentam necessariamente dependência subespecificada com relação a certos aspectos da estrutura sintática.

  20. Considerações • Há muitas gramáticas ad hoc, porém há uma preocupação com a coerência entre os conceitos de gramática, visando a uma adequação descritiva e de formalização POS tagging/parsing (etiquetagem, análise sintática), em uma interface mais amigável entre teoria linguística e engenharia das línguas naturais. • As abordagens trabalham com a noção de gramática como teoria construída. No entanto, explicitam que as formalizações não contemplam a complexidade da criatividade linguística.

  21. Referências BORDWELL, David. Narration in the Fiction Film. Madison: University of Wisconsin Press, 1985. COSTA, Jorge Campos da. A relevância da pragmática na pragmática da relevância [recurso eletrônico] / Porto Alegre : EDIPUCRS, 2008. Disponível em: <http://www.pucrs.br/edipucrs/online/livro28.html#livro> Acesso em: 02 ago 2010. ______. The sciences of language: communication, cognition and computation - Inter/Intradisciplinary Relations. In: Inovação e interdisciplinaridade na universidade. Porto Alegre: EDIPUCRS, 2007. p. 345-376. FODOR, Jerry A. The Modularity of Mind. 5th ed. The MIT Press, 1987. GRICE, Paul. Logic and Conversation. In: Studies in the Way of Words. Harvard University Press, Cambridge (MA), 1989. JOLY, Martine. Introdução à análise da imagem. 2. ed.Campinas: Papirus, 1999. LEVINSON, Steve. Presumptive Meanings: the theory of generalized conversational implicature. MIT Press. 2000. LYONS, J. Linguistic semantics: an introduction. Cambridge: Cambridge UP, 1995. Disponível em: <http://books.google.com.br/books>. Acesso em: 2 jun. 2010. MCLUHAN, M., Understanding Media: the extensions of man. New York: McGraw-Hill, 1964. METZ, Christian. A significação no cinema. Tradução de Jean-Claude Bernardet. São Paulo: Perspectiva, 2004. MÜLLERSCHÖN, Nikolai. The Red Baron (Der Rote Baro). [Filme DVD]. Produção de Nikolai Müllerschön et alli., direção de Nikolai Müllerschön. Alemanha, 2008. 1 DVD, 106 min. color. SILVEIRA, Jane R. Caetano. A imagem: Interpretação e comunicação. Linguagem em (Dis)curso, v. 5, n. esp., p. 113-128, 2005. Disponível em: <http://www3.unisul.br/paginas/ensino/pos/linguagem/0503/7%20art%205.pdf>. Acesso em: 05 ago. 2007. _____; FELTES, Heloísa P. de Moraes. Pragmática e cognição: a textualidade pela relevância. 2. ed. Porto Alegre: EDIPUCRS, 2002. SPERBER, D.; WILSON, D. Relevance: Communication & Cognition. 2nd ed. Cambridge,Mass.: Harvard University Press, 1995. VIÉGAS-FARIA, Beatriz. Implicaturas em Romeu e Julieta: a teoria de Grice e suas implicações para o estudo da tradução. In: IBAÑOS, Ana T.; SILVEIRA, Jane Rita C. da (Orgs.). Na interface semântica/pragmática – programa de pesquisa em lógica e linguagem natural. Porto Alegre: EDIPUCRS, 2002. p. 427-465. WILSON, Deirdre. New directions for research on pragmatics and modularity. Lingua 115: 1129-1146. 2005. Disponível em: <http://www.phon.ucl.ac.uk/home/deirdre/papers/6a%20Sperber%20&%20Wilson%2005%2 0Philosophy%20handbook.doc>. Acesso em: 26 out. 2008. XAVIER, Ismail. O discurso cinematográfico: a opacidade e a transparência. 3. ed. São Paulo: Paz e Terra, 2005.

More Related