1 / 76

Veille, ontologies linguistiques, fouille intelligente de textes

Université de Lyon, ENS Lyon, le 27 mars, 2010. Veille, ontologies linguistiques, fouille intelligente de textes. Jean-Pierre Desclés LaLIC “Langues, Logiques, Informatique et Cognition” Université de Paris-Sorbonne. Cognitive semantics and Formal Ontology.

vita
Download Presentation

Veille, ontologies linguistiques, fouille intelligente de textes

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Université de Lyon, ENS Lyon, le 27 mars, 2010 Veille, ontologies linguistiques,fouille intelligente de textes Jean-Pierre Desclés LaLIC “Langues, Logiques, Informatique et Cognition” Université de Paris-Sorbonne Desclés, Lyon, mars 2010

  2. Cognitive semantics and Formal Ontology Desclés, Lyon, mars 2010

  3. Relations between Semantics of Natural Languages and Ontologies Semantics in Natural Languages Discursive Semantics in textual analysis Concepts of Cognitive Semantics Formal Ontology Concepts of Philosophy Specifications Specifications Texts Ontologies of Domains Automatic Annotations Engine Desclés, Lyon, mars 2010

  4. Relations between Cognitive and Applicative Grammar with Ontologies conceptualisation CAG Semantico-cognitive Schemes Formal Ontology conceptualisation Representation of meanings Specifications EXCOM Engine for automatic Annotation of texts Linguistic Ontology LDO Texts Annotated Texts Ontology of a Domain Domain Desclés, Lyon, mars 2010

  5. Viewpoints for text Mining Linguistic resoources according to a viwpoint for text mining Viewpoint « meeting » Viewpoint « quotations » Viewpoint « causality » Viewpoint « definition » Viewpoint « temporal Information » …. Engine for texts Annotation by Contextual Exploration Texts Annotated Texts 1 4 3 2 Linguistic Resources for segmentation Segmented Texts Desclés, Lyon, mars 2010

  6. Carte sémantique des ASPECTS ETAT PROCESSUS EVENEMENT État descriptif Processus Inaccompli continu Événement non complet État d’activité Événement complet Progressif Nouvel état État Résultatifs Suite ouverte d’occurrences processus discret Etat final Desclés, Lyon, mars 2010

  7. Veille et langage Desclés, Lyon, mars 2010

  8. 1999 [http://www.linux.com/featured_articles/19990801/105/] En date du 1er août, un article d’Eric Raymond, auteur du fameux “ La Cathédrale et le Bazar ”, en réponse à ceux qui pensent que l’originalité et l’innovation ne peuvent pas s’exprimer dans le mode de développement en “ bazar ”, et comparent (comme dans le document “ Halloween ”) le développement de Linux à une “ chasse aux feux arrière ” (chasing taillights). Il rappelle que ce reproche de “ suivisme ” ne peut s’appliquer par exemple ni à Emacs ni à Gnome. Il suggère aussi que l’innovation ne résulte pas automatiquement d’un mode de développement ou d’un autre, mais bien d’une idée née dans la tête d’une personne, et que le “ bazar ” est bien plus à même de laisser émerger cette idée que la “ cathédrale ”, où différentes contraintes (hiérarchie, objectifs de vente, etc.) sont autant d’obstacles. Innovation « bazard » ou « cathédrale »écrit par un veilleur Desclés, Lyon, mars 2010

  9. 1999 - Linus Torvalds nous préparerait-il quelque chose ? D’après ZDNet ([http://www.zdnet.fr/fr/actu/linus.html ] ), Linus Torvalds, le père de Linux, travaille actuellement sur un projet « top secret »au sein de la société Transmeta (San Jose, Ca), qui aurait été créée par Paul Allen (cofondateur de Microsoft). Ils’agirait d’une « nouvelle génération technologique de matériels et de logiciels basée sur un système multiprocesseur ». Mais pas un mot là-dessus dans soninterview, où il se félicite de la sortie de Linux 2.2 et où il dit que Microsoft « n’a pas fait du bon boulot ». Linus Torwalds en lien avec ...?Node sur lefondateur de Linux, concurrent de Windows Desclés, Lyon, mars 2010

  10. 1999 (source : Google Inc. [http://www.google.com ] ) Connaissez-vous Google ? Il tire son nom du « googol » (un 1 suivi de cent 0, pour symboliser la masse des informations trouvables sur la Toile), et c’est un moteur de recherche sur Internet (issu de l’Université de Stanford) qui est en entré en service le 26 septembre dernier. Il paraît rapide et assez efficace. Il est surtout assez finaud. Par exemple, si on lui demande « best operating system », c’est Linux qui est cité en premier. Pour le « worst operating system », il vous aiguille sur la page d’accueil de … Microsoft ! Etonnant, non ? Commentaire : Amusant, en tout cas (quoi qu’on pense des systèmes cités !). Mais il ne semble pas y avoir de truc. En fait, le classement est entièrement automatique. Il se fait en fonction du nombre de pages contenant un lien vers la page en question, et de ce qui est dit dans ces pages. Il traduit le fait que la page victorieuse est souvent référencée, par des pages elles-mêmes souvent pointées par d’autres. Ce qui veut dire qu’elle est jugée intéressante par beaucoup de monde, donc qu’elle est intéressante, donc que son contenu répond bien à votre question. Reste à vérifier si le raisonnement est valide. Google ?écrit par un veilleur “logiciel” et “open source” en 1999 Desclés, Lyon, mars 2010

  11. 1999 (source : BF) Lors de la conférence Objet 99 (mai 1999), intéressante analyse de l’ex-PDG d’O2, François Bancilhon (Ardent Software), à propos de la vie et la mort des marchés : un marché ne se crée que si les investisseurs peuvent en retirer des bénéfices rapidement ; il ne permet la survie que d’un ou deux leaders, ensuite de quoi, il n’intéresse plus les investisseurs. Il est donc important de créer sans cesse de nouveaux marchés, et les cabinets de consultants (Gartner, Ovum, IDG) ont un rôle essentiel pour cela, en jouant finalement le rôle de prescripteurs, et de “ faiseurs de survivants ”, ce qui conduit à des vagues de rachat des petits par les grands. Exemple : le marché des serveurs d’applications est l’héritier de celui des moniteurs transactionnels (IBM, BEA) et de celui des ORB (Iona, Inprise). D’après lui, pour des raisons financières plus que technologiques devraient bientôt apparaître les marchés des EIP (enterprise information portals), de l’EAI (enterprise application integration), du SCM (source chain management) et du BPO (business process outsourcing). Commentaire : qui vivra verra … Mais l’analyse a bien des apparences de réalité. veille intelligente sur les marchésnote de veille et commentaire d'un veilleur Desclés, Lyon, mars 2010

  12. D’où viennent les « trous de sécurité » ? ([http://news.cnet.com/news/0-1003-200-1462855.html?tag=st] ) D’après une enquête de l’Oregon Graduate Institute of Science and technology, financéeen partie par le DARPA (Defence Advanced Research Projects Agency), la plupart des failles de sécurité s’expliquent par le débordement de zones tampon (buffer overflow). On pourait penser que c’est le B A BA de la programmation que de vérifier ça, mais c’est très courant, disent les auteurs du rapport. (ex : Microsoft vient de diffuser une correction pour un défaut de ce genre dans Windows). « Ecrire du code correct est une proposition louable, mais très chère», surtout avec C ou C++, et de plus la « culture » actuelle « favorise la performance au détriment de la correction». Le « quick and dirty », en quelque sorte … Risque majeur : La sécurité ! Desclés, Lyon, mars 2010

  13. Java Evolutionary Dead End?http://www.artima.com/weblogs/viewpost.jsp?thread=221903 Computing Thoughts : Java: Evolutionary Dead End by Bruce Eckel: January 3, 2008 Summary This sounds bad, but it needs to happen if Java is to ultimately stay in the mainstream. That is, if feature accretion hasn't already irreparably damaged the language. Bruce Eckel (www.BruceEckel.com) provides development assistance in Python with user interfaces in Flex. He is the author of Thinking in Java (Prentice-Hall, 1998, 2nd Edition, 2000, 3rd Edition, 2003, 4th Edition, 2005), the Hands-On Java Seminar CD ROM (available on the Web site), Thinking in C++ (PH 1995; 2nd edition 2000, Volume 2 with Chuck Allison, 2003), C++ Inside & Out (Osborne/McGraw-Hill 1993), among others. He's given hundreds of presentations throughout the world, published over 150 articles in numerous magazines, was a founding member of the ANSI/ISO C++ committee and speaks regularly at conferences. Desclés, Lyon, mars 2010

  14. Différents types de veille La veille (chez l’Oréal) • Veille technologique : informer la direction de nouvelles molécules, des résultats de recherches en biotechnologies • Veille concurrentielle : mesurer l’intérêt des nouvelles technologies et surveiller le rapport entre les acteurs du secteur de l beauté et de la santé • Veille commerciale : suivre de près l’évolution des pratiques de la distribution • Veille sociétale : analyser les mutations liées à l’amélioration de la condition féminine, au vieillissement des populations • Veille législative : se documenter sur l’évolution des politiques publiques en matière de santé • Veille géographique : suivre l’évolution des progrès réalisés dans les pays en forte croissance (Inde, Chine) • Veille géopolitique : Observer l’impact économique de la libéralisation en Europe de l’Est … • Source : Serge Courrier, Management, mars 2004, p. 54 Desclés, Lyon, mars 2010

  15. Différents secteurs dans une organisation Logistique Production Marketing Ventes et affaires SAV Qualité / sécurité DocumentationConsultant Audit Bureau d’étude • Direction générale • Finance • Contrôle de gestion • Comptabilité • R&D • SI • Juriste • RH • Achat Desclés, Lyon, mars 2010

  16. Signaux forts / signaux faibles « Nous ne voulons pas des signaux faibles mais des signaux forts ». « jusqu’à présent, les organisations se sont attachées à la recherche et à l’exploitation de l’information correspondant à des « signaux forts » : il s’agit, pour l’essentiel, d’informations plusieurs fois recoupées, relatives à des évolutions technologiques, économiques, sociales, etc. clairement identifiables ». « Nous découvrons souvent trop tard que ces signaux existaient et auraient pu être perçus, mais ils ne l’ont pas été, bien que cela eut été profitable » Boulanger P., Regnier F., « Les signaux faibles : une perception créatrice du devenir », Technologies internationales, décembre, n° 20, p. 40-43, 1995 Desclés, Lyon, mars 2010

  17. La veille et la « fouille intelligente » des textes Desclés, Lyon, mars 2010

  18. Qui dit quoi ? - À qui ? - Comment ? - Où ? - Quand ? - Pourquoi ? - Avec quel effet ? - Avec quelle(s) intention(s) ? Desclés, Lyon, mars 2010

  19. Théorie (formelle) de l’énonciation(éléments succints) Frege, Buber, Bülher, Jakobson, Bally, Benveniste, Culioli … Desclés Desclés, Lyon, mars 2010

  20. Dia-logue / communication • Le langage sert avant tout à construire des dia-logues, à construire du sens avec l’autre. • La communication est cas dégénré du dia-logue. • « La bonne compréhension est cas particulier du bmalentendu » (P. Bourdieu, A. Culioli) Desclés, Lyon, mars 2010

  21. François Julien (1)Si parler va sans dire, Seuil, 2006 • « Penser c’est déjà dialoguer avec soi -, vieux truisme des Grecs (Thétète, 189, c) » • «  Je peux certes parler à quelqu’un (m’adresser à lui) mais non parler avec quelqu’un, c’est-à-dire produire en commun un logos dont je sois assuré que l‘autre l’entend effectivement comme moi et dont sans équivoque nous partagions l’intelligence. » Desclés, Lyon, mars 2010

  22. François Julien (2) « Entendons donc plus complètement ce dia- du dia-logue : il ne désigne pas seulement l’« entre » de la parole (entre l’interlocuteur et moi) mais aussi l’« à travers » et le déroulement (dia comme dia-doxazein, cf. Philèbe, 38, c) ; c’est au travers même du logos, de son extension comme de son épaisseur, mais devenant de part en part translucides, que je m’entends avec l’interlocuteur et chemine avec lui. » Desclés, Lyon, mars 2010

  23. Jeu dia-logique des personnes  JE TU  # # IL Ni JE, ni TU Desclés, Lyon, mars 2010

  24. Ontologie linguistique de l’énonciation Desclés, Lyon, mars 2010

  25. Modalités Appréciatives JE-DIS (est-bien / mal (P)) Changement de référentiel ENONCIATION SIMPLE Prise en charge JE-DIS (P) ENONCIATION RAPPORTEE JE-DIS (L DIT (P)) Modalités Intersubjectives JE-DIS (TU DOIS (P)) JE-DIS (TU (DOIS (TU réponds (P))) Énonciateur indéterminé ASSERTION JE-DIS (est-vrai (P)) vu, constaté ENONCIATION MEDIATIVE JE-DIS (est-plausible (P)) Non vu, non constaté ENONCIATION MODALISEE épistémique JE-DIS (est-Possible (P)) Engagement Non négociable sinon contradiction Désengagement Négociable Desclés, Lyon, mars 2010

  26. Opérations énonciatives de prise en charge par un énonciateur Simple énonciation : prise en charge orientée d’une relation prédicative => négociable Énonciation rapportée : prise en charge du dire d’un locuteur Assertion : prise en charge du vrai => engagement => non négociable Enonciations modales prise en charge d’une évaluation subjective Énonciation médiative prise en charge du plausible => désengagement => négociable Acte performatif : prise en charge d’une transformation du monde externe => non négociable Modalités épistémiques, aléthiques Modalités inter-énonciateurs Modalités appréciatives Question ordre promesse Desclés, Lyon, mars 2010

  27. Modalités appréciatives Discours rapportés d’un locuteur Faits rapportés ¨à partir des dires de quelqu’un Faits rapportés par ouï-dire Modalités inter-énonciateurs Prise en charge aspecto-temporelle par un énonciateur Modalités épistémiques Faits rapportés construits par Abduction 1) Constat d’un tiers 2) Indices perceptifs Modalités du non certain Prise en charge Médiative Désengagement de l’énonciateur vers le plausible Assertions Engagement sur le vrai Surprise inattendu Modalités du certain Engagement de l’énonciateur Désengagement de l’énonciateur Desclés, Lyon, mars 2010

  28. Enonciation simple : PROC (JE-DIS (p)) « Prendre en charge » p Assertion : PROC (JE-DIS (EST-VRAI (p))) « Prendre en charge la vérité de » p Enonciation rapportée : PROC (JE-DIS (X-DIT (p))) & [X REP JE] « Prendre en charge l’énonciation de » p Enonciation modalisée : PROC (JE-DIS ( EST-POSSIBLE (p))) PROC (JE-DIS ( EST-PROBABLE (p))) « Prendre en charge une modalité affectant » p Enonciation médiatisée : PROC (JE-DIS (EST-PLAUSIBLE (p)) à partir d’indices) Indices, (p => indices) ------------------------------- EST-PLAUSIBLE (p) « Prendre en charge la plausibilité de » p (sur la base d’indices en faveur de p) Desclés, Lyon, mars 2010

  29. Enonciation simple / assertion Desclés, Lyon, mars 2010

  30. Enonciation simple :“prise en charge” d’un contenu propositionnel JE-DIS (proposition) => négociable JE-DIS ([ (proposition (X)) & [ X REP JE] ]) Tu es à Lyon => Tu est la trace de [ X  JE] PROC J0 (JE-DIS ( [ ( ASP I (proposition)) & [ I REP J0] ] )) Luc est arrivé => PROC J0 (JE-DIS ( [ ( ASP F (Luc arriver)) & [ δ(F) <δ(J0)] ] )) T0 F J0 Desclés, Lyon, mars 2010

  31. Il pleut. - Il pleut. - Non. On ne peut pas dire qu’il pleut. C’est simplement un crachin. Nous sommes en Bretagne ! - Bien. D’accord. Il ne pleut pas vraiment mais tu es quand même mouillé ! Desclés, Lyon, mars 2010

  32. Assertion :prise en charge de la vérité d’un contenu propositionnel JE-DIS ( il-est-vrai (proposition) ) Non négociable J’affirme qu’il pleut. Il pleut vraiment. Pour moi, il pleut. Desclés, Lyon, mars 2010

  33. J’affirme qu’il pleut - J’affirme qu’il pleut - Oui , si on veut. - Pour moi, il pleut - Pas exactement en ce qui me concerne. - Bon. Nous ne sommes pas d’accord. Desclés, Lyon, mars 2010

  34. Assertion individuelle Enonciation JE-DIS ( …) Assertion communautaire Assertion dans un monde mythique Assertions JE-DIS (est-vrai (…)) Assertion collective Assertion dans un référentiel - temporel, - spatial - point de vue Assertion universelle Assertion contextualisée Assertion d’un locuteur Desclés, Lyon, mars 2010

  35. Enonciation médiative(médiatisée) Desclés, Lyon, mars 2010

  36. Enonciation métiative 1°) Constat d’un indice q 2°) Savoir commun : p => q 3°) Raisonnement abductif p => q q ------------ est-plausible (p) 4°) Enonciation de (est-plausible (p)) : JE-DIS (est-plausible (p)) => désengagement de l’énonciateur JE => p est négociable 5°) Explication éventuelle Pourquoi p ? Puisque on a l’indice q Desclés, Lyon, mars 2010

  37. Il aurait donc plu. 1°) Constat d’un indice : la chaussées est mouillée 2°) Savoir commun : S’il pleut, alors la chaussée est mouillée 3°) Raisonnement abductif S’il a plu alors la chaussée est mouillée : (p => q) Or, la chaussée est mouillée : (q) -------------------------------------------------------------------- est-plausible (il a plu) 4°) Enonciation de (est-plausible (il a plu)) : Donc, il aurait plu JE-DIS (est-plausible (il a plu)) => “il a plu” est négociable 5°) Explication éventuelle : - Pourquoi donc aurait-il plu ? - Puisque la chaussée est mouillée. - Non. Il n’a pas plu. Si la chaussée est mouillée , c’est parce que l’aroseuse municipale est passée par là. Desclés, Lyon, mars 2010

  38. X est / serait coupable Le procureur a dit : «  X est / serait coupable » DRD simple Selon le procureur « X est / serait coupable » DRD simple Le procureur a dit que X était coupable DRI Selon le procureur X est / serait coupable Propos attribués Ainsi, X serait coupable Médiatif (résultat d’une abduction) X serait coupable Incertitude Ainsi, X est coupable Déduction Pour moi, X est coupable Engagement Desclés, Lyon, mars 2010

  39. Enonciation médiative SAVOIR COMMUN INDICES Indices pour abduction aux dires d’un témoin non spécifié Si un événement a eu lieu alors quelqu’un qui en a été témoin le raconte Selon un ouï-dire Non constat direct de l’énonciateur Si un événement a eu lieu alors on le raconte Indices perceptifs ou cognitifs Si un événement a eu lieu alors il a des conséquences (traces perceptives) désengagement de l’énonciateur Desclés, Lyon, mars 2010

  40. Reconstruction abductive • (D’après ce que je vois, c’est-à-dire l’état des ruines), un tremblement de terre a eu lieu dans ce village il y a au moins deux mille ans. • (D’après ce que j’ai pu reconstituer), certains dinosaures avaient des plumes et le sang chaud. • Il est donc arrivé ( / a dû arriver) (puisque son manteau est là. • Toi, tu as pleuré (puisque, je le vois, tu as les yeux rouges). Desclés, Lyon, mars 2010

  41. Mécanisme de rumeur • « X être coupable » = le fait que (X est coupable) • Question : X est coupable ? X n’est pas coupable ? • 1./ J’ai des indices externes (q1) : ainsi X, serait donc coupable ? Médiatif 1 • 2./ X est peut-être, sans doute, probablement, certainement coupable ? • 3./ Z (le procureur) a dit  : « X serait coupable » rapporté direct • 4./ Selon Z, «  X serait coupable » • 5./ Quelqu’un a dit que X serait coupable rapporté indirect • 5./ X serait donc coupable (d’après l’indice q2 = 4./) Médiatif 2 • 6./ Quelqu’un a dit : « X est coupable » rapporté direct • 7./ On a dit : « X est coupable » généralisation • rumeur, opinions • 8./ Ainsi, donc X est coupable (d’après l’indice q3 = 7./) Médiatif 3 • 9./ X est coupable (je le pense, j’en ai la conviction) opinionpersonnelle • 10./ - X est-il coupable ?  • - Oui, X est coupable (d’après mon intime conviction) déclaration • 11./ - Jurez vous que X serait coupable ? - J’affirme : «  X est coupable », je le jure.assertion Desclés, Lyon, mars 2010

  42. Mécanisme de la rumeur • D’après la rumeur, la mère serait la meurtrière • D’après ce qu’on a dit, la mère serait la meurtrière • D’après ce qu’on dit, la mère serait la meurtrière • On a dit que la mère était la meurtrière • J’ai entendu dire que la mère était la meurtrière • La mère est la meurtrière, dit-on • La mère est la meurtrière [simple énonciation] • Il a été affirmé que la mère est la meurtrière [médiation par un tiers indéterminé] • Quelqu’un a la preuve que la mère est la meurtrière • J’ai la preuve que la mère est la meurtrière • Tout le monde sait maintenant que la mère est la meurtrière [ assertion collective] • La mère est la meurtrière : c’est vrai [assertion personnelle] Desclés, Lyon, mars 2010

  43. Enonciation rapportée Desclés, Lyon, mars 2010

  44. Enonciation rapportée JE-DIS ( [ ( L-DIT (Proposition) ) & [ L REP JE] ] ) JE = énonciateur ; L = locuteur Il dit : “Je suis à Lyon” JE-DIS ( [ ( L-DIT (X être à Lyon) ) & [ [ L # JE] & [ X = L] ] ] ) Il dit qu’il est à Lyon JE-DIS ( [ ( L-DIT (X être à Lyon) ) & [ [ L # JE] & [ X # L] ] ] ) Desclés, Lyon, mars 2010

  45. Il dit : “ je suis à Lyon” JE-DIS ( [ (L-DIT ( X être à Lyon)) & [ [L # JE] & [X = L] ] ] ) Il dit : “ je suis à Lyon” Le signe Il est la trace de la relation [L #J E] et sujet du verbe d’énonciation (le locuteur L est en rupture avec l’énonciateur JE) Le signe Je est la trace de la relation [X = L] et sujet de la relation prédicative prise en charge par le locuteur. (le sujet X est indentifié au locuteur L) Desclés, Lyon, mars 2010

  46. Le discours rapporté est situé dans un autre référentiel (RDR) Desclés, Lyon, mars 2010

  47. PROCJ0(1JE-DIS ( [ PROCJ1 ( [ L-DIT ( [ ASPI (ce-qui-est-dit) & [I REP J1] ] ) & [L REP JE] ) & [ J1REP J0 ] )1) Référentiel Discours rapporté “ce-qui-est-dit” RDR # REN J1 J0 Référentiel énonciatif T1 T0 < Desclés, Lyon, mars 2010

  48. Il disait : “je suis à Lyon” PROCJ0( JE-DIS ( [ PROCJ1 ( [ L-DIT ( [ ETATO (ce-qui-est-dit) & [δ(O) = δ(J1)] ] ) & [L # JE] ) & [ δ(J1) < δ(J0) ] )) Référentiel Discours rapporté “je suis à Lyon” RDR O = # REN J1 J0 Référentiel énonciatif T1 T0 < Desclés, Lyon, mars 2010

  49. Il disait : “J’étais à Lyon” PROCJ0( JE-DIS ( [ PROCJ1 ( [ L-DIT ( [ ETATO (ce-qui-est-dit) & [δ(O) < δ(J1)] ] ) & [L # JE] ) & [ δ(J1) < δ(J0) ] )) Référentiel Discours rapporté “je suis à Lyon” O RDR = # REN J1 J0 Référentiel énonciatif T1 T0 < Desclés, Lyon, mars 2010

  50. Le locuteur s’adresse à un allocutaire ciblé Desclés, Lyon, mars 2010

More Related