190 likes | 337 Views
Université Mouloud Mammeri de Tizi-Ouzou R 2 I 12-14 Juin 2011 . Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens. Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou.
E N D
Université Mouloud Mammeri de Tizi-Ouzou R2I 12-14 Juin 2011 Modèle de Recherche d’InformationPersonnalisée Basé sur les Réseaux Bayésiens Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou
Plan de la présentation • Introduction • Problématique • Accès Personnalisé à l’ Information • Contribution • Conclusion & perspectives R2I 12-14 juin 2011
Introduction La vocation d’un système de recherche d’information est de fournir à l’utilisateur des informations utiles Virusbiologique Virus informatique Q=‘virus’ Q=‘virus’ Collection documents Requête C’est l’expression d’un besoin en information SRI Doc 1 Doc 1 Doc N Doc N R2I 12-14 juin 2011
Introduction Le système tiens compte de la requête utilisateur et des informations qui le décrivent Virus informatique Q=‘virus’ Profil utilisateur Domaine d’intérêt : informatique Collection documents SRI Profil utilisateur informations décrivant ses centres d’intérêts et ses préférences Doc 1 Doc M Personnalisation de l’information 12/06/2011jz R2I 12-14 juin 2011
Problématique • Comment modélisation l'utilisateur ? • Comment inclure l’utilisateur dans le processus d'accès à l'information ? R2I 12-14 juin 2011
Accès Personnalisé à l’ Information • Modèlisation de l’utilisateur • Representation du Profil • Vectorielle (Gowan 2003) • Hiérarchique (Micarelli et al.2004) • Multidimensionnlle (Kostadinov 2003) • Construction du Profil • Explicite (Kraft et al.2005) • Implicite (Gauch et al.2003) R2I 12-14 juin 2011
Accès Personnalisé à l’ Information • Exploitation du Profil Utilisateur dans le processus de recherche • Reformulation de la requête • (Sieg et al. 2004), (Koutrika et al.2005) • augmentation de la requête par des termes issus du profil utilisateur • Appariement Requête- Documents • (Haveliwala et al.2002), (Zemirli et al. 2008) • compte tenu de la requête et du profil utilisateur dans le calcul de pertinence de documents • Présentation des résultats de recherche • (Gowan 2003),(Liu et al.2004) • Le score final est la combinaison de score de similarité entre le document et le profil avec le score d’appariement initial du document R2I 12-14 juin 2011
Contribution Idée directrice Les Réseaux Bayésiens constituent un outil puissant pour la représentation des connaissances Les utiliser pour la présentation des différentes informations participantes à la définition du modèle de recherche Définition d’un module d’appariement intégrant le profil utilisateur R2I 12-14 juin 2011
Contribution • Démarche adoptée • Définition de la librairie des centres d’intérêts • chaque centre d’intérêt ck est défini comme un vecteur de termes ti pondérés selon la formule BM25 (Kassab R et al. 2005) N :le nombre total de documents de la collection ; n : le nombre de documents de la collection contenant le terme ti ; R : le nombre de documents pertinents face à une requête utilisateur ; r : le nombre de documents pertinents contenant le terme ti. R2I 12-14 juin 2011
Contribution • 2. Présentation du modèle • Le modèle consiste en un graphe G= (V, E) acyclique orienté • Nœuds V englobent la requête, les documents de la collection et la librairie de centres d’intérêts • Arcs E orientés des termes constituant l’espace d’indexation, vers les documents, les requêtes et les centres d’intérêts. Documents requête Termes Centres d’intérêts R2I 12-14 juin 2011
Contribution 3. Calcul de la Pertinence (1) U : l’ensemble des configurations u possibles de termes. P(u) : laprobabilité à priori associée à une configuration de termes L’espace de termes est réduit à la configuration couverte par la requête q P(q/u)= 1 si q=u 0 sinon Le modèle « réseau bayésien » généralise « le modèle vectoriel » l’équation (1) peut être écrite R2I 12-14 juin 2011
Contribution 4. Exemple illustratif Soit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3, 12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6} • Libraire des centres d’intérêts Requêtes Q= {q1, q2, q3, q4, q5 } q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5} Table 1. Librairie de centres d’intérêts R2I 12-14 juin 2011
t1 t2 t3 t4 t5 C1 d1 t6 d2 C2 d3 c3 c4 d4 c5 d5 Contribution Architecture du modèle Centres d’intérêts Collection documents Termes d’indexation ordre de pertinence Avec intégration du profil + D5 D2 D3 D4 - D1 + D2 D5 D4 D3 - D1 c4 Q Requête utilisateur R2I 12-14 juin 2011
Conclusion • Le modèle proposé mesure la pertinence comme un degrés de convergence des trois concepts document, requête utilisateur et centre d’intérêt • La prise en compte du profil utilisateur modélisé par son centre d’intérêt dans le module d’appariement permet un bon ordonnancement des résultats. R2I 12-14 juin 2011
Perspectives • Validation du modèle proposé sur une collection • personnalisée • Prise en compte de l’évolution du profil • utilisateur dans le modèle proposé R2I 12-14 juin 2011
Merci de votre attention! R2I 12-14 juin 2011