Nos tutelles

CNRS

Nos partenaires


Accueil > Publications > Thèses > Archives Thèses > Thèses 2014 - 2015

BOUKER SLIM


Contribution à l’extraction des règles d’association basée sur des préférences.

Mardi 30 juin 2015 -

La fouille de données est un processus qui vise à extraire un ensemble réduit de connaissances à fortes valeurs ajoutées à partir d’un grand volume de données. Parmi les techniques de fouille de données, nous trouvons l’extraction des règles associations qui permettent d’identifier les liens entre attributs décrivant les objets dans une base de données. Les règles d’association ont montré leur utilité dans plusieurs domaines d’application tel que la gestion de la relation client dans la grande distribution (déterminer les produits souvent achetés simultanément, organiser les rayons et proposer des promotions en conséquence), la biologie moléculaires (déterminer les associations entre les gènes), etc. Toutefois, les algorithmes d’extraction de règles d’association présentent l’inconvénient de générer un nombre important de règles, dont beaucoup se révèlent sans aucun intérêt pour l’expert. Ainsi, dans le but de sélectionner les règles pertinentes, plusieurs mesures de qualité ont été proposées dans la littérature dont l’objectif est d’associer une valeur numérique à une règle permettant de quantifier son intérêt. Néanmoins, le problème est loin d’être résolu car les mesures proposées sont très hétérogènes puisqu’une règle peut être considérée pertinente selon une mesure et non pertinente selon une autre. Ce genre d’observations permet de soulever de nouvelles questions : Comment déterminer les meilleures règles en présence de plusieurs experts simultanément, ayant chacun une préférence pour une mesure de qualité ? Comment déterminer les règles les plus pertinentes lorsqu’un expert a des préférences pour différentes mesures ?

Dans cette thèse, nous avons essayé de répondre à ces questions en proposant trois approches permettant de sélectionner les règles d’association pertinentes selon différentes mesures en se basant sur la relation de dominance. La première approche consiste à éliminer les règles dont les évaluations selon toutes les mesures utilisées sont inférieures à celles d’autres règles, elles sont appelées : règles dominées. Ainsi, seules les règles non dominées sont retenues. La deuxième approche consiste à ordonner les règles d’association selon plusieurs mesures pour en sélectionner les k meilleures règles, où k est fixé par l’expert. La troisième approche consiste à sélectionner un ensemble réduit de règles selon plusieurs mesures, appelées règles représentatives, tout en tenant compte de l’aspect sémantique des règles. L’objectif de cette approche est en effet de fournir un ensemble réduit de règles qui, à la fois, véhiculent le maximum d’informations utiles et expriment le meilleur compromis entre les différentes évaluations des mesures utilisées.

Mots clés : Fouille de données, extraction des règles d’association, mesures de qualité, préférences des experts, relation de dominance.

Jury :
- AZE Jérôme, Professeur, Informatique, Université de Montpellier II
- BEN YAHIA Sadok, Professeur, Informatique, Université de Tunis-El Manar, Tunisie
- KACI Souhila, Professeur, Informatique, Université de Montpellier II
- KORICHE Frédéric, Professeur, Informatique, Université d’Artois, Lens
- LENCA Philippe, Professeur, Informatique, Telecom-Bretagne, Brest
- GUILLAUME Sylvie, Maître de Conférences, Informatique, Université d’Auvergne, Clermont-F
- MEPHU NGUIFO Engelbert, Professeur, Informatique, Université Blaise Pascal, Clermont-Fd
- QUILLIOT Alain, Professeur, Informatique, Université Blaise Pascal, Clermont-Ferrand.