Analyzing and representing multidimensional quantitative and qualitative data : Demographic study of the Rhône valley. The domestic consumption of the Canadian families

Marie Cottrell, SAMOS-MATISSE
Patrice Gaubert, SAMOS-MATISSE
Patrick Letremy, SAMOS-MATISSE
Patrick Rousset, SAMOS-MATISSE


Résumé. L'algorithme de KOHONEN (ou algorithme d'auto-organisation SOM) est maintenant largement utilisé pour l'analyse exploratoire des données, (le"data mining"), la visualisation et la représentation des données multi-dimensionnelles, l'analyse des relations entre variables quantitatives et/ou qualitatives. La principale caractéristique des classifications obtenues par cette méthode, et qui la distingue des autres méthodes de classification, est ce qu'on appelle la conservation de la topologie : après l'apprentissage, des observations "proches" se retrouvent dans la même classe (ce qui est le cas pour toute méthode de classification), ou dans des classes "proches", selon la définition des voisinages choisie. Cependant, les possibilités de cet algorithme n'ont pas été complètement exploitées jusqu'à présent. Dans ce papier, nous présentons un certain nombre de techniques qui peuvent être dérivées de l'algorithme de Kohonen, telles que la représentation des contenus des classes, la visualisation des distances entre les classes, une rapide et robuste classification à deux niveaux emboîtés basés sur les variables quantitatives, le calcul d'indicateurs de classification, le croisement de la classification avec des variables qualitatives exogènes pour permettre la description de la classification obtenue et mettre en évidence les variables explicatives les plus importantes. Nous définissons ainsi deux algorithmes originaux (KORRESP et KACM) pour l'analyse des relations entre variables qualitatives (comme en analyse des correspondances).
Mots clés : Analyse des données, classification, auto-organisation, data mining, analyse des correspondances, algorithme de Kohonen.

AMS Classification : 62-07, 62H25, 62H30.