Analyzing and representing multidimensional quantitative and qualitative data : Demographic study of the Rhône
valley. The domestic consumption of the Canadian families
Résumé.
L'algorithme de KOHONEN (ou algorithme d'auto-organisation SOM) est maintenant largement utilisé pour
l'analyse exploratoire des données, (le"data mining"), la visualisation et la représentation des
données multi-dimensionnelles, l'analyse des relations entre variables quantitatives et/ou qualitatives.
La principale caractéristique des classifications obtenues par cette méthode, et qui la distingue
des autres méthodes de classification, est ce qu'on appelle la conservation de la topologie : après
l'apprentissage, des observations "proches" se retrouvent dans la même classe (ce qui est le cas pour toute
méthode de classification), ou dans des classes "proches", selon la définition des voisinages
choisie. Cependant, les possibilités de cet algorithme n'ont pas été complètement
exploitées jusqu'à présent. Dans ce papier, nous présentons un certain nombre de
techniques qui peuvent être dérivées de l'algorithme de Kohonen, telles que la
représentation des contenus des classes, la visualisation des distances entre les classes, une rapide et
robuste classification à deux niveaux emboîtés basés sur les variables quantitatives,
le calcul d'indicateurs de classification, le croisement de la classification avec des variables qualitatives
exogènes pour permettre la description de la classification obtenue et mettre en évidence les
variables explicatives les plus importantes. Nous définissons ainsi deux algorithmes originaux (KORRESP et
KACM) pour l'analyse des relations entre variables qualitatives (comme en analyse des correspondances).
AMS Classification :
62-07, 62H25, 62H30.
|