Premiers pas en régression linéaire avec SAS®

Josiane Confais, UPMC-ISUP
Monique Le Guen, Centre d'Économie de la Sorbonne


Résumé. Ce tutoriel montre, de façon intuitive et sans formalisme excessif, les principales notions théoriques nécessaires à la compréhension et à l'interprétation des résultats d'analyses de régression linéaire, simple et multiple, produits par la procédure REG de SAS® et par le menu FIT de SAS/INSIGHT. Ce tutoriel est issu d'un cours enseigné par les auteurs dans différentes formations : ISUP, Master de Paris 1, formation permanente du CNRS, au CEPE de l'INSEE. Il fait suite à un premier document de travail publié à l'unité Méthodes statistiques de l'INSEE. Nous avons ajouté de nombreux graphiques et affichages de SAS/INSIGHT qui par ses possibilités de visualisation et d'interactivité, facilite la compréhension à la fois des données et des techniques. Nous avons également ajouté des liens vers des applets ou d'autres documents accessibles sur internet. Nous insistons dans ce tutoriel sur l'importance des graphiques exploratoires et sur les limites des résultats obtenus par une régression linéaire, si l'étape de vérification des suppositions n'est pas systématiquement entreprise.
Mots clés : Régression linéaire simple, régression linéaire multiple, moindres carrés ordinaires, SAS, Proc REG, SAS/INSIGHT, graphiques exploratoires, validation.

Abstract. This tutorial shows in an intuitive way and without excessive formalism, the theoretical notions necessary to understand and interpret simple and multiple regression produced by SAS® PROC REG and by the menu FIT of SAS/INSIGHT. This tutorial is based heavily on training courses given by the authors in high-profile institutions like ISUP, Master Degree at Paris 1 University, CNRS and CEPE-INSEE. It follows a first working paper published by UMS-INSEE. Thanks to SAS/INSIGHT interactivity and visualization tools, we created numerous graphs and displays to improve the understanding of data and statistical methods. This tutorial also includes various links towards applets or other documents from the internet. We insist in this tutorial on the significance of exploratory graphs and on the limits of results obtained by a linear regression if the assumptions are not systematically checked.
Keywords : Simple linear regression, multiple linear regression, ordinary least squares, SAS, Proc REG, SAS/INSIGHT, exploratory graphics, validation.

JEL Classification : C01, C52.