Le populaire programme Excel de Microsoft possède des capacités d’analyse de données qui incluent la réalisation d’analyses de régression avec des variables factices. Les variables muettes sont des variables catégorielles exprimées numériquement par 1 ou 0 pour indiquer la présence ou l’absence d’une qualité ou d’une caractéristique particulière. Excel n’a pas besoin de fonctions spéciales lorsqu’un modèle de régression inclut une variable fictive parmi les variables indépendantes. Cependant, les modèles de régression avec variables fictives dépendantes nécessitent des add-ins supplémentaires, des programmes qui élargissent les options et les fonctionnalités d’Excel.
Charger l’outil d’analyse des données à partir des add-ins Excel, inclus dans toutes les versions d’Excel. Vous devez le faire pour effectuer une régression ou tout autre type d’analyse de données. Cliquer sur « Outils » ouvre un menu déroulant. Sélectionnez « Add-ins » et dans le menu qui s’ouvre, cochez « Analysis ToolPak » et cliquez sur « OK », « Data Analysis » devrait apparaître dans votre menu Outils.
Entrez les données que vous utiliserez pour votre régression dans une feuille de calcul Excel, en codant toutes les variables fictives avec la valeur 1 ou 0, selon que le sujet possède la caractéristique en question. Le sexe est un exemple de variable muette, puisque les sujets d’une étude ne peuvent être que des hommes ou des femmes. Une étude des résultats des examens d’entrée au collège qui incluait le sexe des sujets, par exemple, pourrait coder les étudiantes avec un 1. L’utilisation de variables fictives parmi vos variables indépendantes ne nécessite aucune fonction spéciale dans Excel. Rappelez-vous que si une variable muette n’a que deux catégories (par exemple, homme ou femme), une seule variable est nécessaire pour représenter les deux catégories.
Coder les variables catégorielles avec plus de deux catégories en tant que variables muettes multiples, en s’assurant que le nombre de variables est inférieur d’une variable au nombre de catégories (n-1, en termes statistiques). Par exemple, la catégorie ethnicité exprimée en cinq niveaux (blanc, noir, hispanique, asiatique, asiatique, amérindien) nécessiterait quatre variables factices distinctes. Par exemple, si vous étudiez les résultats des examens d’entrée à l’université, vous pourriez créer les variables factices suivantes : noir, hispanique, asiatique et amérindien, en codant chacun un 1 si l’étudiant en question correspond à cette catégorie ethnique.
Élargir la capacité d’Excel pour la régression avec des variables fictives avec un add-in qui permettra au programme d’effectuer des régressions avec des variables fictives dépendantes. L’un de ces programmes est XLStat, disponible à l’achat et au téléchargement auprès du fabricant, Addinsoft. De tels programmes vous permettent d’effectuer des régressions dans lesquelles la variable dépendante prend les valeurs ou 1 ou 0.
Laisser un commentaire