La régression linéaire multiple est une méthode statistique permettant de modéliser la relation entre une variable dépendante et deux variables indépendantes ou plus, en ajustant une équation linéaire aux données observées. Elle explique comment plusieurs prédicteurs influencent simultanément une variable de résultat.
Principaux composants de la régression linéaire multiple :
- Variable dépendante (Y) : Il s’agit de la variable que l’on souhaite prédire. Elle est souvent appelée « variable cible » ou « variable réponse ».
- Variables indépendantes (X1, X2, ..., Xn) : Ce sont les variables utilisées pour prédire la variable dépendante. Elles sont souvent appelées « prédicteurs » ou « variables explicatives ».
- Modèle de régression : L’équation de la régression linéaire multiple se présente comme suit :
Y = β₀ + β₀₁ * X1 + β₂ * X2 + ... + βₙ * Xn
où :
Y est la variable dépendante. X1, X2, ..., Xn sont les variables indépendantes.
β₀ est la constante (ordonnée à l’origine). Les coefficients de régression β₁, β₂, ..., βₙ indiquent l'influence des variables indépendantes correspondantes sur la variable dépendante.
Applications : - Économie (prévision des revenus) ; - Santé (analyse des facteurs de risque) ; - Ingénierie ; - Sciences sociales ; - Prévisions commerciales.
Exemple : Prédiction du prix d'une maison en fonction de : - Sa superficie ; - Le nombre de chambres ; - Son âge.
Dans l'application, chaque objet Object_k (object_1, object_2, ..., object_m) est décrit par des variables indépendantes (Xki – caractéristiques, i = 1...n) et une variable dépendante (Yk – cible). Une méthode telle que les moindres carrés ordinaires (MCO) est utilisée pour calculer les valeurs optimales des coefficients (β₀, β₁, β₂, ..., βₙ). La valeur cible est calculée par :
Y = β₀ + β₀₁ * P₁ + β₂ * P₂ + ... + βₙ * Pₙ
où P₁, P₂...Pₙ sont les prédicteurs de la cible.
L'application enregistre les données des modèles de régression multiple dans une base de données SQLite nommée AppMultipleLinearRegression.db. Les modèles de régression sont identifiés par leur nom.
L'écran de démarrage de l'application (App Multiple Linear Regression Solver) affiche une liste d'exemples de modèles de régression (dans une liste déroulante) et des boutons permettant d'activer les fonctions de création (Nouvel exemple), de chargement (Charger), d'enregistrement (Enregistrer), d'enregistrement sous (Enregistrer sous), de calcul (Calculer) et de suppression (Supprimer) d'exemples de modèles de régression. Depuis l'écran principal, via les éléments du menu, vous pouvez également accéder à des fonctions telles que la sélection de la langue, l'enregistrement et la copie de la base de données, l'initialisation de la base de données avec des exemples de données, ainsi qu'à des fonctions auxiliaires comme l'aide de l'application, les paramètres et un lien vers le site web contenant une description de toutes les applications par les auteurs. La fonction de création d'un nouvel échantillon comprend une boîte de dialogue permettant de saisir la taille de la matrice : le nombre de lignes (correspondant aux données prédites P1, P2… Pn – la dernière ligne) et le nombre de colonnes (correspondant aux données dépendantes Y1, Y2… Yk – la dernière colonne). Un tableau est ensuite généré pour la saisie des données. Ce tableau doit être nommé avant d'être enregistré. La fonction Charger efface le tableau.
L'ancien tableau enregistré peut être affiché en le sélectionnant dans la liste déroulante. Les calculs effectués sur ce tableau sont affichés dans la boîte de dialogue Résultats de l'application. La fonction Imprimer permet d'imprimer depuis cette boîte de dialogue et d'enregistrer les résultats dans le fichier AppMultipleLinearRegressionSolver.txt. L'impression inclut une option Enregistrer la base de données/Enregistrer le fichier, permettant de sélectionner le dossier de destination. Un bouton Enregistrer apparaît ensuite. Cette même option permet d'afficher le contenu du fichier sélectionné, de renommer le fichier ou le dossier, de créer un nouveau dossier et de supprimer le fichier sélectionné.
La régression linéaire multiple est un outil d'analyse de données puissant, mais son utilisation doit être prudente et en tenant compte de ses limites. Inconvénients : Sensible à la multicolinéarité (forte corrélation entre les variables indépendantes). Ne permet pas toujours de saisir les relations non linéaires. Nécessite une validation et une vérification rigoureuses des hypothèses.
Date de mise à jour
6 mars 2026