Share on

Définitions statistiques > Analyse factorielle

Contenu :

  1. Qu’est-ce que l’analyse factorielle ?
  2. Les charges factorielles
  3. L’analyse factorielle multiple
  4. L’analyse factorielle confirmatoire
  5. L’analyse factorielle exploratoire
  6. Qu’est-ce que l’analyse de Procrustes généralisée (APG)
  7. Que sont les variables latentes ?
  8. Que sont les variables manifestes ?

Qu’est-ce que l’analyse factorielle ?

L’analyse factorielle est un moyen de prendre une masse de données et de la réduire à un ensemble de données plus petit, plus gérable et plus compréhensible. C’est un moyen de trouver des modèles cachés, de montrer comment ces modèles se chevauchent et de montrer quelles caractéristiques sont vues dans plusieurs modèles. Elle est également utilisée pour créer un ensemble de variables pour les éléments similaires de l’ensemble (ces ensembles de variables sont appelés dimensions). Il peut s’agir d’un outil très utile pour les ensembles complexes de données impliquant des études psychologiques, le statut socio-économique et d’autres concepts impliqués. Un « facteur » est un ensemble de variables observées qui ont des schémas de réponse similaires ; elles sont associées à une variable cachée (appelée variable de confusion) qui n’est pas directement mesurée. Les facteurs sont répertoriés selon les charges factorielles, ou la quantité de variation dans les données qu’ils peuvent expliquer.

Les deux types : exploratoire et confirmatoire.


  • L’analyse factorielle exploratoire est si vous n’avez aucune idée de la structure de vos données ou du nombre de dimensions dans un ensemble de variables.
  • L’analyse factorielle confirmatoire est utilisée pour la vérification dans la mesure où vous avez une idée précise de la structure de vos données ou du nombre de dimensions dans un ensemble de variables.

Chargements factoriels

analyse factorielle
Image:USGS.gov

Tous les facteurs ne sont pas créés égaux ; certains facteurs ont plus de poids que d’autres. Dans un exemple simple, imaginez que votre banque réalise une enquête téléphonique sur la satisfaction des clients et que les résultats montrent les charges factorielles suivantes :

Variable Facteur 1 Facteur 2 Facteur 3
Question 1 0.885 0,121 -0,033
Question 2 0,829 0,078 0,157
Question 3 0,777 0,190 0.540

Les facteurs qui affectent le plus la question (et qui ont donc les charges factorielles les plus élevées) sont en gras. Les charges factorielles sont similaires aux coefficients de corrélation dans la mesure où elles peuvent varier de -1 à 1. Plus les facteurs sont proches de -1 ou 1, plus ils affectent la variable. Une charge factorielle de zéro indiquerait l’absence d’effet.

Retour en haut

Analyse factorielle multiple

Ce sous-ensemble de l’analyse factorielle est utilisé lorsque vos variables sont structurées en groupes de variables. Par exemple, vous pourriez avoir un questionnaire sur la santé des étudiants avec plusieurs items comme les habitudes de sommeil, les dépendances, la santé psychologique ou les difficultés d’apprentissage.
Les deux étapes réalisées dans l’analyse factorielle multiple sont :

  1. L’analyse en composantes principales est réalisée sur chaque ensemble de données. Cela donne une valeur propre, qui est utilisée pour normaliser les ensembles de données.
  2. Les nouveaux ensembles de données sont fusionnés dans une matrice unique et une deuxième ACP globale est effectuée.

Exécution de l’analyse factorielle

L’analyse factorielle est une procédure mathématique extrêmement complexe et est effectuée avec un logiciel.

Les instructions pour Stata peuvent être trouvées ici.
Les instructions pour Minitab sont ici.
Pour SPSS, voir cet article.

Le test de Kaiser-Meyer-Olkin vérifie si vos données sont adaptées à l’AF.
Retour en haut

Qu’est-ce que l’analyse factorielle confirmatoire ?

L’analyse factorielle confirmatoire permet à un chercheur de déterminer s’il existe une relation entre un ensemble de variables observées (également appelées variables manifestes) et leurs constructions sous-jacentes. Elle est similaire à l’analyse factorielle exploratoire. La principale différence entre les deux est :

  • Si vous voulez explorer des modèles, utilisez l’AFE.
  • Si vous voulez effectuer des tests d’hypothèses, utilisez l’AFC.

L’AFE fournit des informations sur le nombre optimal de facteurs nécessaires pour représenter l’ensemble des données. Avec l’analyse factorielle confirmatoire, vous pouvez spécifier le nombre de facteurs requis. Par exemple, l’AFC peut répondre à des questions telles que « Mon enquête en dix questions mesure-t-elle avec précision un facteur spécifique ? ». Bien qu’elle soit techniquement applicable à n’importe quelle discipline, elle est généralement utilisée dans les sciences sociales.

Mise en œuvre de l’analyse factorielle confirmatoire

Diane Suhr, PhD, sur le site Web de SAS, suggère les étapes suivantes :

  • Faire une analyse documentaire pour vous aider à choisir un modèle approprié. Par exemple, vous pourriez choisir un diagramme ou des équations.
  • Déterminer si une valeur unique est possible pour l’estimation des paramètres de la population.
  • Collecter vos données.
  • Faire une analyse initiale des données pour vérifier les problèmes tels que les données manquantes, la colinéarité ou les valeurs aberrantes.
  • Estimer les paramètres de la population.
  • Déterminer si le modèle que vous avez choisi fonctionne. Si le modèle est inacceptable, envisagez d’effectuer une analyse factorielle explicative.
  • Interpréter vos résultats.

Selon IBM, l’AFE a dépassé l’AFC comme moyen d’analyse factorielle. « L’approche prédominante de l’AFC aujourd’hui consiste à considérer l’AFC comme un cas particulier de modélisation par équations structurelles (SEM). Vous spécifiez les charges factorielles comme un ensemble d’énoncés de régression du facteur aux variables observées. » Avec l’AFC, il est possible de spécifier quelques facteurs et une rotation particulière ; vous pouvez ensuite comparer vos résultats pour voir s’ils correspondent à votre modèle.

Réaliser une AFC

analyse factorielle confirmatoire
Un logiciel est généralement nécessaire pour réaliser une analyse factorielle confirmatoire. SAS peut être utilisé pour effectuer l’AFC. Au moment de la rédaction de ce document, SPSS est limité à l’AFE uniquement.

  • Procédure d’AFC de SAS.
  • Instructions d’AMOS (document à télécharger de l’Université de Caroline du Sud).
  • Procédures d’AMOS, LISREL, MPLUS.

Retour en haut

Qu’est-ce que l’analyse factorielle exploratoire?

L’analyse factorielle exploratoire(AFE) est utilisée pour trouver la structure sous-jacente d’un grand ensemble de variables. Elle réduit les données à un ensemble beaucoup plus petit de variables sommaires.
L’AFE est presque identique à l’analyse factorielle confirmatoire(AFC). Les deux techniques peuvent (de manière peut-être surprenante) être utilisées pour confirmer ou explorer. Les similitudes sont :

  • Évaluer la fiabilité interne d’une mesure.
  • Examiner les facteurs ou les constructions théoriques représentés par des ensembles d’items. Ils supposent que les facteurs ne sont pas corrélés.
  • Etudier la qualité pour des items individuels.

Il existe cependant quelques différences, principalement concernant la façon dont les facteurs sont traités/utilisés. L’AFE est fondamentalement une approche axée sur les données, permettant à tous les items de se charger sur tous les facteurs, tandis qu’avec l’AFC, vous devez spécifier les facteurs à charger. L’AFE est un bon choix si vous n’avez aucune idée des facteurs communs qui pourraient exister. L’AFE peut générer un grand nombre de modèles possibles pour vos données, ce qui n’est pas toujours possible si le chercheur doit spécifier les facteurs. Si vous avez une idée de ce à quoi ressemblent les modèles, et que vous voulez tester vos hypothèses sur la structure des données, l’AFC est une meilleure approche.

Qu’est-ce que l’analyse de Procrustes généralisée (APG) ?

L’analyse de Procrustes est un moyen de comparer deux ensembles de configurations, ou formes. Développée à l’origine pour faire correspondre deux solutions issues de l’analyse factorielle, la technique a été étendue à l’analyse de Procrustes généralisée afin de pouvoir comparer plus de deux formes. Les formes sont alignées sur une forme cible ou entre elles.
L’APG utilise des transformations géométriques (c’est-à-dire une remise à l’échelle isotrope, une réflexion, une rotation ou une translation) de matrices pour comparer les ensembles de données. L’image suivante montre une série de transformations sur un triangle cible vert.
analyse de procrustes généralisée
La matrice consensus est (comme son nom l’indique), le résultat des moyennes de toutes les matrices d’entrée. Les matrices formées au cours du processus d’analyse de Procrustes généralisée peuvent être entrées dans l’analyse en composantes principales et projetées sur un espace bidimensionnel pour des résultats facilement compréhensibles.

Utilisation dans le profilage sensoriel

L’analyse de Procrustes généralisée un moyen de trouver une structure sous-jacente dans le profilage sensoriel, qui se divise en deux catégories : le profilage conventionnel et le profilage à choix libre.

Avec le profilage conventionnel, un ensemble fixe de termes descriptifs est fourni aux évaluateurs. Les évaluateurs sont généralement des personnes hautement qualifiées. Par exemple, vous pouvez demander à trois experts leur avis sur le corps, l’odeur et le goût de quatre marques de vin. Les descriptions fixes pourraient inclure les termes croquant, anguleux et beurré. Les résultats peuvent être moyennés, il est donc possible d’utiliser l’analyse factorielle ou l’analyse en composantes principales – ainsi que la GPA – pour analyser le test.

Le profilage à choix libre donne aux répondants la liberté de répondre aux questions en utilisant leurs propres termes descriptifs. Comme il n’y a pas de termes fixes à moyenner, il n’est pas possible d’utiliser l’analyse factorielle ou l’ACP. Les méthodes de K-sets, comme l’ACP, sont utilisées sur ce type de profilage à choix libre.

Les catégories sont les dimensions de l’analyse de Procrustes généralisée. Idéalement, le nombre de dimensions est égal dans tous les domaines (dans cet exemple, cela signifierait que l’expert a donné une note dans les trois domaines). Cependant, il est possible d’exécuter une analyse de Procrustes généralisée en utilisant des dimensions inégales.
Retour en haut

Qu’est-ce qu’une variable latente?

variable latenteUne variable latente ou variable  » cachée  » est généralement considérée comme une variable qui n’est pas directement mesurable ou observable. Par exemple, le niveau de névrose, de conscience ou d’ouverture d’une personne sont tous des variables latentes. Bien que vous ne puissiez pas voir ces variables sous-jacentes (elles ne font pas partie de l’ensemble des données d’une expérience), elles peuvent avoir des effets sur les résultats de votre expérience. Les variables latentes sont également connues sous le nom de :

  • Constructions ou constructions hypothétiques.
  • Facteurs.
  • Variables cachées.
  • Variables hypothétiques.
  • Valeurs vraies.
  • Variables non mesurées.
  • Variables non observées.

L’un des premiers exemples de variable latente a été publié en 1904 lorsque Spearman a mesuré l’intelligence en utilisant l’analyse factorielle. Une définition plus précise des variables latentes est parfois utilisée. Par exemple, MacCallum & Austin(2000) décrit ces variables comme des « constructions hypothétiques qui ne peuvent être mesurées directement. » Elles sont hypothétiques car elles n’existent que dans l’esprit du chercheur.

La variable latente dans la modélisation statistique

Les variables latentes sont parfois utilisées dans les techniques de modélisation statistique comme l’analyse factorielle, où elles peuvent être déduites par des techniques de modélisation. Les variables latentes sont toujours présentes dans presque toutes les analyses de régression, car tous les termes d’erreur additifs ne sont pas mesurables (et sont donc latents).

Les méthodes de modélisation statistique qui sont souvent utilisées pour identifier les variables latentes comprennent :

  • Les algorithmes EM.
  • Analyse factorielle.
  • Modèles de Markov cachés.
  • Analyse sémantique latente.
  • Analyse en composantes principales.
  • Modélisation par équations structurelles.

Une variable latente peut également être présente (et incluse dans un modèle) lorsqu’il n’y a aucun objectif de la mesurer réellement. Melanie Wall, de l’université de Columbia, propose les trois exemples suivants de variables latentes qui ne sont pas destinées à être mesurées :

  • Hétérogénéité non observée (par ex. fragilités dans l’analyse de survie, effets aléatoires dans les données longitudinales ou les données groupées)
  • Données manquantes
  • Contrefactuels ou  » résultats potentiels « 

Retour en haut

Que sont les variables manifestes ?

Les variables manifestes (également appelées variables observables) peuvent être mesurées ou observées directement. Elles sont à l’opposé des variables latentes. Par exemple, l’âge et le sexe sont des variables observables. Cependant, il est rare que vous puissiez être sûr à 100 % d’une variable ; même le  » sexe « , s’il est observé, n’est pas sûr à 100 %, car les gens peuvent mentir sur leur formulaire, déguiser leur véritable sexe ou être une personne transgenre. Par conséquent, vous devriez utiliser des variables latentes chaque fois que possible.

Référence:
MacCallum RC, Austin JT. 2000. Applications de la modélisation des équations structurelles dans la recherche psychologique. Annu. Rev. Psychol. 51:
201-26


CITE THIS AS:
Stephanie Glen. « Analyse factorielle : Définition facile » de StatisticsHowTo.com : Des statistiques élémentaires pour le reste d’entre nous ! https://www.statisticshowto.com/factor-analysis/

——————————————————————————

Vous avez besoin d’aide pour un devoir ou une question de test ? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions de la part d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *