Analyse factorielle des correspondances simple

Introduction ? l'analyse factorielle des correspondances simple (AFC)



L'AFC est une repr?sentation graphique des modalit?s de deux variables nominales (ou variables qualitatives). C'est une m?thode d'analyse de tableaux de contingence. Un tableau de contingence est un tableau dans lequel on situe un effectif selon deux crit?res (un en ligne et un en colonne). L'AFC est tr?s semblable ? l'analyse en composante principale. Les modalit?s sont repr?sent?es dans le plan par par des points. Le graphique permet de voir une attraction ou une r?pulsion entre modalit?s.


Format du tableau de donn?es



Une image du format du jeu de donn?es est montr?e ci-dessous:



Dans cet exemple on se pose la question ? savoir la r?partition des taches quotidiennes, au sein d'une famille, entre une femme et son ?poux. Les lignes du tableau correspondent aux diff?rentes taches. Pour une tache donn?e, la valeur indiqu?e repr?sente la fr?quence d'ex?cution par l'?pouse seule (wife), de mani?re altern?e entre les 2 (alternating), par l'?poux seul (Husband) et par les 2 en m?me temps (jointly).


AFC en une seule ligne de commande




Code R :
res.ca = rquery.ca()


R vous demandera d'indiquer le fichier contenant les donn?es. T?l?charger un exemple de fichier en cliquant ici



Enregistrer le fichier au format .txt tabulation.

Pour en savoir plus sur le format de fichier accept? suivre le lien suivant : Importation et exportation des donn?es avec RQuery-1.0


R?sultats



Un dossier "Result/CAResult" est cr?? contenant les fichiers r?sultats.

Les images suivantes sont automatiquement g?n?r?es par la fonction rquery.ca()

Les valeurs propres




cliquez pour agrandir


Plan factoriel




cliquez pour agrandir

Pour voir uniquement le plan des lignes

Code R :
rquery.ca(invisible="col")#on cache les colonnes


Pour voir uniquement le plan des colonnes
Code R :
rquery.ca(invisible="row")#on cache les lignes



Fichier r?sultat (ca.txt)



La fonction rquery.ca() g?n?re ?galement un fichier .txt contenant l'ensemble des donn?es ayant servi ? faire les graphiques.

Ce fichier txt vous permettra de refaire tous les graphes sur excel ? votre convenance.

T?l?charger un exemple du fichier g?n?r? en cliquant sur le lien suivant: ca_result.txt

Le fichier contient:

eig: correspondant aux valeurs propres, le % de variance et le % de variance cumul?e
col: Contient les r?sultats pour les colonnes (coordonn?es, corr?lation entre les variables et les axes, COS2, contributions);
row:Contient les r?sultats pour les lignes (coordonn?es, corr?lation entre les variables et les axes, COS2, contributions);
col.sup : Contient les r?sultats pour les colonnes suppl?mentaires (coordonn?es, COS2);
row.sup : R?sultats pour les lignes suppl?mentaires (coordonn?es, COS2).


Un autre fichier contenant la description des diff?rents axes (ca_dimdesc.txt) est ?galement g?n?r? et ouvert automatiquement.

T?l?charger un exemple en cliquant sur le lien suivant: ca_dimdesc.txt
Ce fichier permet de voir les variables les plus li?es aux axes.



AFC 3d



Pour illustrer le plan factoriel en 3 dimensions, taper la commande suivante.

Code R :
rquery.ca(choix="3d")


Le r?sultat obtenu est une image dynamique que l'on peut agrandir, zoomer et mettre en rotation.



G?n?rer un fichier PDF contenant les graphiques



Au lieu d'afficher les graphiques, le code ci-dessous les enregistre tous dans un fichier pdf.

Code R :
rquery.ca(save.pdf=TRUE)


Le fichier PDF est automatiquement ouverte ? la fin de l'ex?cution de la commande.

Cliquer ici pour voir un exemple de fichier pdf g?n?r?.

Pour ?viter l'affichage des r?sultats txt ? chaque fois que vous ex?cuter la fonction rquery.ca(), ajouter le param?tre show.txt=FALSE (voir exemple ci-dessous)

Code R :
rquery.ca(save.pdf=TRUE, show.txt=FALSE)#Dans ce cas le pdf est affich? mais sans les r?sultats .txt



Cas des lignes et colonnes suppl?mentaires



Les lignes et les colonnes suppl?mentaires correspondent ? des modalit?s qui ne participeront ? l'AFC mais dont les positions seront pr?dites gr?ce ? l'AFC r?alis?e uniquement avec les modalit?s actives.


AFC avec des lignes et colonnes suppl?mentaires




1) T?l?charger et enregistrer ce fichier au *.txt tabulation : afc-children.txt

Une image d'une partie du fichier est montr?e ci-dessous.


cliquez pour agrandir

Ce tableau correspond ? un tableau de contingence r?sumant les r?ponses donn?es par diff?rentes cat?gories de personne ? la question suivante : quelles sont selon vous les raisons qui font h?siter une femme ou un couple ? avoir des enfants?

Les lignes et les colonnes color?s seront consid?r?es dans l'AFC comme des lignes et des colonnes suppl?mentaires ? cause des valeurs manquantes. L'AFC est tout d'abord r?alis?e sur le reste du tableau (colonnes et lignes actives non color?es) puis les coordonn?es des lignes et des colonnes suppl?mentaires sont calcul?es sur la base de l'AFC pr?c?dente.

Le fichier contient 8 colonnes et 18 lignes.
Les colonnes thirty, fifty, more_fifty correspondant respectivement aux colonnes num?ro 6, 7, 8 sont des colonnes suppl?mentaires (abr?viation col.sup=c(6,7,8)).

Les lignes 'comfort', 'disagreement', 'world' et 'to_live' correspondant respectivement aux lignes num?ro 15, 16, 17 et 18 sont des lignes suppl?mentaires (abr?viation row.sup=c(15,16,17,18))

Pour simplifier, on peut aussi ?crire row.sup=15:18; les deux points signifient 'tous les entiers de 15 ? 18 bornes comprises'


Maintenant, nous allons faire appel ? la fonction rquery.ca() en lui donnant toutes ces informations et au lieu d'afficher les graphiques, je sauvegarde en pdf en utilisant le param?tre save.pdf.

2) Code R

Code R :
rquery.ca(col.sup=6:8, row.sup=15:18, save.pdf=TRUE)


3) T?l?charger le r?sultat pdf en cliquant sur le lien suivant :
ca_result_sup.pdf

Le fichier pdf contient:
  1. Le graphique des valeurs propres
  2. Le plan factoriel des lignes (en bleu), des lignes suppl?mentaires (en bleu fonc?), des colonnes (en rouge) et des colonnes suppl?mentaires (en rouge fonc?).




Utilisateur avanc?



cliquer sur le lien suivant rquery.ca


Conclusions



Code R :
 
rquery.ca()#Fait une AFC et affiche les graphiques
rquery.ca(save.pdf=T)#Fait une AFC et enregistre les graphiques
 

Enjoyed this article? I’d be very grateful if you’d help it spread by emailing it to a friend, or sharing it on Twitter, Facebook or Linked In.

Show me some love with the like buttons below... Thank you and please don't forget to share and comment below!!
Avez vous aimé cet article? Je vous serais très reconnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami ou en le partageant sur Twitter, Facebook ou Linked In.

Montrez-moi un peu d'amour avec les like ci-dessous ... Merci et n'oubliez pas, s'il vous plaît, de partager et de commenter ci-dessous!





Cette page a été vue 8048 fois
Licence - Pas d?Utilisation Commerciale - Partage dans les M?mes Conditions
Licence Creative Commons