Analyse de regroupements

Exercice 6.1

Les données fictives regroupements1 sont inspirées de Hsu & Lee (2002). Ces données contiennent des échelles pour certains éléments d’un questionnaire. Ce dernier a été élaboré afin d’évaluer l’importance de 55 caractéristiques des opérateurs de voyages organisés en autobus et des voyages eux-mêmes à l’aide d’une échelle de Likert à cinq points, allant de extrêmement important (5) à pas du tout important (1).

Les variables représentent les activités sociales, les politiques de l’opérateur et références, la flexibilité des horaires, la santé et sécurité, le matériel publicitaire et la réputation.

Doit-on standardiser les données avant d’effectuer l’analyse?
Faites une analyse en composantes principales et projetez les observations sur un nuage de points avec les deux premières composantes principales.
Utilisez l’algorithme des \(K\)-moyennes en faisant varier le nombre de groupes de 1 à 10. Utilisez une dizaine d’initialisations aléatoires.
1. Sélectionnez un nombre de regroupement adéquat
2. Retournez le nombre d’observation par groupe pour la valeur de \(K\) choisie.
3. Rapportez les statistiques descriptives (moyennes, etc.) de chaque segment
4. Interprétez les profils obtenus.
Faites une segmentation avec d’autres méthodes. Est-ce que la segmentation est plus satisfaisante? Justifiez votre raisonnement.

Références

Hsu, C. H. C., & Lee, E.-J. (2002). Segmentation of senior motorcoach travelers. Journal of Travel Research, 40(4), 364–373. https://doi.org/10.1177/004728750204000403