Séance 4 - Analyse bivariée II

T-Test

scipy.stats.ttest_ind

  • idée vérifier si la différence des moyennes est (statistiquement) significative
  • 2 groupes
  • variable quant doit être distribuée normalement

Démarche

  1. Différence des moyennes
  2. Égalité des variances?
    • Test (Folded) F test d'égalité des variances
      • variances égales si P >= 0.05
      • variances pas égales si P < 0.05
    • si P < 0.05 : méthode Satterthwaite
    • si P >= 0.05 : méthode Pooled
  3. Diff moyenne significative?
    • Méthode Satterthwaite, sorties :
      • t : sur quelle base, -100 à 100?
        plus valeur absolue de t est élevé, plus c'est significatif
      • P :
        • toujours même règle d'interprétation de P
        • ex: P < 0.0001 = significatif
    • Méthode Pooled, sorties :
      • t : plus valeur absolue de t est élevé, plus c'est significatif
      • P :

Interprétation

Voir exemple.

ANOVA

statsmodel.stats.anova

  • idée vérifier si la différence des moyennes est (statistiquement) significative (si différentes et que celle du groupe témoin est plus faible)
  • n groupes
  • variable quant doit être distribuée normalement

Variances

  • variance totale : VT
  • variance intragroupe (non expliquée) : VNE
  • vairance intergroupe (expliquée) : VE
  • vérification
    • VT = VNE + VE

Une ANOVA qui fonctionne :

  • ressemblance dans un groupe
  • dissemblance entre groupes

Coefficient de détermination

  • $n^2$

Interprétation

Résultats de l'ANOVA

  • $R²$
  • P

Test de F

Table de Fisher

  • 3 params
    • degré de liberté numérateur
    • degré de liberté dénominateur
    • seuil de signification

Test de Turkey

Test différences des moyennes 2 à 2

Boxplot

Représente ANOVA

  • ressemblance intragroupe si boîte est petite, resserée
  • dissemblance intergroupes si boîtes sont dispersées, pas à même hauteur (peu d'overlap)