Analyse de risques : Identification et estimation : Outils quantitatifs d'estimation de risques
CoursOutils transverses

Tests de conformité

Fondamental :

Les tests de conformité permettent de juger de la recevabilité d'une hypothèse concernant le plus souvent la loi de distribution supposée suivie par une population de données. L'hypothèse est émise avec une certaine probabilité de n'être pas recevable : si la probabilité effective de non vérification de l'hypothèse est supérieure à , cela signifie que rien ne s'oppose à accepter l'hypothèse, sans toutefois montrer qu'elle constitue une information certaine. Dans le cas contraire il vaut mieux rejeter l'hypothèse comme trop incertaine à traduire la réalité observée.

Test du khi2

Ce test est souvent employé car il est applicable à tous types supposés de loi de distribution. Après avoir établi l'histogramme des données mesurées {x1,..,xn} selon k classes (pas forcément régulières) avec un effectif minimal pour la classe la moins nombreuse compris entre 5 et 10, on détermine la quantité

où ni est l'effectif de la ième classe, n le nombre total de mesures et pi la probabilité théorique d'appartenance de X à la ième classe, qui dépend de la loi supposée suivie par X. La quantité suit la loi du khi2 à (k-1-c) degrés de liberté, avec c le nombre de contraintes imposées : si l'on suppose que la moyenne et la variance théoriques sont connues, alors c=2. On détermine ensuite la valeur de la variable suivant cette loi du khi2 dont la probabilité de dépassement est égale à . Si  est inférieure à , on peut accepter l'hypothèse à un risque effectif supérieur à , sinon il y a lieu de s'interroger sur la vraisemblance de l'hypothèse. Dans la pratique, varie de 0,1 à 0,2.

Exemple : Exemple 5

On propose de modéliser la distribution des données de l'Exemple 4 selon une loi normale ou une loi lognormale. L'histogramme suivant montre la répartition des données sur des classes régulières (en mm). Les classes ont été réunies pour présenter un effectif compris entre 5 et 10 valeurs.

  • Dans le cas A (n=470) et une hypothèse de loi normale, la valeur du khi2 est 30 avec une probabilité de dépassement de 12,5% pour 22 degrés de liberté (c=0), donc la vraisemblance de l'hypothèse est acceptable au risque 10%.

  • Dans le cas A (n=470) et une hypothèse de loi lognormale, la valeur du khi2 est 122 avec une probabilité de dépassement de 7x10-11, donc la vraisemblance de l'hypothèse doit être rejetée.

  • Dans le cas B (n=47) et une hypothèse de loi normale, la valeur du khi2 est 12 avec une probabilité de dépassement de 6,2% pour 6 degrés de liberté (c=0), donc la vraisemblance de l'hypothèse est acceptable au risque 5%, mais doit être rejetée au risque 10%. Il serait donc raisonnable de la rejeter.

  • Dans le cas B (n=47) et une hypothèse de loi lognormale, la valeur du khi2 est 31 avec une probabilité de dépassement de 2x10-5, donc la vraisemblance de l'hypothèse doit être rejetée.

Figure 6 : Histogramme de l'exemple 5.
Figure 6 : Histogramme de l'exemple 5.[Zoom...]

Test de Kolgomorov

Le test de Kolgomorov est plus simple à mettre en œuvre que le test du khi2. Après avoir établi les valeurs de la fréquence cumulée PX* des données mesurées {x1,...,xn} selon k classes, on détermine la quantité

où PX(xi) est la fonction de répartition théorique pour la ième classe. On montre que tend vers lorsque n augmente. Si l'on pose , représente la probabilité de trouver un écart maximal entre les fonctions de répartition supposée et expérimentale supérieur à l'écart observé. Si est petite (de l'ordre de 0,05 à 0,1), cela signifie que l'hypothèse n'est pas compatible avec les données observées.

Complément :

Ouvrages généraux :

Saporta G. "Probabilités, analyse des données et statistiques", Editions Technip, 2006.

Mansour A. "Probabilités et statistiques pour les ingénieurs", Editions Hermes, 2007.

Actualisation des paramètres d'une loi de distribution (page suivante)Analyse de données (page Précédente)
AccueilImprimerRéalisé avec SCENARI