Notes sur les plans d'expérience - 1° partie, Notes de Ingénierie unifiée avancée
Christophe
Christophe13 January 2014

Notes sur les plans d'expérience - 1° partie, Notes de Ingénierie unifiée avancée

PDF (122.8 KB)
10 pages
882Numéro de visites
Description
Notes d'ingénierie sur les plans d'expérience - 1° partie Les principaux thèmes abordés sont les suivants: Le comportement des produits industriels, Les plans d'expériences, Les trois grandes familles de plans d'expérien...
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 10
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Le comportement des produits industriels est généralement fonction de nombreux phénomènes, souvent

dépendants les uns des autres. Pour prévoir ce comportement, le produit et les phénomènes sont

modélisés, et des simulations sont effectuées. La pertinence des résultats des simulations dépend

évidemment de la qualité des modèles.

En particulier, dans le cadre de la conception ou reconception d'un produit, les modèles font généralement

intervenir un certain nombre de grandeurs physiques (paramètres) que l'on s'autorise à modifier. Le

comportement des produits industriels est généralement fonction de nombreux phénomènes, souvent

dépendants les uns des autres. Pour prévoir ce comportement, le produit et les phénomènes sont

modélisés, et des simulations sont effectuées.

Or, ces essais sont coûteux, et ce d'autant plus que le nombre de paramètres à faire varier est important.

En effet, la modification d'un paramètre peut par exemple exiger un démontage et un remontage du

produit, ou bien la fabrication de plusieurs prototypes différents (cas d'une pièce produite en série), ou

encore l'interruption de la production pour changer d'outil (cas d'un process de fabrication)... Le coût

d'une étude expérimentale dépend donc du nombre et de l'ordre des essais effectués.

L'idée consiste alors à sélectionner et ordonner les essais afin d'identifier, à moindres coûts, les effets des

paramètres sur la réponse du produit. Il s'agit de méthodes statistiques faisant appel à des notions

mathématiques simples le plus souvent. La mise en oeuvre de ces méthodes comporte trois étapes :

1. Postuler un modèle de comportement du système (avec des coefficients pouvant être inconnus)

2. Définir un protocole d'expérience, c'est-à-dire une série d'essais permettant d'identifier les coefficients

du modèle

3. Faire les essais, identifier les coefficients et conclure.

Les plans d'expériences ("Design of Experiment" (D.O.E.) en anglais abrégés PEX en français) permettent

d'organiser au mieux les essais qui accompagnent une recherche scientifique ou des études industrielles.

Ils sont applicables à de nombreuses disciplines et à toutes les industries à partir du moment où l'on

recherche le lien qui existe entre une grandeur d'intérêt, y (quantité de rebus, défauts, détections,

amplitude, etc.), et des variables dans un but d'optimisation. Raison pour laquelle il existe des logiciels

pour les traiter comme MiniTab ou principalement JMP pour ne citer que les plus connus.

Indiquons également que les plans d'expérience sont un des pilier de la chimiométrie (outils

mathématiques, en particulier statistiques, pour obtenir le maximum d'informations à partir des données

chimiques).

Il existe trois grandes familles de plans d'expériences:

1. Les "plans de criblages": dont l'objectif est de découvrir les facteurs les plus influents sur une réponse

donnée en un minimum d'expériences. C'est la plus simples des familles car proche de l'intuition

expérimentale (elle est parfois considérée comme une sous-famille de la deuxième famille).

2. Les "plans de modélisation": dont l'objectif est de trouver la relation mathématique qui lie les réponses

mesurées aux variables associés aux facteurs soit via une démarche mathématique analytique ou

purement matricielle. Les plans factoriels complets et fractionnaires (2 niveaux par facteurs avec modèles

linéaires) ainsi que les plans pour surfaces de réponse (au moins 3 niveaux par facteurs avec modèles du

second degré) font partie de cette famille.

3. Les "plans de mélange": dont l'objectif est le même que la deuxième famille mais où les facteurs ne sont

pas indépendants et sont contraints (par exemple leur somme/ ou leur rapport doit être égale à une

certaine constante).

Le principe global se base sur le fait que l'étude d'un phénomène peut, le plus souvent, être schématisé de

la manière suivante : nous nous intéressons à une grandeur, y qui dépend d'un grand nombre de

variables, (et leur ordre n'a pas d'influence... ce qui est par contre problématique en

chimie...).

La modélisation mathématique consiste à trouver une fonction f telle que:

(239)

qui prenne en compte l'influence de chaque facteur seul ou des facteurs combinés (interactions). Cette

fonction est donc déterministe (la réponse dépend uniquement des facteurs sans aucune incertitude

possible, ce qui revient à ignorer les bruits tels que les erreurs de mesure) et invariant (le comportement

n'évolue pas au cours du temps).

Une méthode classique d'étude consiste en la mesure de la réponse y pour plusieurs valeurs de la

variable tout en laissant fixe la valeur des (n-1) autres variables. Nous itérons alors cette méthode pour

chacune des variables.

Ainsi, par exemple, si nous avons 8 variables et si l'on décide de donner 2 valeurs expérimentales à

chacune d'elles, nous sommes conduits à effectuer expériences.

Ce nombre élevé dépasse les limites de faisabilité tant en temps qu'en coût. Il faut donc réduire le nombre

d'expériences à effectuer sans pour autant perdre sur la qualité des résultats recherchés.

L'utilisation d'un plan d'expérience donne alors une stratégie dans le choix des méthodes

d'expérimentation. Le succès des plans d'expériences dans la recherche et l'industrie est lié au besoin de

compétitivité des entreprises : ils permettent une amélioration de la qualité et une réduction des coûts.

Remarque: La méthode des plans d'expériences a été mise au point au début du siècle, dans les

années 1920, par Ronald A. Fisher (celui du Test de Fisher). Elle a pris un essor considérable

avec le développement de l'informatique et la puissance de calcul qui l'accompagne.

Le traitement des résultats se fait enfin à l'aide de la régression linéaire simple ou multiple et l'analyse de

variance.

Avec les plans d'expériences, le but est donc d'obtenir le maximum de renseignements (mais pas tous!)

avec le minimum d'expériences (et donc le minimum de coût) dans le but de modéliser ou d'optimiser des

phénomènes étudiés.

Un expérimentateur qui lance une étude s'intéresse à une grandeur qu'il mesure à chaque essai. Cette

grandeur s'appelle la "réponse", c'est la grandeur d'intérêt. La valeur de cette grandeur dépend de

plusieurs variables. Au lieu du terme "variable" on utilisera le mot "facteur". La valeur donnée à un facteur

pour réaliser un essai est appelée "niveau". Lorsqu'on étudie l'influence d'un facteur, en général, on limite

ses variations entre deux bornes (oui faut bien s'avoir s'arrêter un jour et être raisonnable...) appelées

respectivement: "niveau bas" et "niveau haut".

Bien évidemment, lorsque nous avons plusieurs facteurs ceux-ci représentent un point

dans appelé alors "espace expérimental".

L'ensemble de toutes les valeurs que peut prendre le facteur entre le niveau bas et le niveau haut,

s'appelle le "domaine de variation du facteur" ou plus simplement le "domaine du facteur". Nous avons

l'habitude de noter le niveau bas par -1 et le niveau haut par +1 pour des raisons d'approximation de

mathématiques car l'approche utilise un développement en série de MacLaurin autour de zéro! Ce n'est

donc pas une recommandation de procéder ainsi mais une obligation car les logiciels implémentent les

séries de MacLaurin!

Donc par exemple pour un facteur ayant un domaine de variation compris entre un niveau haut de 20 [°C]

correspond à +1 et un niveau bas de 5 [°C] correspondant à -1 nous devrons à la fin de notre étude

transformer toutes les valeurs expérimentales en "unités centrées réduites" dans lesquelles doivent être

utilisées les .

Ainsi, nous avons deux points d'entrée (20,5) et deux de sorties (+1,-1). Toute valeur intermédiaire est

donnée simplement par l'équation de la droite:

(240)

La pente est donc triviale à obtenir...., pour déterminer b, nous avons simplement une équation à une

inconnue:

(241)

ou (ce qui revient au même):

(242)

Donc le passage de variables non normalisées, notées x, aux normalisé, notées X, s'écrit alors:

(243)

soit dans un cas de sorties (+1,-1):

(244)

et inversement...:

(245)

soit dans un cas de sorties (+1,-1):

(246)

Le regroupement des domaines de tous les facteurs définit le "domaine d'étude". Ce domaine d'étude est

la zone de l'espace expérimental choisie par l'expérimentateur pour faire ses essais. Une étude, c'est-à-

dire plusieurs expériences bien définies, est représentée par des points répartis dans le domaine d'étude.

Par exemple, pour deux facteurs, le domaine d'étude est une surface et l'espace expérimental est :

(247)

Les niveaux représentent les coordonnées d'un point expérimental et y est la valeur de la réponse en

ce point. On définit un axe orthogonal à l'espace expérimental et on l'attribue à la réponse. La

représentation géométrique du plan d'expériences et de la réponse nécessite un espace ayant une

dimension de plus que l'espace expérimental. Un plan à deux facteurs utilise un espace à trois dimensions

pour être représenté : une dimension pour la réponse, deux dimensions pour les facteurs.

A chaque point du domaine d'étude correspond une réponse. A l'ensemble de tous les points du domaine

d'étude correspond un ensemble de réponses qui se localisent sur une surface appelée la "surface de

réponse" (raison pour laquelle ce domaien d'études est parfois appelé: "plans d'expérience pour

l'estimation de surfaces de réponse") par exemple avec des facteurs:

(248)

Le nombre et de l'emplacement des points d'expériences est le problème fondamental des plans

d'expériences. On cherche à obtenir la meilleure précision possible sur la surface de réponse tout en

limitant le nombre d'expériences!

L'ingénieur va souvent rechercher une fonction mathématique qui relie la réponse aux facteurs.

Pour cela, nous simplifions le problème en se rappelant (cf. chapitre de Suites et Séries) que toute fonction

quelque soit sont nombre de variables peut être approchée en une somme de série de puissance en un

point donné

Nous prenons alors un développement limité de la série de Taylor:

(249)

Soit autour de (ce que nous pouvons nous permettre car nous prenons toujours des

unités centrées réduites comme vues plus haut!), nous avons la série de MacLaurin au deuxième ordre et

en changeant de notation pour :

(250)

où y est donc la réponse et les les facteurs et les sont les coefficients du modèle

mathématique adopté a priori. Ils ne sont pas connus et doivent être calculés à partir des résultats des

expériences.

L'intérêt de modéliser la réponse par un polynôme est de pouvoir calculer ensuite toutes les réponses du

domaine d'étude sans être obligé de faire les expériences en passant par un modèle appelé "modèle

postulé" ou "modèle a priori".

Deux compléments doivent être apportés au modèle précédemment décrit:

1. Le premier complément est le "manque d'ajustement". Cette expression traduit le fait que le modèle a

priori est fort probablement différent (ne serait-ce que par l'approximation de l'approche) du modèle réel

qui régit le phénomène étudié. Il y a un écart entre ces deux modèles. Cet écart est le manque

d'ajustement ("lack of fit" en anglais).

2. Le second complément est la prise en compte de la nature aléatoire de la réponse (sans que cette

dernière soit toutefois stochastique sinon il faut utiliser d'autres outils!). En effet, si l'on mesure plusieurs

fois une réponse en un même point expérimental, on n'obtient pas exactement le même résultat. Les

résultats sont dispersés. Les dispersions ainsi constatées sont appelées "erreurs expérimentales".

Ces deux écarts, manque d'ajustement et erreur expérimentale, sont souvent réunis dans un seul écart,

notée e.

Le modèle utilisé par l'expérimentateur s'écrit alors au deuxième ordre et au premier degré (toujours dans

le cas particulier de deux facteurs!):

(251)

Remarques:

R1. Si nous prenons en compte les termes du deuxième degré, nous parlons alors de "modèle

quadratique complet".

R2. Si nous arrêtons le développement au premier ordre et au premier degré (sans interactions),

nous parlons alors de "modèle affine".

Dans la pratique nous notons cette dernière relation (nous enlevons le terme d'erreur):

(252)

où nous avons la notation abusive:

(253)

Ce modèle sans erreur est souvent appelé "modèle contrôlé avec interactions" (linéaire d'ordre 2).

Évidemment, plus le degré du polynôme utilisé est élevé plus nous avons, théoriquement, de chances

d'avoir un modèle proche de la réalité. Mais les polynômes de degré élevé réclament beaucoup de points

expérimentaux et leur validité peut vite diverger en dehors du domaine expérimental. Si l'étude l'exige,

nous préférons utiliser des fonctions mathématiques particulières pour mieux ajuster le modèle aux

résultats expérimentaux.

Cependant, en pratique, les interactions d'ordre élevé ont souvent une influence très faible sur la réponse

(bon cette affirmation dépend fortement du domaine d'activité...!). Il est donc possible de ne pas les

inclure dans le modèle, ce qui conduit à faire moins d'essais. Ce principe est utilisé dans la construction

de nombreux plans d'expériences, comme nous le verrons dans la partie suivante. Dans de nombreuses

applications, on obtient des résultats tout à fait satisfaisants en se limitant aux interactions doubles.

Pourquoi nous satisfaisons-nous de cette relation approchée de quatre termes? Pour la simple raison que:

1. La réponse peut être non nulle lorsque tous les facteurs sont nuls (c'est le premier coefficient )

2. La réponse dépend trivialement (intuitivement) de la somme des effets du premier et deuxième

facteurs de manière indépendante (coefficients ).

3. La réponse dépend aussi des interactions entre les deux facteurs (coefficients ).

Chaque point expérimental dont les sont données permet alors d'obtenir une valeur de la réponse y.

Cette réponse est modélisée par un polynôme dont les coefficients sont les inconnues qu'il faut

déterminer.

PLANS FACTORIELS COMPLETS

Donc dans un plan d'expérience de 2 facteurs à 2 niveaux, nous avons besoin d'au moins (et au plus pour

des raisons de coûts!) de 4 mesures pour avoir un système de quatre équations à quatre inconnues qui

sont les coefficients .

Remarque: Pour une étude de 2 facteurs à 3 niveaux, nous ne pouvons plus prendre le modèle

linéaire. Il nous faut alors prendre les termes quadratiques du développement de Taylor.

Dans la pratique, puisque pour chacun des facteurs nous devons nous fixer un niveau bas et un niveau

haut pour pouvoir travailler raisonnablement.... alors si nous avons deux facteurs, nous avons un espace

expérimental défini par 4 points {(haut, haut), (bas, bas), (haut, bas), (bas,haut)}, correspondant aux 2 fois

2 niveaux ( ), nous suffit pour permettre d'obtenir alors nos quatre équations à 4 inconnues et alors de

déterminer les 4 coefficients.

Ainsi, les points à prendre pour notre expérience correspondent naturellement aux sommets

(géométriquement parlant) de l'espace expérimental.

Nous avons alors le système d'équations:

(254)

ou explicitement écrit:

(255)

Il vient alors immédiatement ce que les ingénieurs dans le domaine, appellent les "effets moyens", des

différents facteurs:

(256)

où a un statut particulier car il représente la réponse théorique moyenne (au centre du domaine

d'étude).

Effectivement, si nous posons dans une ligne quelconque:

(257)

soit au centre du domaine [+1,-1] de chaque variable alors nous obtenons tout naturellement:

(258)

qui est donc la réponse de l'expérience au centre du domaine d'étude.

Soit sous forme matricielle:

(259)

Ce qui s'écrit de manière générale pour des modèles linéaires du deuxième ordre sous la forme générale

(cf. chapitre d'Algèbre Linéaire):

(260)

La matrice X contenant lignes est appelé "plan factoriel complet (PFC) 2n avec interactions" (le terme

"factoriel" venant du fait que tous les facteurs varient simultanément).

La matrice X dans la pratique est appelée "matrice d'expérimentation" ou encore "matrice des effets" et est

souvent représentée de la manière suivante dans le cas particulier précédent:

Essai n° Repos Facteur 1 Facteur 2 Facteur 12 Réponse

1

+1 -1 -1 +1

2 +1 +1 -1 -1

3 +1 -1 +1 -1

4 +1 +1 +1 +1

Tableau: 13 - Matrice d'expérimentation

Mais l'on voit tout de suite que dans la pratique la deuxième colonne (Repos) est inutile car elle vaut

toujours +1 et elle est implémentée de manière cachée dans les logiciels.

Il en est de même pour la cinquième colonne (Facteur 12) car elle se déduit automatiquement de la

troisième et quatrième colonne (c'est la multiplication des termes ligne par ligne... ce que certains

appellent la "multiplication de Box").

Remarque: Observez donc que la première colonne vaut toujours +1 et il y a toujours aussi une

ligne avec uniquement des +1!

Ainsi, dans la pratique (logiciels) et dans de nombreux ouvrages on représente à juste titre uniquement le

tableau suivant (ce qui masque le fait que nous avons affaire à une matrice carrée):

Essai n° Facteur 1 Facteur 2 Réponse

1 -1 -1

2 +1 -1

3 -1 +1

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome