L’espérance conditionnelle est la moyenne attendue d’une variable aléatoire lorsque l’information disponible est partielle. Elle se note E[X|G] ou E[X|Y] et se définit via une partition ou une sigma-algèbre G. Cet outil permet de décomposer un calcul probabiliste en fonction d’observations intermédiaires, utile dans les exercices de probabilité et les modèles stochastiques rencontrés en concours. L’article propose une présentation claire, des formules explicites et des exemples concrets pour s’entraîner rapidement.
Espérance conditionnelle : définition et cadre d’utilisation
Définition : soit X une variable aléatoire réelle et G une partition de l’espace des événements. L’espérance conditionnelle de X par rapport à G est la variable aléatoire E[X|G] définie par
EX|G = ∑i E[X|Ai] 1_{Ai}(ω),
où Ai sont les éléments de la partition et 1_{Ai} est la fonction indicatrice de Ai. Autrement dit, E[X|G] est la meilleure moyenne de X compte tenu de l’information détaillée par G.
Pour Y une variable aléatoire, E[X|Y] signifie la moyenne de X conditionnelle à la valeur observée de Y. En cas discret, cela revient à E[X|Y=y] calculé via la distribution conditionnelle p_{X|Y}(x|y).
- Générer une partition Ai de l’espace des situations observables.
- Calculer E[X|Ai] pour chaque ai.
- Former EX|G comme une somme pondérée par les indicatrices 1_{Ai}(ω).
- Utiliser la moyenne conditionnelle lorsque l’information est Y, puis récupérer E[X] par la loi de l’espérance totale.
Exemple numérique concret :
Si X prend les valeurs {1, 2, 3} avec P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3 et Y = 1 si X∈{1,2}, Y = 2 si X=3, alors
- P(Y=1)=0.7, P(Y=2)=0.3
- E[X|Y=1] = (1·0.2 + 2·0.5)/0.7 = 1.2/0.7 = 12/7
- E[X|Y=2] = 3
- Donc E[X|Y] = {12/7 si Y=1; 3 si Y=2}
Dans le cadre continuous, E[X|G] est une variable mesurable par G et satisfait les propriétés suivantes, qui seront utiles en concours :
- Linéarité : E[aX + bZ|G] = a E[X|G] + b E[Z|G].
- Loi de l’Espérance Totale : E[ E[X|G] ] = E[X].
- Indépendance : si X est indépendant de G, alors E[X|G] = E[X].
- Invariance sur A : pour tout A ∈ G, E[X 1_A | G] = 1_A E[X|G].
Notions clés et notations
Pour une variable X réelle discrète, XΩ = {xk}. Si B est un événement de probabilité non nulle, on a
E[X|B] = ∑k xk P_B(X=xk),
et en notation plus générale, E[X|Y] est utilisé lorsque Y est une variable aléatoire et E[X|G] lorsque G est une partition ou une sigma-algèbre.
Les propriétés et les formules ci-dessous guident les calculs en DS et en examen :
- Espérance Mathématique E[X] = ∑i x_i p_i (cas discret) ou ∫ x f_X(x) dx (cas continu).
- Espérance Conditionnelle E[X|Y] est une variable qui dépend de Y et reflète l’information fournie par Y.
- Relation clé : E[X] = E[ E[X|Y] ], grâce à l’espérance totale lorsque Y est une variable.
- Formules pratiques : calculer les distributions conditionnelles puis les espérances conditionnelles sur chaque cas.
Exemple central entièrement résolu
Considérons X discrète avec P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3 et Y = 1 si X∈{1,2}, Y = 2 si X=3.
Calculs :
- P(Y=1)=0.7, P(Y=2)=0.3
- E[X|Y=1] = (1·0.2 + 2·0.5)/0.7 = 12/7
- E[X|Y=2] = 3
- E[X|Y] = {12/7 si Y=1; 3 si Y=2}
Cette méthode illustre l’usage concret des probabilités conditionnelles et de l’intégrale lorsque nécessaire. En contexte de concours, elle permet de décomposer les calculs et d’obtenir rapidement la fonction contrôle E[X|Y].
Propriétés essentielles de l’espérance conditionnelle
Les propriétés suivantes sont indispensables en maths et en probabilité pour les exos et les oraux. Elles s’appliquent aussi bien aux variables discrètes qu’aux variables continues, avec les notations E[X|G] et E[X|Y].
- Linéarité : E[aX + bZ | G] = a E[X|G] + b E[Z|G].
- Loi de l’Espérance Totale : E[ E[X|G] ] = E[X].
- Indépendance : si X est indépendant de G, alors E[X|G] = E[X].
- Invariance sur les événements : pour tout A ∈ G, E[X 1_A | G] = 1_A E[X|G].
Calcul pratique : pour une distribution jointe P(X, Y), calculer la distribution conditionnelle P(X|Y) puis E[X|Y] comme moyenne par valeur de Y. Utiliser les formules d’intégration ou des sommes selon le cadre discret/continu.
Exemple discret rapide : si P(X=1, Y=A)=0.2, P(X=2, Y=A)=0.3, P(X=3, Y=A)=0.0 et P(X=1, Y=B)=0.1, P(X=2, Y=B)=0.4, P(X=3, Y=B)=0.0, alors
- P(Y=A)=0.5, P(Y=B)=0.5
- E[X|Y=A] = (1·0.2 + 2·0.3)/0.5 = 0.2 + 0.6 / 0.5 = 1.6
- E[X|Y=B] = (1·0.1 + 2·0.4)/0.5 = 0.1 + 0.8 / 0.5 = 1.8
- Ainsi E[X|Y] = 1.6 pour Y=A et 1.8 pour Y=B.
Exercice type (corrigé bref)
Énoncé : soit X discret avec P(X=1)=0.4, P(X=2)=0.4, P(X=3)=0.2. Définir Y = 1 si X∈{1,2}, Y = 2 si X=3. Calculer E[X|Y].
Corrigé bref :
- P(Y=1)=0.8, P(Y=2)=0.2.
- E[X|Y=1] = (1·0.4 + 2·0.4)/0.8 = 1.2/0.8 = 3/2.
- E[X|Y=2] = 3.
- Donc E[X|Y] = {3/2 si Y=1; 3 si Y=2}.
À retenir
À retenir :
- L’espérance conditionnelle Espérance conditionnelle est notée E[X|G] ou E[X|Y] et dépend de l’information fournie.
- En forme discrète, E[X|Y=y] se calcule via les probabilités conditionnelles et la moyenne sur la distribution de X donnée Y.
- Les propriétés clés incluent linéarité, loi de l’espérance totale, et le cas d’indépendance.
- Pour les calculs pratiques, déterminer d’abord les distributions conditionnelles, puis former les moyennes conditionnelles par valeur de Y.
- Utiliser l’espérance conditionnelle dans les probabilités et les processus stochastiques, notamment les chaines de Markov et les modèles de décision sous incertitude.
- Les formules s’écrivent sans approximation et se transposent aussi bien au cadre discret qu’au cadre continu sous les notations appropriées.
