Pourquoi la formule des probabilités totales fonctionne-t-elle ? L’idée est plus simple qu’il n’y paraît : dès qu’une situation se décompose en plusieurs cas disjoints, on peut « découper » la probabilité cherchée en morceaux, puis les additionner. Cette page t’explique pourquoi ce principe marche, te donne la formule rigoureuse et la méthode pas à pas, puis te propose 5 exercices corrigés progressifs. Niveau : Première / Terminale (avec une touche de rigueur prépa).

Navigation — Chapitre Probabilités


Comprendre l’idée : pourquoi « additionner les cas » fonctionne

Imagine que tu dois calculer la probabilité d’un événement \(A\), mais que l’expérience se déroule en plusieurs scénarios possibles : machine 1 ou 2, urne A ou B, malade ou sain… L’astuce est de découper \(A\) en morceaux qui ne se chevauchent pas, puis de sommer leurs probabilités.

Principe intuitif

Si les cas \(B_1, B_2, \dots, B_n\) couvrent toutes les possibilités et ne se chevauchent jamais, alors l’événement \(A\) se décompose en :

\(A = (A \cap B_1) \cup (A \cap B_2) \cup \dots \cup (A \cap B_n)\)

Ces morceaux sont disjoints, donc leurs probabilités s’additionnent :

\(P(A) = P(A \cap B_1) + P(A \cap B_2) + \dots + P(A \cap B_n)\)

Exemple visuel. Une usine a deux machines \(M_1\) (60 % de la production) et \(M_2\) (40 %). On cherche \(P(D)\) = probabilité d’avoir une pièce défectueuse. Chaque pièce vient soit de \(M_1\), soit de \(M_2\) — c’est une partition naturelle. On additionne la contribution de chaque machine :

\(P(D) = P(D \cap M_1) + P(D \cap M_2)\)

Si l’on connaît les probabilités conditionnelles \(P(D \mid M_1) = 0{,}01\) et \(P(D \mid M_2) = 0{,}03\), chaque morceau se calcule comme un produit :

\(P(D) = 0{,}01 \times 0{,}6 + 0{,}03 \times 0{,}4 = 0{,}006 + 0{,}012 = 0{,}018\)

C’est exactement ce que donne la formule des probabilités totales. Le reste de cette page formalise cette idée et t’entraîne à l’appliquer.


Etape 1 : identifier la partition (système complet d’événements)

Le point clé (et la source n° 1 d’erreurs) est la partition. Une partition est une liste d’événements \(B_1, \dots, B_n\) qui « découpe » l’univers en cas distincts.

Définition — Partition (système exhaustif)

Les événements \(B_1, \dots, B_n\) forment une partition de l’univers \(\Omega\) si :

  • Ils sont deux à deux disjoints : pour \(i \neq j\), \(B_i \cap B_j = \emptyset\).
  • Ils sont exhaustifs : \(\bigcup_{i=1}^{n} B_i = \Omega\).

En pratique, la partition vient très souvent du premier choix ou de la première cause décrite dans l’énoncé :

  • « Le produit vient de l’usine 1, 2 ou 3 » → \((B_1, B_2, B_3)\).
  • « On choisit une urne A ou B » → \((U_A, U_B)\).
  • « La personne est malade ou non » → \((M, \overline{M})\).

Vérifier une partition : ce qu'il faut contrôler
Condition Question à se poser Test rapide
Disjoints Deux cas peuvent-ils arriver en même temps ? Si oui → pas une partition
Exhaustifs Ai-je oublié un cas possible ? « Et sinon, il se passe quoi ? »
Probabilités des cas Ai-je \(P(B_i)\) pour chaque cas ? La somme \(\sum P(B_i)\) doit valoir \(1\)
Conditionnelles Ai-je \(P(A \mid B_i)\) (ou \(P(A \cap B_i)\)) ? Sans ça, impossible d’appliquer la formule

Remarque de rigueur : si pour un certain \(i\), on a \(P(B_i) = 0\), l’écriture avec \(P(A \mid B_i)\) n’a pas de sens (conditionnelle non définie). En revanche, l’écriture avec les intersections \(P(A \cap B_i)\) reste toujours valable (voir la démonstration).


Etape 2 : écrire la formule (les deux écritures indispensables)

La loi des probabilités totales se retient très bien si tu connais ses deux écritures. Elles sont équivalentes, mais selon l’énoncé, l’une est parfois plus naturelle que l’autre.

Formule des probabilités totales (2 écritures)

Si \((B_1, \dots, B_n)\) est une partition de \(\Omega\), alors pour tout événement \(A\) :

(1) Somme des intersections :

\(P(A) = \sum_{i=1}^{n} P(A \cap B_i)\)

(2) Somme des conditionnelles × a priori (si \(P(B_i) \neq 0\)) :

\(P(A) = \sum_{i=1}^{n} P(A \mid B_i)\,P(B_i)\)

L’écriture (2) vient de l’identité (si \(P(B_i) \neq 0\)) : \(P(A \cap B_i) = P(A \mid B_i)\,P(B_i)\).

Ce que tu dois savoir faire « sans réfléchir »

  • Identifier \(A\) (l’événement final demandé).
  • Choisir une partition \((B_i)\) qui représente les « cas ».
  • Écrire \(P(A) = \sum P(A \mid B_i)\,P(B_i)\) (ou \(\sum P(A \cap B_i)\)).

Pour les autres formules classiques (union, intersection, complément), consulte : Formules de probabilités. Ici, on se concentre uniquement sur la probabilité totale.

Côté vocabulaire, tu rencontreras (selon les manuels) : formule, loi ou théorème des probabilités totales. On parle aussi de système exhaustif ou de système complet d’événements : ce sont des synonymes pour dire « on a bien listé tous les cas possibles ».


Etape 3 : lire la formule sur un arbre pondéré

On associe très souvent la probabilité totale à l’arbre pondéré, car en pratique l’arbre est une représentation visuelle parfaite d’une partition.

Sur un arbre, la règle est :

  • Sur un chemin : on multiplie les probabilités.
  • Pour obtenir un événement : on additionne les chemins compatibles.

Si le premier niveau de l’arbre correspond aux cas \((B_1, \dots, B_n)\), alors les chemins « qui mènent à \(A\) » donnent exactement :

\(P(A) = P(B_1)\,P(A \mid B_1) + \cdots + P(B_n)\,P(A \mid B_n)\)

Construire et lire un arbre

Pour apprendre à construire et lire un arbre proprement (avec des exercices dédiés), voir : Arbre de probabilité : méthode et exercices.


Démonstration rigoureuse de la formule

La preuve formelle reprend exactement l’idée intuitive de la section 1 : une partition permet de « découper » \(A\) en morceaux disjoints.

Preuve (écriture par intersections)

Si \((B_1, \dots, B_n)\) est une partition, alors les événements \(A \cap B_1, \dots, A \cap B_n\) sont deux à deux disjoints et :

\(A = \bigcup_{i=1}^{n} (A \cap B_i)\)

Comme il s’agit d’une union disjointe, on obtient :

\(P(A) = \sum_{i=1}^{n} P(A \cap B_i)\)

Ensuite, si \(P(B_i) \neq 0\), on peut écrire \(P(A \cap B_i) = P(A \mid B_i)\,P(B_i)\) (par définition de la probabilité conditionnelle), ce qui donne l’écriture conditionnelle : \(P(A) = \sum_{i=1}^{n} P(A \mid B_i)\,P(B_i)\).

Cas \(P(B_i) = 0\)

Si \(P(B_i) = 0\), alors forcément \(P(A \cap B_i) = 0\) (car \(A \cap B_i \subset B_i\)). Donc l’écriture par intersections fonctionne toujours. L’écriture avec \(P(A \mid B_i)\) se comprend alors comme une somme sur les indices où \(P(B_i) \neq 0\).


Exemples corrigés (contextes classiques)

On travaille sur des contextes très proches de ce que tu vois dans les sujets : industrie (défauts), tests médicaux, urnes. L’objectif : savoir modéliser vite et sans erreur.

Exemple 1 — Contrôle qualité (défauts)

Une usine produit des pièces avec deux machines. La machine \(M_1\) fabrique 60 % des pièces et la machine \(M_2\) fabrique 40 %. On sait que \(P(D \mid M_1) = 0{,}01\) et \(P(D \mid M_2) = 0{,}03\), où \(D\) = « pièce défectueuse ». Calculer \(P(D)\).

Solution. Les cas \(M_1\) et \(M_2\) forment une partition. Donc :

\(P(D) = P(D \mid M_1)\,P(M_1) + P(D \mid M_2)\,P(M_2)\)
\(P(D) = 0{,}01 \times 0{,}6 + 0{,}03 \times 0{,}4 = 0{,}006 + 0{,}012 = 0{,}018\)

Donc \(P(D) = 0{,}018\), soit 1,8 %.

Exemple 2 — Test de dépistage (probabilité d’un résultat positif)

Dans une population, 2 % des personnes ont la maladie \(S\). Le test est positif avec probabilité \(P(+ \mid S) = 0{,}95\) (sensibilité), et il est positif avec probabilité \(P(+ \mid \overline{S}) = 0{,}03\) (faux positif). Calculer \(P(+)\).

Solution. La partition naturelle est \((S, \overline{S})\). On a \(P(S) = 0{,}02\) et \(P(\overline{S}) = 0{,}98\).

\(P(+) = P(+ \mid S)\,P(S) + P(+ \mid \overline{S})\,P(\overline{S})\)
\(P(+) = 0{,}95 \times 0{,}02 + 0{,}03 \times 0{,}98 = 0{,}019 + 0{,}0294 = 0{,}0484\)

Donc \(P(+) = 0{,}0484\), soit 4,84 %.

(Pour \(P(S \mid +)\), on utilise la formule de Bayes.)

Exemple 3 — Urnes (choix d’une urne puis tirage)

On choisit une urne : \(U_1\) avec probabilité \(\displaystyle\frac{1}{3}\) et \(U_2\) avec probabilité \(\displaystyle\frac{2}{3}\). Dans \(U_1\), il y a 2 boules rouges et 1 bleue, donc \(P(R \mid U_1) = \displaystyle\frac{2}{3}\). Dans \(U_2\), il y a 1 rouge et 3 bleues, donc \(P(R \mid U_2) = \displaystyle\frac{1}{4}\). Calculer \(P(R)\).

Solution. La partition est \((U_1, U_2)\). Donc :

\(P(R) = P(R \mid U_1)\,P(U_1) + P(R \mid U_2)\,P(U_2) = \displaystyle\frac{2}{3} \times \displaystyle\frac{1}{3} + \displaystyle\frac{1}{4} \times \displaystyle\frac{2}{3}\)
\(P(R) = \displaystyle\frac{2}{9} + \displaystyle\frac{1}{6} = \displaystyle\frac{4}{18} + \displaystyle\frac{3}{18} = \displaystyle\frac{7}{18}\)


Probabilités totales ou Bayes : comment choisir la bonne formule

C’est une confusion très fréquente : on mélange probabilité totale et Bayes. La bonne nouvelle : il existe un critère simple pour trancher en 10 secondes.

Règle de décision

  • Tu cherches une probabilité globale \(P(A)\) à partir de cas \(B_i\) → probabilités totales.
  • Tu cherches une probabilité « à l’envers » du type \(P(B_i \mid A)\) → Bayes (à partir de \(P(A \mid B_i)\) et \(P(B_i)\)).

Choisir la bonne formule en 10 secondes
Question posée Formule adaptée Indicateur dans l’énoncé
« Quelle est la proba d’avoir un test positif ? » Probabilités totales On additionne des cas (malade / pas malade)
« Sachant que le test est positif, quelle est la proba d’être malade ? » Bayes On conditionne par un résultat observé
« Quelle est la proba d’avoir un défaut au global ? » Probabilités totales Plusieurs sources (machines / fournisseurs)
« Sachant un défaut, de quelle machine vient la pièce ? » Bayes On « remonte » de l’effet à la cause

Attention — Confusion fréquente en contrôle

Si l’énoncé dit « sachant que… » et que la condition porte sur un résultat observé (test positif, pièce défectueuse), il faut Bayes, pas les probabilités totales. En pratique, les exercices type bac enchaînent souvent les deux : d’abord les probabilités totales pour calculer \(P(A)\), puis Bayes pour « inverser ».

Pour consolider la notion de probabilité conditionnelle (indispensable avant Bayes), passe par la page dédiée.


Exercices corrigés : entraînement gradué

Objectif : automatiser la méthode « partition → formule → calcul ». Les exercices sont volontairement progressifs.

Niveau 1 — Application directe (partition donnée)

Exercice 1. Un site web reçoit du trafic depuis trois sources : \(S_1\) (50 %), \(S_2\) (30 %), \(S_3\) (20 %). La probabilité qu’un visiteur s’inscrive est : \(P(I \mid S_1) = 0{,}04\), \(P(I \mid S_2) = 0{,}02\), \(P(I \mid S_3) = 0{,}01\). Calculer \(P(I)\).

▶ Voir la correction

La partition est \((S_1, S_2, S_3)\). Donc :

\(P(I) = \sum_{k=1}^{3} P(I \mid S_k)\,P(S_k) = 0{,}04 \times 0{,}5 + 0{,}02 \times 0{,}3 + 0{,}01 \times 0{,}2\)

\(P(I) = 0{,}02 + 0{,}006 + 0{,}002 = 0{,}028\). Donc \(P(I) = 0{,}028\), soit 2,8 %.


Exercice 2. Une élève prend le bus \(B\) avec probabilité \(0{,}7\) et le tram \(T\) avec probabilité \(0{,}3\). Si elle prend le bus, elle est en retard avec probabilité \(0{,}10\). Si elle prend le tram, elle est en retard avec probabilité \(0{,}04\). Calculer la probabilité qu’elle soit en retard.

▶ Voir la correction

Partition : \((B, T)\). Donc :

\(P(R) = P(R \mid B)\,P(B) + P(R \mid T)\,P(T) = 0{,}10 \times 0{,}7 + 0{,}04 \times 0{,}3 = 0{,}07 + 0{,}012 = 0{,}082\)

Donc \(P(R) = 0{,}082\), soit 8,2 %.

Niveau 2 — Trouver la partition (modéliser avant de calculer)

Exercice 3. Dans une boîte, 40 % des ampoules viennent du fournisseur \(F_1\) et 60 % du fournisseur \(F_2\). Une ampoule est « longue durée » \(L\) avec probabilité \(0{,}8\) si elle vient de \(F_1\) et avec probabilité \(0{,}6\) si elle vient de \(F_2\). Calculer \(P(L)\).

▶ Voir la correction

Le bon découpage est par fournisseur : partition \((F_1, F_2)\).

\(P(L) = P(L \mid F_1)\,P(F_1) + P(L \mid F_2)\,P(F_2) = 0{,}8 \times 0{,}4 + 0{,}6 \times 0{,}6 = 0{,}32 + 0{,}36 = 0{,}68\)

Niveau 3 — Arbre puis formule (lecture des chemins)

Exercice 4. Une entreprise a deux services : \(A\) (55 %) et \(B\) (45 %). Dans le service \(A\), 3 % des dossiers contiennent une erreur ; dans \(B\), 6 %. On note \(E\) : « dossier avec erreur ». Calculer \(P(E)\).

▶ Voir la correction

On peut voir un arbre avec premier niveau \((A, B)\). Chaque chemin vers \(E\) donne \(P(A)\,P(E \mid A)\) et \(P(B)\,P(E \mid B)\).

\(P(E) = 0{,}03 \times 0{,}55 + 0{,}06 \times 0{,}45 = 0{,}0165 + 0{,}027 = 0{,}0435\)

Donc \(P(E) = 0{,}0435\), soit 4,35 %.

Niveau 4 — « Frontière » vers Bayes

Exercice 5. Dans une population, \(P(S) = 0{,}01\). Un test est positif avec probabilité \(P(+ \mid S) = 0{,}99\) et \(P(+ \mid \overline{S}) = 0{,}05\).

  1. Calculer \(P(+)\).
  2. Bonus : quelle formule faut-il utiliser pour calculer \(P(S \mid +)\) ?
▶ Voir la correction

(1) Partition : \((S, \overline{S})\), avec \(P(\overline{S}) = 0{,}99\). Donc :

\(P(+) = P(+ \mid S)\,P(S) + P(+ \mid \overline{S})\,P(\overline{S}) = 0{,}99 \times 0{,}01 + 0{,}05 \times 0{,}99 = 0{,}0099 + 0{,}0495 = 0{,}0594\)

Donc \(P(+) = 0{,}0594\) (5,94 %).

(2) Bonus : pour \(P(S \mid +)\), on utilise la formule de Bayes (probabilité « à l’envers »).

Pour encore plus d’entraînement : Exercices de probabilités corrigés (tous niveaux).


Erreurs fréquentes et pièges classiques

Les 5 pièges sur la formule des probabilités totales

  • Inversion conditionnelle : confondre \(P(A \mid B)\) et \(P(B \mid A)\). La probabilité totale calcule \(P(A)\), pas \(P(B \mid A)\). Pour « inverser », il faut Bayes.
  • Partition non disjointe : deux cas se recouvrent (ex. « machine 1 » et « pièce rouge » ne sont pas des cas du même type).
  • Partition non exhaustive : un cas oublié (la somme des \(P(B_i)\) ne fait pas \(1\)).
  • Probabilités manquantes sur un arbre : les probabilités sortantes d’un nœud doivent sommer à \(1\).
  • Confusion conditionnelle / produit : \(P(A \cap B) = P(A \mid B)\,P(B)\), mais seulement si \(P(B) \neq 0\).

Conseil de méthode : dès que tu hésites, reviens à l’écriture la plus « sûre » : \(P(A) = \sum P(A \cap B_i)\). Elle force à clarifier la partition, et elle évite beaucoup de confusions.


Questions fréquentes sur la loi des probabilités totales


C'est quoi la loi des probabilités totales ?

C’est une formule qui permet de calculer la probabilité d’un événement \(A\) quand l’expérience se décompose en plusieurs cas \(B_1, \dots, B_n\) (une partition). On additionne les contributions de chaque cas : \(P(A) = \sum P(A \mid B_i)\,P(B_i)\).

Quand utiliser la formule des probabilités totales ?

Dès que l’énoncé mentionne « plusieurs cas », « plusieurs sources », « plusieurs machines/fournisseurs/populations » et qu’on te demande une probabilité globale \(P(A)\). Le signal : tu as des probabilités conditionnelles \(P(A \mid B_i)\) pour chaque cas, et tu dois les combiner.

Loi, formule et théorème des probabilités totales : c'est la même chose ?

Oui, dans l’usage courant c’est la même idée. Les manuels varient entre « loi », « formule » et « théorème ». On parle aussi de « système exhaustif » ou « système complet d’événements ».

Quelle différence entre probabilités totales et formule de Bayes ?

Les probabilités totales calculent \(P(A)\) (une probabilité globale à partir de cas). Bayes calcule \(P(B_i \mid A)\) (« à l’envers » : quelle cause sachant le résultat). En pratique, on utilise souvent les probabilités totales puis Bayes dans le même exercice.

Peut-on appliquer la probabilité totale si les événements ne sont pas disjoints ?

Non, pas sous cette forme. La condition « disjoints » est essentielle, sinon on compte deux fois certains cas. Si tes cas se recouvrent, il faut d’abord reconstruire une vraie partition.

Faut-il un arbre pondéré pour appliquer la formule ?

Non. L’arbre est un outil très pratique pour visualiser la partition et les conditionnelles, mais la formule se suffit à elle-même. Si l’arbre t’aide à éviter les erreurs, utilise-le.



Pour aller plus loin

Tu maîtrises maintenant la loi des probabilités totales. Pour approfondir :

Tu veux progresser plus vite en probabilités ? Découvre les cours particuliers Excellence Maths pour la Terminale, dispensés par des professeurs diplômés de Polytechnique.