Rédigé et vérifié par un professeur diplômé de l’École Polytechnique. Découvrir le professeur

Le sujet de Modélisation mathématique et informatique de la banque Agro-Véto BCPST 2026, d’une durée de 3 heures sans calculatrice, porte intégralement sur la notion de fonction génératrice d’une variable aléatoire à valeurs dans \(\mathbb{N}\). Le sujet est structuré en quatre parties : la première pose les fondations théoriques, les parties II, III et IV (indépendantes entre elles) développent des applications de complexité croissante — un modèle de sélection de jacinthes, un processus de branchement d’euglènes (type Galton-Watson), et un volet de tracé graphique avec estimation probabiliste. Le mélange de questions mathématiques et de complétion de code Python est omniprésent. La difficulté est globalement progressive, avec un cœur technique exigeant en partie III.

Synthèse du sujet
Partie du sujetThèmeNiveauNotions mobilisées
I — Notion de fonction génératrice (Q1–Q4)Propriétés fondamentales de \(G_X\)AccessibleSéries entières, convergence sur \([0,1]\), loi binomiale
II.A — Présentation du modèle (Q5–Q7)Modèle de jacinthes : sélection en deux étapesAccessibleLoi binomiale, simulation Python
II.B — Loi de \(J_2\) (Q8–Q12)Détermination de la loi par trois méthodesÉlevéProbabilité conditionnelle, formule des probabilités totales, combinatoire
III.A–B — Modèle d’euglènes et population moyenne (Q13–Q19)Processus de branchement : espéranceÉlevéIndépendance, espérance, suites géométriques
III.C–D — Probabilité d’extinction (Q20–Q29)Point fixe de \(G_D\) et extinctionTrès élevéÉtude de fonction, dérivée seconde, convergence monotone
III.E + IV — Calcul numérique et tracés (Q30–Q33)Dichotomie et estimation par échantillonnageÉlevéInégalité de Bienaymé-Tchebychev, Python (complétion)

Le sujet intégral en PDF

L’énoncé complet tel qu’il a été distribué en salle d’examen.

📄 Télécharger le sujet (PDF)
🎁 EN BONUS

Correction complète et détaillée du sujet

Question par question, avec méthodes, calculs et conseils.

📄 Télécharger la correction (PDF)

Disponible immédiatement après inscription email.


Structure et thèmes du sujet

Partie I (Q1–Q4) installe la théorie des fonctions génératrices. On démontre que \(G_X(t) = \displaystyle\sum_{n=0}^{+\infty} P(X=n)\,t^n\) est bien définie sur \([0,1]\), que \(G_X(t) = E(t^X)\), puis on calcule \(G_X\) pour une loi binomiale. Les Q3 et Q4 établissent des résultats structurels : équivalence entre support fini et caractère polynomial de \(G_X\), et injectivité de l’application « loi \(\mapsto\) fonction génératrice » (dans le cas à support borné).

Partie II (Q5–Q12) modélise une expérience de culture de jacinthes : sur \(n\) bulbes, on sélectionne d’abord ceux qui atteignent 20 cm (probabilité \(p_1\)), puis on observe la floraison (probabilité \(p_2\)). La variable \(J_2\) (nombre final de jacinthes retenues) est étudiée par trois méthodes distinctes : la formule des probabilités totales avec conditionnement par \(J_1\) (Q8), la composition de fonctions génératrices (Q10), et l’approche directe par produit de probabilités (Q11). Le sujet fait ici le pont entre maths et informatique en demandant d’interpréter et de compléter des fonctions Python de simulation.

Partie III (Q13–Q30) est le cœur du sujet. Elle étudie un processus de branchement (Galton-Watson) modélisant une population d’euglènes. À chaque génération, chaque individu produit un nombre aléatoire de descendants selon une loi \(D\). Les sous-parties III.B et III.C calculent l’espérance de la population à la génération \(j\) et explorent des cas particuliers de la probabilité d’extinction \(\alpha\). La sous-partie III.D, la plus technique, établit que \(\alpha\) est le plus petit point fixe de \(G_D\) dans \([0,1]\), via une étude complète de la fonction \(f(t) = G_D(t) – t\). La sous-partie III.E conclut par un algorithme de dichotomie pour calculer \(\alpha\) numériquement.

Partie IV (Q31–Q33) propose un volet d’estimation statistique de \(G_X\) par échantillonnage, en utilisant l’inégalité de Bienaymé-Tchebychev issue de la variance de \(t^X\) (calculée en partie I), puis la complétion d’un algorithme de tracé exact.


Notions et chapitres testés

  • Séries numériques et séries entières : convergence de \(\sum P(X=n)\,t^n\) sur \([0,1]\), rayon de convergence, dérivabilité terme à terme (Q1, Q3).
  • Probabilités discrètes : loi binomiale, probabilité conditionnelle, formule des probabilités totales, systèmes complets d’événements (Q5–Q12).
  • Variables aléatoires discrètes : espérance, variance, transfert, indépendance de familles de variables (Q1.5, Q1.6, Q10, Q18).
  • Combinatoire : coefficients binomiaux, identité de Vandermonde (Q8.4).
  • Analyse de fonctions : dérivées première et seconde, variations, théorème des valeurs intermédiaires (Q27–Q29).
  • Suites et récurrence : suites définies par récurrence via \(a_{j+1} = G_D(a_j)\), convergence monotone (Q24–Q25).
  • Algorithmique Python : simulation de lois, boucles imbriquées, récursivité, parcours en largeur vs profondeur, dichotomie (Q7, Q9, Q12, Q22, Q23, Q30, Q32, Q33).

Niveau de difficulté et comparaison aux années précédentes

Ce sujet s’inscrit dans la tradition des épreuves de modélisation Agro-Véto BCPST, qui mêlent un thème probabiliste central à de la programmation Python. Par rapport aux sessions 2023-2025, on note :

  • Un fil conducteur très structurant : la fonction génératrice sert de fil rouge de la première à la dernière question, ce qui confère une grande cohérence au sujet mais exige de bien maîtriser les résultats établis en partie I pour avancer sereinement.
  • Un niveau mathématique soutenu en partie III : l’étude du processus de Galton-Watson et de la probabilité d’extinction (Q24–Q29) va au-delà du cours standard. L’analyse fine de la fonction \(f(t) = G_D(t) – t\) (convexité, variations, nombre de zéros selon \(E(D)\)) est exigeante et demande une bonne maîtrise des études de fonctions.
  • Un volet Python conséquent : environ un tiers des questions impliquent de compléter ou d’interpréter du code Python, avec des structures variées (itératif, récursif, parcours d’arbres). C’est dans la lignée des sujets récents, mais avec une demande d’interprétation plus poussée (Q22.3 sur la comparaison parcours en largeur/profondeur).
  • Difficulté globale : légèrement au-dessus de la moyenne des années précédentes, principalement à cause de la partie III.D. Les parties I et II.A sont très abordables et permettent d’assurer un socle de points solide.

Pièges et points techniques délicats

Q1.1 – Convergence de la série : Il faut justifier proprement que pour \(t \in [0,1]\), on a \(0 \leq P(X=n)\,t^n \leq P(X=n)\) et que \(\sum P(X=n) = 1\) converge. Attention à ne pas confondre convergence absolue et convergence simple d’une série de fonctions.

Q1.5 – Le transfert : La variable \(t^X\) est une variable aléatoire discrète à valeurs dans \(\{t^n, n \in \mathbb{N}\}\). Pour montrer qu’elle admet une espérance et que \(E(t^X) = G_X(t)\), il faut appliquer le théorème de transfert en justifiant la convergence absolue de la série.

Q3.1 – Équivalence (i) ⟺ (ii) : Le sens (i) \(\Rightarrow\) (ii) est direct (somme finie = polynôme). Le sens réciproque demande un raisonnement par contraposée ou par l’absurde : si \(P(X = n) > 0\) pour une infinité de \(n\), alors \(G_X\) n’est pas un polynôme (argument sur les coefficients d’une série entière).

Q8.4 – Identité combinatoire : L’identité \(C_{i}^{\ell}\,C_{n}^{i} = C_{n}^{\ell}\,C_{n-\ell}^{i-\ell}\) est un classique mais son écriture factorielle doit être sans erreur. Pense à écrire les deux membres sous forme de quotients de factorielles et à simplifier.

Q18.1 – Indépendance de \(D_{j,1}, \ldots, D_{j,m^j}\) et \(N_j\) : C’est un point subtil. L’hypothèse (H6) donne l’indépendance de toute la famille \((D_{j,k})\), et \(N_j\) est fonction des \(D_{i,k}\) pour \(i < j\). Il faut utiliser le fait que des sous-familles disjointes d’une famille indépendante sont elles-mêmes indépendantes.

Q25.2 – Conditionnement par \(N_1 = n\) : L’idée est que sachant \(N_1 = n\), la population à la génération \(j+1\) est la somme de \(n\) processus indépendants identiques. Il faut bien justifier que \(P(N_{j+1} = 0 \mid N_1 = n) = (a_j)^n\) en utilisant l’indépendance des sous-arbres.

Q22.3 – Parcours en largeur vs profondeur : C’est une question discriminante. extinction_iter simule génération par génération (largeur), tandis que extinction_rec suit chaque lignée jusqu’à la fin (profondeur). L’avantage de la version récursive est qu’elle peut s’arrêter dès qu’un descendant survit, sans simuler toutes les branches — mais elle risque un dépassement de pile pour de grandes profondeurs.


Méthodes attendues et stratégies de résolution

Partie I : Les Q1.1 à Q1.6 reposent sur des majorations de séries à termes positifs et le théorème de transfert pour les espérances. Pour Q2 (loi binomiale), il suffit de développer \((pt + 1-p)^n\) par la formule du binôme de Newton et d’identifier les coefficients. Q4 utilise le fait qu’un polynôme nul sur \([0,1]\) est le polynôme nul.

Partie II : Q5 est une application directe des hypothèses (A1) et (A3) pour reconnaître une loi binomiale \(\mathcal{B}(n, p_1)\). Q6 est un calcul exhaustif pour \(n=2\). Pour Q8, la stratégie est le conditionnement par \(J_1\) suivi de l’identité combinatoire de Q8.4, menant à reconnaître \(\mathcal{B}(n, p_1 p_2)\). Q10 utilise la propriété de composition \(G_{J_2} = G_{J_1} \circ G_{X_1}\) (admise), et Q11 fournit l’approche directe : la probabilité qu’une plante soit retenue est \(p_1 p_2\).

Partie III.A–B : Q14 est immédiat car \(N_1 = D_{0,1}\). Q15 se montre par récurrence. Pour Q18.3, on conditionne par les valeurs de \(N_j\) et on utilise l’indépendance pour obtenir \(E(N_{j+1}) = E(D) \cdot E(N_j)\), d’où \(E(N_j) = E(D)^j\) par récurrence.

Partie III.C–D : Q20 utilise l’indépendance des sous-arbres : sachant \(A_1\), l’extinction dépend des 3 descendants survivants, donc \(P(E_0 \mid A_1) = \alpha^3\) (en comptant les descendants non nuls). Pour Q24-Q25, on montre que la suite \((a_j)\) vérifie \(a_{j+1} = G_D(a_j)\) et converge vers \(\alpha\). L’étude de \(f(t) = G_D(t) – t\) en Q27-Q29 est une étude de fonction classique : \(f^{\prime\prime} > 0\) (convexité stricte), \(f^\prime(0) < 0\) (car \(p_0 < 1\), donc \(G_D^\prime(0) = p_1 < 1\) n’est pas suffisant — il faut utiliser que \(f^\prime(0) = p_1 – 1\)), et le signe de \(f^\prime(1) = E(D) – 1\) détermine le nombre de zéros de \(f\) dans \([0,1]\).

Partie IV : Q31.1 combine \(E(t^X) = G_X(t)\) et \(V(t^X) \leq 1\) avec l’inégalité de Bienaymé-Tchebychev. Q31.2 utilise une union de complémentaires et la sous-additivité de la probabilité. Les questions de complétion Python (Q32, Q33) sont relativement directes si on comprend la structure des boucles.


Conseils pour les futurs candidats

Maîtrise les fonctions génératrices : Ce sujet montre que cette notion, parfois survolée en cours, peut structurer un problème entier de concours. Entraîne-toi à calculer \(G_X\) pour les lois classiques (Bernoulli, binomiale, géométrique, Poisson) et à manipuler la composition \(G_{S_N} = G_N \circ G_X\) pour les sommes aléatoires.

Travaille les processus de branchement : Le modèle de Galton-Watson est un grand classique des concours BCPST. Assure-toi de comprendre la récurrence \(a_{j+1} = G_D(a_j)\), le lien entre \(E(D)\) et la survie/extinction, et l’interprétation biologique de ces résultats.

  • Séries entières et convergence : Revoir les critères de convergence des séries numériques et la manipulation des séries entières sur leur intervalle de convergence. La capacité à justifier rigoureusement des interversions somme/limite est testée ici de manière récurrente.
  • Études de fonctions : Les Q27-Q29 sont une étude de fonction sur \([0,1]\) avec dérivée seconde strictement positive (convexité). C’est un exercice d’analyse très classique mais qui doit être mené sans erreur.
  • Python récursif : L’épreuve teste la compréhension des algorithmes récursifs (Q22, Q23.4) et la capacité à distinguer parcours en largeur et en profondeur. Entraîne-toi à coder des fonctions récursives sur des structures arborescentes.
  • Combinatoire : L’identité \(C_{i}^{\ell}\,C_{n}^{i} = C_{n}^{\ell}\,C_{n-\ell}^{i-\ell}\) de Q8.4 est un outil classique. Révise les identités fondamentales sur les coefficients binomiaux (Vandermonde, absorption, symétrie).
  • Interpréter avant de calculer : Les Q9, Q12 et Q22 demandent d’expliquer ce que fait un programme. La méthode gagnante est de relier chaque ligne de code à une étape du modèle probabiliste, pas de « dérouler » le programme à la main sur un exemple.

En résumé, ce sujet récompense une préparation équilibrée entre probabilités discrètes (conditionnement, indépendance, lois classiques), analyse (séries, études de fonctions) et programmation Python (simulation, récursivité, dichotomie). Les premières questions de chaque partie sont accessibles et permettent de collecter des points ; la partie III.D constitue le vrai défi discriminant. Pour tes révisions, concentre-toi sur les exercices de probabilités impliquant des sommes aléatoires et des récurrences, et entraîne-toi systématiquement à écrire et interpréter du code Python lié à des simulations probabilistes.

Logo-excellence-maths
Préparer Agro-Veto BCPST avec un professeur de Polytechnique
Tu vises ce concours l'année prochaine ? Un accompagnement individuel pour transformer ta préparation et maximiser ta note le jour J.