Page principale

NB : cette page a été initialement écrite pendant le premier confinement du printemps 2020. Aucun aspect lié à la vaccination ou au rebond saisonnier n'y est en particulier abordé.

Quelques explications sur des modèles mathématiques simples d'épidémie : les modèles compartimentaux. Ou comment peut-on faire des prévisions sur les phénomènes épidémiques.
Ces modèles répartissent la population en un certain nombre de compartiments (individus sains, infectés, guéris, morts…) - et donnent des règles simples expliquant les passages d'un compartiment à l'autre.

Modèle SIR

Le modèle SIR est l'un des plus simples. Il répartit la population en trois compartiments :

On note par extension S, I et R les pourcentages dans la population d'individus dans chacune ces trois classes à un moment donné. Par exemple, si $S=0.3$, $I=0.5$ et $R=0.2$, cela signifie que $30\%$ de la population est susceptible, $50\%$ infectée, et $20\%$ guérie.

Le modèle donne ensuite des règles expliquant comment sont modifiés ces pourcentages au fil du temps - c'est-à-dire essentiellement «à quelle vitesse» une personne va en moyenne passer de la classe S à la classe I (être infectée), puis de la classe I à la classe R (être guérie). Pour les modèles SIR les plus simples, on utilise les règles suivantes : On obtient alors ce que l'on appelle un système d'équations différentielles : $$\left\{\begin{array}{rcl} \frac{dR}{dt}&=&c I\\ \frac{dS}{dt}&=&-bIS\\ \frac{dI}{dt}&=&bIS-cI\\ \end{array}\right.$$ une équation différentielle désignant une équation qui décrit la variation d'une quantité au cours du temps, et système signifiant simplement la présence de plusieurs équations.
À noter que $\frac{dS}{dt}+\frac{dI}{dt}+\frac{dR}{dt}=0$, ce qui est normal : $S+I+R=1$ est une quantité qui ne varie pas dans le temps (elle représente «$100\%$» de la population).

Un tel système d'équations peut dans les cas simples être résolu exactement, à l'aide de méthodes mathématiques. Dans les cas où une telle résolution exacte n'est pas possible, il est toujours possible de le simuler, c'est-à-dire d'en calculer des solutions approchées. On peut utiliser pour cela des méthodes comme la méthode d'Euler - qui s'étudient généralement en L1.

C'est ce qui est fait ci-dessous. Vous pouvez faire varier les paramètres du modèle pour voir comment évoluent les différentes courbes. En dessous, vous pouvez visualiser la proportion de la population dans chacun des compartiments sur un échantillon de 2000 personnes, ce qui peut être plus parlant que les courbes (à l'échelle de la France, un bonhomme représente environ 30 000 personnes).

En particulier, je conseille de faire baisser le paramètre $b$ de force de l'infection : qualitativement, c'est sur ce paramètre que l'on joue par des mesures de distanciation sociale et/ou de confinement (selon les estimations actuelles, le confinement fait environ baisser $b$ de moitié). Vous pourrez observer que baisser ce paramètre conduit à un étalement (et un retardement) du pic d'infection, dont j'expliquerai l'intérêt un peu plus tard.

Modèle :
Force de l'infection  b =

Taux de guérison  c =


Susceptibles .
   

Quelques commentaires.

Et les décès dans tout ça ?

C'est évidemment ce qui nous intéresse en premier lieu, et qui n'apparait pas dans le modèle de base, car prendre en compte les personnes décédées dans un nouveau compartiment D ne change pas la dynamique de celui-ci : en effet, une personne décédée est passée avant par le compartiment I (infecté) et ne contaminera plus personne - donc du point de vue du modèle, une personne décédée joue le même «rôle» qu'une personne guérie.

C'est évidemment tout à fait faux en pratique, et nous allons donc ajouter un nouveau compartiment D pour les personnes décédées, et modifier nos équations en fonction.

$$\left\{\begin{array}{rcl} \frac{dR}{dt}&=&c I\\ \frac{dS}{dt}&=&-bI\\ \frac{dI}{dt}&=&bIS-cI\mathbf{-mI}\\ \mathbf{\frac{dD}{dt}}&\mathbf{=}&\mathbf{mI}\\ \end{array}\right.$$ La principale nouveauté est l'apparition de la dernière ligne, qui dit que l'augmentation du nombre de personnes décédées est proportionnelle au nombre de personnes infectées. Le coefficient de proportionnalité, $m$, est appelé taux de létalité.
La troisième équation a été modifiée pour prendre en compte le fait que le nombre de personnes infectées diminue maintenant à cause des décès.

Le simulateur ci-dessus permet de prendre en compte ce nouveau compartiment, en sélectionnant le modèle SIR + Décès au lieu du modèle SIR. Vous pouvez à nouveau faire baisser le paramètre $b$ (force de l'infection) pour avoir une idée qualitative de son incidence sur la mortalité totale. Le tracé de mortalité sur le graphique est amplifié d'un facteur 10 pour mieux le visualiser. Rappel utile : à l'échelle de la france métropolitaine, une mortalité finale de $0,1\%$ signifie en environ $65\;000$ morts, $0,2\%$ environ $130\;000$ morts, etc.

L'importance du confinement.


L'importance du confinement pour l'épidémie de COVID-19 est en fait sous-estimé dans la section précédente. Pourquoi ? Rappel important à ce stade : un modèle n'est qu'une simplification de la réalité. Et une de nos hypothèses est ici déraisonnable dans le cas du COVID-19 : le fait que l'augmentation du nombre de décès soit proportionnel au nombre de personnes infectées.
En effet, cette hypothèse ne tient pas compte de la saturation du système de santé. Si la capacité d'accueil du système de santé est dépassée, on peut s'attendre à une surmortalité importante.
Cette autre simulation montre ce phénomène. Encore une fois, c'est très qualitatif. J'ai supposé un peu arbitrairement que le système de santé est saturé à partir du moment où $10\%$ de la population est infecté, et que le taux de mortalité est multiplié par 3 au delà de ce seuil (cela correspond à la partie hachurée sous la courbe des infectés).
À nouveau, faites baisser le paramètre $b$ (force de l'infection), pour voir qualitativement l'effet du confinement. Le nombre de décès diminue drastiquement.
Le véritable enjeu du confinement n'est pas individuel, mais avant tout collectif : le confinement permet d'étaler le pic des infections afin d'éviter ou de limiter la saturation des services de santé, et donc d'éviter la surmortalité correspondante.

D'autres avantages : Une dernière remarque : il existe d'autres types de modèles compartimentaux, ajoutant des compartiments comme $Q$ (les personnes en quarantaine), $E$ (les personnes exposées, c'est-à-dire porteuses du virus mais pas encore contagieuses), etc. Il ne faut pas perdre de vue que plus il y a de compartiments et de paramètres à évaluer, plus il va être difficile de calibrer le modèle sur les données réelles. (Généralement, mieux vaut choisir un modèle simple (s'il est suffisant) - c'est un principe fondamental en science appelé Rasoir d'Ockham.) Cette parenthèse générale étant fermée, indiquons que l'INSERM utilise actuellement des modèles beaucoup plus complets et précis que le modèle SIR pour effectuer des prédictions sur l'épidémie de COVID (avec de nombreux autres compartiments), et qu'il y a derrière un travail important de détermination des paramètres.

Déconfinement, et rebond de l'épidémie ?

Un dernier modèle permet de simuler l'effet d'un confinement, en jouant sur sa durée, et sur sa «force», soit avec les curseurs, soit en étirant directement le rectangle surperposé aux courbes. Son début est à nouveau calé sur la dynamique de l'épidémie de COVID-19 en Italie. Les confinements réalisés en Italie et en France multiplient grossièrement par un facteur $1-f_r=$1/2 ou 1/3 le paramètre $b$ (la force de l'infection). On appelle $f_r$ la force du confinement. Si $f_r=0$, le confinement n'a aucun effet. Si $f_r$ est proche de 1, la force de l'infection se rapproche de 0, et le virus ne circule plus. En pratique, le confinement permet d'être entre les deux. À nouveau, tout ceci est extrèmement qualitatif.
Vous pouvez notamment diminuer la durée du confinement, pour voir apparaître un rebond de l'épidémie - risquant à nouveau une saturation du système de santé, et donc une surmortalité.

On peut déconfiner sans risque de rebond à un moment où une proportion de la population suffisante a été infectée puis guérie, et est donc immunisée (dans le compartiment R). Cette proportion peut ralentir la propagation du virus - un phénomène similaire à celui de la vaccination.

Si la proportion de la population immunisée n'est pas suffisante en sortie de confinement (c'est parti pour être le cas pour l'épidémie de COVID-19), il y a un risque de rebond. Il faut donc maintenir la distanciation et les gestes barrières dans la durée afin de diminuer la force de l'infection - en attendant un traitement ou un vaccin.

On mesure donc la difficulté de proposer une date de déconfinement : les paramètres ne sont pas parfaitement connus en pratique, et si l'on manque de moyens pour détecter le pourcentage de la population qui est dans R (à l'aide de tests), un déconfinement trop précoce peut conduire à un rebond important de l'épidémie. Un autre problème est qu'il y a à l'heure actuelle (16 avril) un doute sur l'immunisation des personnes ayant été en contact avec le virus.

Le 12 avril, l'INSERM a publié un rapport sur le déconfinement, utilisant un modèle beaucoup plus complet et précis que celui que je décris sur cette page. Sa lecture devrait j'espère être plus accessible après avoir parcouru cette page, et manipulé un peu les modèles.

Remerciements

Un grand merci à Corentin Barbu - auteur de modélisations très parlantes sur le COVID - pour sa patience pour répondre à mes questions et pour les paramètres du simulateur.