NB : cette page a été initialement écrite pendant le premier confinement du printemps 2020. Aucun aspect lié à la vaccination ou au rebond saisonnier n'y est en particulier abordé.
Quelques explications sur des modèles mathématiques
simples d'épidémie : les modèles compartimentaux. Ou comment peut-on faire des prévisions sur les phénomènes épidémiques.
Ces modèles répartissent la population en un certain nombre de compartiments (individus
sains, infectés, guéris, morts…) - et donnent des règles
simples expliquant les passages d'un compartiment à
l'autre.
Modèle SIR
Le modèle SIR est l'un des plus simples. Il répartit la
population en trois compartiments :
S pour les individus susceptibles - c'est-à-dire n'ayant pas encore été infectés;
I pour les individus infectés par la maladie;
R pour les individus guéris (recovered en anglais) - que l'on suppose dans ce modèle immunisés définitivement contre la maladie.
On note par extension S, I et R les
pourcentages dans la population d'individus dans chacune
ces trois classes à un moment donné. Par exemple, si $S=0.3$, $I=0.5$ et $R=0.2$, cela signifie que $30\%$ de la population est susceptible, $50\%$ infectée, et $20\%$ guérie.
Le modèle donne ensuite des règles expliquant comment sont
modifiés ces pourcentages au fil du temps - c'est-à-dire essentiellement «à quelle vitesse» une personne va en moyenne passer de la classe S à la classe I (être infectée), puis de la classe I à la classe R (être
guérie). Pour les modèles SIR les plus simples, on utilise
les règles suivantes :
$\frac{dR}{dt}=c I$. Cela signifie que le taux
d'individus guéris varie proportionnellement au
taux de personnes infectées ($\frac{dR}{dt}$
désignant la vitesse de variation de $R$ - appelée
en mathématiques sa dérivée). Autrement dit,
dans un petit intervalle de temps, une certaine
proportion fixée des personnes infectées vont
guérir. Cette proportion est réglée par le
paramètre $c$ appelé taux de guérison : si $c=0$, cela signifie que
personne ne guérit - la proportion d'individus
dans R ne change pas. Si $c$ est «grand», cela signifie que la guérison est «rapide».
$\frac{dS}{dt}=-bIS$ : la proportion
d'individus susceptibles (c'est-à-dire pas encore
infectés) décroit proportionnellement au produit
de la proportion d'individus susceptibles et
d'individus infectés. L'intuition sous-jacente est
que plus il y a d'individus infectés, plus un
individu susceptible a de «chances» d'être
infecté. Le produit $IS$ mesure en quelque sorte les «rencontres» entre individus infectés et susceptibles. Cette équation est réglée par un
paramètre $b$ qui dépend en pratique de nombreux
facteurs : contagiosité de la maladie,
mesures de distanciation sociale, confinement. On
l'appelle la force de l'infection. Si $b=0$, cela signifie qu'il n'y a pas de contagion du tout : il n'y pas apparition de nouveaux individus infectés. Plus $b$ est «grand», plus la contagion est «importante».
L'évolution du nombre des individus infectés
se déduit naturellement des règles précédentes :
$\frac{dI}{dt}=bIS-cI$
la variation des individus infectés correspond aux nouvelles arrivées depuis le compartiment des susceptibles (infection), et aux départs vers celui des guéris (guérison).
On obtient alors ce que l'on appelle un système d'équations différentielles :
$$\left\{\begin{array}{rcl} \frac{dR}{dt}&=&c I\\
\frac{dS}{dt}&=&-bIS\\ \frac{dI}{dt}&=&bIS-cI\\
\end{array}\right.$$
une équation différentielle désignant une équation qui
décrit la variation d'une quantité au cours du temps, et système signifiant
simplement la présence de plusieurs équations.
À noter que
$\frac{dS}{dt}+\frac{dI}{dt}+\frac{dR}{dt}=0$, ce qui est
normal : $S+I+R=1$ est une quantité qui ne varie pas dans
le temps (elle représente «$100\%$» de la population).
Un tel système d'équations peut dans les cas simples être
résolu exactement, à l'aide de méthodes mathématiques. Dans les cas où une telle résolution exacte n'est pas possible, il est toujours possible de le simuler, c'est-à-dire d'en calculer des solutions approchées. On peut utiliser pour cela des méthodes comme la méthode d'Euler - qui s'étudient généralement en L1.
C'est ce qui est fait ci-dessous. Vous pouvez faire varier les paramètres du modèle pour voir comment évoluent les différentes courbes. En dessous, vous pouvez visualiser la proportion de la population dans chacun des compartiments sur un échantillon de 2000 personnes, ce qui peut être plus parlant que les courbes (à l'échelle de la France, un bonhomme représente environ 30 000 personnes).
En particulier, je conseille de faire baisser le paramètre $b$ de force de l'infection : qualitativement, c'est sur ce paramètre que l'on joue par des mesures de distanciation sociale et/ou de confinement (selon les estimations actuelles, le confinement fait environ baisser $b$ de moitié). Vous pourrez observer que baisser ce paramètre conduit à un étalement (et un retardement) du pic d'infection, dont j'expliquerai l'intérêt un peu plus tard. Modèle :
Force de l'infection b =
Taux de guérison c =
Taux de létalité m =
Surmortalité si saturation
Confinement. Début Fin Force
Taux E $\rightarrow$ I
Mortalité finale (mortalité finale sans saturation ≈) (mortalité finale sans confinement ≈)
Susceptibles . Exposés . Infectés . Guéris . Décès (final ) (mortalité sans saturation ≈) (mortalité sans confinement ≈)
Quelques commentaires.
Les simulations ci-dessus sont qualitatives :
elles permettent cependant de comprendre le
principe d'une simulation, et la dynamique d'une
épidémie dans ses grandes lignes.
Les valeurs des paramètres sont ceux déduits de la
situation épidémique en Italie, et l'échelle de temps
en abscisses est la semaine.
On observe une croissance rapide (exponentielle) du nombre de personnes infectées en début d'épidémie, suivie d'une stabilisation puis d'une redescente. Cette dernière vient du fait que beaucoup de personnes ont été guéries et sont désormais immunisées (c'est-à-dire dans le compartiment R), ce qui freine la propagation de l'infection. Selon les paramètres $b$ et $c$, lorsque le pic épidémique aura été résorbé, une proportion plus ou moins grande de la population sera dans le compartiment R. En particulier, si beaucoup de personnes sont dans R, cela rendra moins probable l'apparition d'un nouveau pic épidémique.
Un modèle n'est pas la réalité, c'est une simplification de la réalité.
Utiliser des modèles mathématiques de ce type ne
dispense absolument pas des compétences des
épidémiologistes, biologistes et médecins - seul·e·s
à même de déterminer si le modèle est adapté à
telle ou telle maladie, telle ou telle situation,
quelles sont ses limitations, si on peut l'appliquer à un pays entier ou seulement une région, à quel point on peut
lui faire confiance pour faire des
prédictions, etc. Voir cette page pour une utilisation très sérieuse par un épidémiologiste d'un modèle proche dans le cadre de l'épidémie de COVID-19, ou celle-ci pour un rapport de l'INSERM sur le déconfinement, utilisant un modèle plus complet que le modèle SIR.
Un des problèmes que l'on rencontre dans la
pratique est que l'on ne connaît pas les paramètres
$b$ et $c$. On peut les évaluer à partir des courbes
réelles que l'on observe, mais cela soulève de nombreuses
difficutés (par exemple s'il y a de nombreux cas
asymptomatiques, évaluer les valeurs réelles de $S$,
$I$ et $R$ n'est pas du tout évident).
Ce modèle ne prend pas en compte la distribution
spatiale de l'épidémie - c'est-à-dire le fait qu'il
puisse y avoir plus de personnes infectées dans une
région que dans une autre, que l'épidémie puisse se
diffuser d'une région à l'autre, etc. Des modèles plus
sophistiqués permettent d'y remédier, mais plus un
modèle est complexe, plus il sera difficile d'en
connaître les paramètres.
Ce modèle oublie également que la population n'est pas homogène, notamment qu'il y a des catégories pour lesquelles la mortalité est plus élevée.
Et les décès dans tout ça ?
C'est évidemment ce qui nous intéresse en premier lieu, et qui n'apparait pas dans le modèle de base, car prendre en compte les personnes décédées dans un nouveau compartiment D ne change pas la dynamique de celui-ci : en effet, une personne décédée est passée avant par le compartiment I (infecté)
et ne contaminera plus personne - donc du point de vue du
modèle, une personne décédée joue le même «rôle» qu'une
personne guérie.
C'est évidemment tout à fait faux en pratique, et nous allons donc ajouter un nouveau compartiment D pour les personnes décédées, et modifier nos équations en fonction.
$$\left\{\begin{array}{rcl} \frac{dR}{dt}&=&c I\\
\frac{dS}{dt}&=&-bI\\ \frac{dI}{dt}&=&bIS-cI\mathbf{-mI}\\
\mathbf{\frac{dD}{dt}}&\mathbf{=}&\mathbf{mI}\\
\end{array}\right.$$
La principale nouveauté est l'apparition de la dernière
ligne, qui dit que l'augmentation du nombre de personnes
décédées est proportionnelle au nombre de personnes infectées. Le coefficient de proportionnalité, $m$, est appelé taux de létalité.
La troisième équation a été modifiée pour prendre en compte le fait que le nombre de personnes infectées diminue maintenant à cause des décès.
Le simulateur ci-dessus permet de prendre en compte ce nouveau compartiment, en sélectionnant le modèle SIR + Décès au lieu du modèle SIR. Vous pouvez à nouveau faire baisser le paramètre $b$ (force de l'infection) pour avoir une idée qualitative de son incidence sur la mortalité totale. Le tracé de mortalité sur le graphique est amplifié d'un facteur 10 pour mieux le visualiser. Rappel utile : à l'échelle de la france métropolitaine, une mortalité finale de $0,1\%$ signifie en environ $65\;000$ morts, $0,2\%$ environ $130\;000$ morts, etc.
L'importance du confinement.
L'importance du confinement pour l'épidémie de COVID-19 est en fait sous-estimé dans la section précédente. Pourquoi ? Rappel important à ce stade : un modèle n'est qu'une simplification de la réalité. Et une de nos hypothèses est ici déraisonnable dans le cas du COVID-19 : le fait que l'augmentation du nombre de décès soit proportionnel au nombre de personnes infectées. En effet, cette hypothèse ne tient pas compte de la saturation du système de santé. Si la capacité d'accueil du système de santé est dépassée, on peut s'attendre à une surmortalité importante.
Cette autre simulation
montre ce phénomène. Encore une fois, c'est très
qualitatif. J'ai supposé un peu arbitrairement que le système de
santé est saturé à partir du moment où $10\%$ de la
population est infecté, et que le taux de
mortalité est multiplié par 3 au delà de ce seuil (cela
correspond à la partie hachurée sous la courbe des
infectés). À nouveau, faites baisser le paramètre $b$
(force de l'infection), pour voir qualitativement l'effet
du confinement. Le nombre de décès diminue drastiquement.
Le véritable enjeu du confinement n'est pas individuel, mais avant tout collectif : le
confinement permet d'étaler le pic des infections afin
d'éviter ou de limiter la saturation des services de
santé, et donc d'éviter la surmortalité correspondante.
D'autres avantages :
même en l'absence de saturation, descendre le paramètre $b$ permet déjà de diminuer le nombre total de décès en fin d'épidémie;
et retarde le pic épidémique, ce qui peut laisser plus de temps pour trouver des traitements (permettant de d'améliorer le taux de guérison $c$ ou de baisser le taux de létalité $m$), voire - à plus long terme - un vaccin (qui permet de faire passer les personnes directement du compartiment S au compartiment R, sans passer par la case I);
Une dernière remarque : il existe d'autres types de modèles compartimentaux, ajoutant des compartiments comme $Q$ (les personnes en quarantaine), $E$ (les personnes exposées, c'est-à-dire porteuses du virus mais pas encore contagieuses), etc. Il ne faut pas perdre de vue que plus il y a de compartiments et de paramètres à évaluer, plus il va être difficile de calibrer le modèle sur les données réelles. (Généralement, mieux vaut choisir un modèle simple (s'il est suffisant) - c'est un principe fondamental en science appelé Rasoir d'Ockham.) Cette
parenthèse générale étant fermée, indiquons que l'INSERM utilise actuellement des modèles beaucoup plus complets et précis que le modèle SIR pour effectuer des prédictions sur l'épidémie de COVID (avec de nombreux autres compartiments), et qu'il y a derrière un travail important de détermination des paramètres.
Déconfinement, et rebond de l'épidémie ?
Un dernier modèle permet de simuler l'effet d'un confinement,
en jouant sur sa durée, et sur sa «force», soit avec les
curseurs, soit en étirant directement le rectangle
surperposé aux courbes. Son début est à nouveau calé sur
la dynamique de l'épidémie de COVID-19 en Italie. Les confinements réalisés en Italie et en France multiplient grossièrement par un facteur $1-f_r=$1/2 ou 1/3 le paramètre $b$ (la force de l'infection). On appelle $f_r$ la force du confinement. Si $f_r=0$, le confinement n'a aucun effet. Si $f_r$ est proche de 1, la force de l'infection se rapproche de 0, et le virus ne circule plus. En pratique, le confinement permet d'être entre les deux. À nouveau, tout ceci est extrèmement qualitatif.
Vous pouvez notamment diminuer la durée du confinement, pour voir apparaître un rebond de l'épidémie - risquant à nouveau une saturation du système de santé, et donc une surmortalité.
On peut déconfiner sans risque de rebond à un moment où une proportion de la population suffisante a été infectée puis guérie, et est donc immunisée (dans le compartiment R).
Cette proportion peut ralentir la propagation du virus -
un phénomène similaire à celui de la vaccination.
Si la proportion de la population immunisée n'est pas suffisante en sortie de confinement (c'est parti pour être le cas pour l'épidémie de COVID-19), il y a un risque de rebond. Il faut donc maintenir la distanciation et les gestes barrières dans la durée afin de diminuer la force de l'infection - en attendant un traitement ou un vaccin.
On mesure donc la difficulté de proposer une date de déconfinement : les paramètres ne sont pas parfaitement connus en pratique, et si l'on manque de moyens pour détecter le pourcentage de la population qui est dans R (à l'aide de tests), un déconfinement trop précoce peut conduire à un rebond important de l'épidémie. Un autre problème est qu'il y a à l'heure actuelle (16 avril) un doute sur l'immunisation des personnes ayant été en contact avec le virus.
Le 12 avril, l'INSERM a publié un rapport sur le déconfinement,
utilisant un modèle beaucoup plus complet et précis que
celui que je décris sur cette page. Sa lecture devrait
j'espère être plus accessible après avoir parcouru cette
page, et manipulé un peu les modèles.
Remerciements
Un grand merci à Corentin Barbu - auteur de modélisations très parlantes sur le COVID - pour sa patience pour répondre à mes questions et pour les paramètres du simulateur.