Modélisation de la propagation du covid-19

Depuis une dizaine de jours nous avons modélisé la propagation du coronavirus en France grâce à nos outils d’intelligence artificielle.

Le but de cette étude est avant tout de diffuser une vue sur les évènements actuels en restant dans le vrai, le statistique. Les chiffres sont tétus disait une personne qui m’est chère.

Nous nous sommes intéressé aux données des cas en cours et à la mortalité avant qu’un open data du gouvernement ne fasse son apparition.

L’analyse préliminaire des données :

En prenant les stats de l’Italie et de l’Espagne, nous avons remarqué que la mortalité était plus corrélée (à ce jour ) aux cas qui surviennent en Espagne et aux deces en Italie…

Correlations

Plusieurs algorithmes fonctionnent bien. Nous avons testé Knn, neural network, regression linéaire, regression multiples, lissage exponentiel, random forest et quelques autres.

L’un de ceux qui fonctionne le mieux est un lissage exponentiel qui comme son nom l’indique, n’augure rien de très réjouissant. Il est intéressant dans ce sens.

On retrouve ici le temps, le nombre de décès en France, la prevision et l’écart avec une estimation basse et une haute ( upper bound).

forecast du lissage exponentiel

Le temps 40 est la prévision pour le 25 mars. Le modèle réseau de neurones est à 1388.

On remarque que dans la majorité des cas, on a les cas réels qui dépassent la bande haute de la prévision. L’écart semble être de 1 à 2 % Pour faire simple le côté exponentiel s’accélère.

Courbe exponentielle

Nous avons développé plusieurs autres modèles avec des outils différents, des réseaux de neurones à la régression multiple dont je glisse ici le taux d’erreur :

Regression multiple

Voilà, nous voulions partager ces éléments objectivement afin d’avoir une vue plus claire non plus sur la situation mais d’ouvrir une fenêtre sur le futur.

Prenez soin de vous.

L’équipe Neural Decision

mars 25, 2020