dimanche 24 mai 2020

Le modèle de l'Imperial College qui a causé la panique mondiale a de nombreuses faiblesses (comparaison avec la réalité en Suède)

Le modèle de propagation de la Covid-29 établi par une équipe de l’Imperial College de Londres (ICL), dirigée par Neil Ferguson, a attiré l’attention des médias par ses annonces dramatiques. Selon cette étude interne mise en ligne à la mi-mars, mais jamais publiée dans une revue scientifique, la Covid-19 causerait un demi-million de décès au Royaume-Uni (et deux millions aux États-Unis) en l’absence de strictes mesures de distanciation sociale. Ferguson déclara alors : « Nos estimations suggèrent que l’impact de l’épidémie en cours pourrait être comparable aux grandes pandémies de grippe du XXe siècle ».

Le graphe du rapport du Collège impérial prévoyant 2,2 millions de morts dues au coronavirus aux États-Unis sans mesures d’atténuation.

Le modèle informatique sur lequel s’appuyait Ferguson a été critiqué comme « peu fiable » (voir Hannah Boland ; Ellie Zolfagharifard [16 mai 2020]. " Le code informatique qui a conduit au confinement était « vraiment de mauvaise qualité » et un « bazar plein de bogues », disent les experts ». The Telegraph de Londres. David Richards ; Konstantin Boudnik (16 mai 2020). « Le modèle [du Collège] impérial de Neil Ferguson pourrait être l’erreur logicielle la plus dévastatrice de tous les temps ».) The Telegraph de Londres.

En complément à ces articles de presse, nous publions ci-dessous les remarques de Philippe Lemoine (doctorant à l’université Cornell en logique et philosophie des sciences, aux États-Unis) sur ce sujet.



Beaucoup de gens affirment que, si le modèle ICL a largement surestimé la gravité de l’épidémie en Suède sans verrouillage (https://medrxiv.org/content/10.1101/2020.04.11.20062133v1), c’est simplement parce qu’il n’a pas pris en compte de l’éloignement social volontaire, mais j’ai de mauvaises nouvelles pour eux.

En turquoise, la courbe des décès prévus par le modèle du Collège impérial (ICL) calibré avec les données de distanciation sur le terrain et, en rouge, les décès réels.

Plusieurs personnes ont exprimé leur surprise, parfois plus que cela, que je continue d’insister là-dessus [le modèle ICL], alors voici un court billet pour expliquer pourquoi je ne peux laisser passer cela et pourquoi je ne le ferai pas tant que les gens n’admettront pas que ce modèle était complètement faux.

Tout d’abord, les gens aiment dire que la science se corrige d’elle-même, mais cela ne signifie pas que cela se passe comme par magie. Quelqu’un doit encore faire la correction et, pour le moment, les épidémiologistes ne semblent pas souhaiter très fort le faire.

C’est un vrai problème que, purement par tribalisme (les gens qui critiquent le modèle ICL ont tendance à être du « mauvais » côté de la fracture politique), beaucoup d’entre eux continuent de défendre le modèle en utilisant l’argument manifestement fallacieux que j’ai déboulonné auparavant.

Mais une autre raison, qui est peut-être encore plus importante, est que puisque les gens n’admettront même pas que le modèle était mauvais, il n’y a pas de discussion sur pourquoi il était mauvais. Les gens disent simplement que c’est parce qu’il n’a pas modélisé la distanciation sociale volontaire et continuent de dire « circulez, il n’y a rien à voir ici ». Mais encore une fois, ce n’est manifestement pas la raison, car le modèle produit des prédictions encore énormément excessives même lorsque vous incluez la distanciation sociale volontaire dans le scénario.

D’après ce que j’ai vu lorsque j’ai exécuté une version modifiée du modèle pour la Suède, la raison immédiate semble être que, dans le modèle, le virus se propage beaucoup plus rapidement qu’il ne l’a fait en réalité.

Par exemple, même si je modélise prudemment la distanciation sociale volontaire sur la base des données de Google Mobility, cela prédit que ~ 50 % de la population a déjà été infectée à ce jour.

Maintenant, je ne sais pas exactement quelle proportion de la population a déjà été infectée en Suède, mais je ne doute pas que ce soit loin d’être 50 %. [7,3 % à Stockholm à la fin avril] Alors pourquoi le modèle a-t-il si mal prédit la dynamique de l’épidémie ?

C’est une question vraiment intéressante et importante, mais comme les gens sont trop occupés à prétendre que le modèle n’était pas vraiment faux, personne ne s’y penche vraiment...

Je ne sais pas vraiment pourquoi le modèle a si mal prédit la dynamique de l’épidémie, mais j’ai quelques théories. L’une d’eux est que c’est parce que, bien que le modèle suppose qu’ils le sont, les gens ne sont en fait pas tous également sensibles à l’infection.

Une équipe d’épidémiologistes a récemment montré que la variation de la sensibilité pouvait avoir un impact énorme dans un modèle SEIR. Je soupçonne que cela pourrait également être le cas dans un modèle multiagent tel que celui de l’ICL. Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity

Ce ne serait pas très difficile à tester en faisant quelques changements dans le code et peut-être que je le ferai quand j’aurai du temps, mais pour l’instant je n’en ai pas et je ne sais donc pas si je le ferai.

Je ne suis pas non plus le mieux placé pour le faire, car mon ordinateur portable n’est manifestement pas conçu pour exécuter des simulations aussi intensives en calcul. Il m’a fallu 65 heures pour exécuter la simulation dont j’ai parlé ci-dessus...

Ce n’est pas la seule possibilité, je peux en imaginer d’autres et je suis sûr qu’il y en a beaucoup auxquelles je n’ai même pas pensé. Je pense que comprendre pourquoi le modèle multiagent du Collège impérial de Londres a mal prédit la dynamique de l’épidémie pourrait être très instructif.

Malheureusement, pour que cela se produise, les gens doivent d’abord admettre que la dynamique a été complètement mal prédite et ne pas prétendre que c’est simplement parce qu’ils n’ont pas exécuté un scénario qui incluait une distanciation sociale volontaire, ce qui est une sottise totale.

Ce que j’ai dit n’épuise pas les raisons pour lesquelles je pense qu’il est important de ne pas prétendre qu’il faudrait circuler  parce qu’il n’y aurait rien à voir ici.

C’est franchement incroyable que je doive même me défendre pour ne pas laisser les gens s’en tirer avec une science de mauvaise qualité. La vérité est que, si ce modèle avait été utilisé pour justifier des politiques avec lesquelles vous n’êtes pas d’accord, je suis sûr que vous n’entonneriez pas l’air du « circulez, rien à voir » en ce moment 🤷‍♂️

ADDENDA :

Je suis d’accord avec l’essentiel de ce fil, à savoir qu’il n’y a pas de moyen évident de traduire les données de Google Mobility en interventions pour le modèle, mais j’y ai réfléchi et ce n’est pas non plus la raison pour laquelle le modèle a mal prévu la dynamique de l’épidémie.

Fondamentalement, puisque je savais que les gens feraient ce point (ce qui est tout à fait juste), la première chose que j’ai faite n’a pas été de lancer la simulation ci-dessus, mais un scénario avec un confinement strict : toutes les écoles et les entreprises non essentielles fermées, etc. Mais le modèle prédit toujours que le virus se propage beaucoup plus rapidement qu’il ne le fait réellement même avec ce scénario, bien que de toute évidence pas autant.

En turquoise, les prédictions de décès du Collège impérial de Londres avec un confinement strict (distanciation sociale, fermetures de toutes les écoles et des entreprises), en rouge les décès réels.

Maintenant, je conviens qu’il n’est pas évident de traduire les données de Google Mobility en interventions sur le modèle et que des personnes raisonnables peuvent être en désaccord sur la bonne façon de faire. Mais je ne pense pas que les gens raisonnables puissent être en désaccord sur le fait qu’il y avait beaucoup plus de distanciation sociale dans le scénario de confinement strict que j’ai exécuté ci-dessus que ce qui s’est réellement produit par le biais de la distanciation sociale volontaire.

Donc, même s’il est clair que, selon la façon dont vous traduisez les données de Google Mobility en interventions sur le modèle, cela peut ne pas sembler aussi mauvais, cela semblera assez mauvais, quelle que soit la manière raisonnable de le faire.

Comme je l’ai dit lorsque j’ai écrit la première fois sur les simulations que j’ai effectuées, je prévois d’écrire quelque chose où j’expliquerai plus en détail ce que j’ai fait. Une chose que je prévois de discuter est précisément le « problème de traduction », mais aussi pourquoi cela ne pourra sauver  le modèle. Si j’ai le temps, j’essaierai d’exécuter un ou deux autres scénarios, pour couvrir un éventail plus large des différentes manières dont on pourrait traduire les données de Google Mobility en interventions sur le modèle.

Mais cela ne fera que renforcer mon propos. Soit dit en passant, le scénario de confinement strict n’a pris « que » 37,5 heures à s’exécuter sur mon ordinateur portable, car moins de personnes sont infectées et la boucle sur les personnes infectées est apparemment la partie la plus intensive en calcul de la simulation, vous pouvez donc l’essayer à la maison 😄

Il y a d’autres choses que je n’ai pas expliquées.

Par exemple, la courbe « réelle » explique en fait les retards de déclaration, car si vous utilisez les données brutes, on a l’impression que le nombre de décès baisse plus rapidement qu’en réalité. Encore une fois, j’expliquerai tout cela lorsque j’écrirai à ce sujet.

Voir aussi

De Philippe Lemoine sa critique de l’étude du Lancet qui prouverait que l’hydroxychloroquine est non seulement inefficace, mais dangereuse, ce qui ne veut pas dire que Ph. Lemoine considère que l’hydroxycholoroquine soit efficace ou que le Pr Raoult ne dise pas des âneries selon lui. Les échantillons de cette étude sont très suspects. « Douste-Blazy avait entièrement raison et n’aurait jamais dû admettre qu’il avait tort, mais les défenseurs autoproclamés de la “science”, qui se croient très intelligents, n’ont juste pas compris l’argument »

Hydroxychloroquine update [étude du Lancet est le fait de seulement 4 personnes d'une société privée, données opaques, hôpitaux inconnus, posologies inconnues, dossiers médicaux mal connus, conclusions contredites par celles d'une étude précédente du New England Journal of Medecine avec bien de meilleures données sur les patients.]