Histoire du COVID-19 – chapitre 6 - Partie 3 : La date clé de 2012 - quand et comment un virus apparenté au RaTG13 aurait-il pu passer à l'être humain et en combien de temps ?
Partie 3. La date clé de 2012 - quand et comment un virus apparenté au RaTG13 aurait-il pu passer à l'être humain et en combien de temps ?
Retrouvez la partie 1 et la partie 2
Pour la plupart des virologues, le SARS-CoV-2 serait apparenté avec le RaTG13 par l'intermédiaire d'un ancêtre commun issu de la chauve-souris et le passage à l’humain serait récent. Il y a 3,8% de différences entre les deux génomes, soit environ 1140 mutations, ce qui correspondrait entre 50 et100 ans d’évolution selon une fiche expert du 11 juin de l'Institut de France (Académie des Sciences) et une date comprise entre 1970 et 1995 pour l’ancêtre commun du SARS-CoV-2 et du RaTG13. Ce calcul se base sur un taux de mutation de 1 à 2 mutations par mois, mesuré en début d'épidémie (de début janvier à fin février), et un nombre de mutations approximé à 1200 (au lieu de 1138) par rapport au RaTG13. Ce calcul qui reprend celui de Bedford et Hutchinson publié en janvier manque de rigueur scientifique. La façon dont ce taux de mutations est établi n'est pas décrite. De plus, un taux calculé sur 2 mois, est réducteur de la réalité, voire très trompeur, car les recombinaisons (rappariements) entre virus qui sont une caractéristique essentielle des coronavirus ne sont pas prises en compte, ce qui fausse complètement l'estimation. Pour s'en rendre compte, il est primordial de comprendre comment fonctionne l'horloge moléculaire d'évolution des coronavirus de type SARS. Bien que d'une fiabilité relative les horloges moléculaires apportent des indications précieuses, à la fois sur l'évolution de virus apparentés de façon très distance et sur la date d'apparition d'une lignée virale particulière dans une population. L'horloge spécifique de la lignée SARS-Cov2 permet d'établir de façon heuristique que sa date d'apparition se situerait entre fin octobre et mi-décembre 2019 (ndlr typo corrigé le 2/12/2020). Ce résultat est cohérent par rapport aux cas identifiés rétrospectivement vers mi-novembre à Wuhan. Cependant, en Italie, une étude a détecté l'apparition d'anticorps spécifiques au SARS-Cov2 durant la période pré-pandémique, dès septembre 2019 dans la région de Lombardie, soit deux mois plus tôt. Étant donné que dans beaucoup de cas l'infection est asymptomatique ou pauci symptomatique, et que seulement 2 à 3% des personnes présentant des symptômes sont hospitalisées (France), le virus a donc pu circuler de façon indétectable assez longtemps dans la période pré-pandémique.
Description de l'horloge moléculaire – le cas d'école du virus de la poliomyélite
Il faut savoir que l'établissement de l'horloge moléculaire d'évolution des espèces (incluant les virus) est une branche mathématique fondamentale de la science du vivant. Ses fondements remontent aux années 1960 avec les travaux d'Emile Zuckeerkandl, du prix Nobel de chimie Linus Pauling et du généticien japonais Motoo Kimura. Émile Zuckeerkandl et Linus Pauling remarquent en 1962 que le nombre d'acides aminés, qui diffèrent entre les hémoglobines des différentes espèces, change de façon approximativement linéaire avec le temps lorsque l'on classe les espèces par leur ancienneté d'apparition sur terre. Ils ont généralisé leur observation en formulant l'hypothèse de « l'horloge moléculaire », c'est-à-dire que le taux de mutations reliées à l'évolution de n'importe quel gène étaient approximativement constantes à travers le temps et les différentes lignées ou espèces.
Aujourd'hui, les méthodes automatisées de séquençage à haut débit permettent d'obtenir un très grand nombre de séquences d'un même virus qui se réplique et mute rapidement. On peut établir ainsi la phylogénie de l'épidémie et calibrer son horloge moléculaire avec une assez grande précision, mais pas forcément avec grande exactitude.
Il faut se rendre compte, qu'il existe en réalité plusieurs horloges moléculaires qui décrivent les différents processus d'évolution d'un virus en fonction du type de mutation impliqué. Lorsque le résultat de la mutation ne change en rien la séquence en acides aminés, une fois les gènes transcrits en protéines fonctionnelles, la mutation est dite silencieuse ou synonyme. Lorsque la mutation induit un changement dans la composition en acides aminés d'un gène la mutation est dite non synonyme. Parmi les mutations non synonymes, il y en a de deux types : celles qui vont influencer le fonctionnement du virus (pathogénie, contagiosité, durée d'incubation,...) et celle qui n'auront pas d'effet remarquable. Les mutations qui changent de façon marquée le fonctionnement d'un virus, et lui permettent de se répandre dans une partie de la population, engendrent de ce fait une lignée nouvelle, appelée aussi variant.
Une étude très poussée sur les horloges moléculaires du virus de la poliomyélite, un virus à ARN qui comme le SARS-Cov2 se réplique très rapidement, a pu se faire et sert de référence en la matière. En 1981, un poliovirus importé du Moyen-Orient a supplanté un virus endémique de type 1 présent sur un territoire correspondant au nord des Andes (Vénézuela, Pérou). Le virus importé a circulé largement jusqu'en 1991, année de son éradication. Le programme de surveillance a fourni des isolats viraux [NDA, un isolat est un représentant du virus contenu dans un échantillon] qui étaient en relation proche du virus importé et des isolats représentant deux principales lignées divergentes. L'analyse de toutes les séquences, par rapport à celle du virus initial, a permis d'estimer le taux de fixation (i.e. taux d'apparition) des différentes catégories de mutations.
Ainsi, le taux Ka de fixation des mutations silencieuses était très rapide [(1.00 ± 0.08) × 10−2 mutation/site/an] et celui des mutations non silencieuses 30 fois plus lent Ka [(0.03 ± 0.01) × 10−2] (i.e., taux de mutation du gène long de 2.643 nucléotide qui encode les 4 protéines de la capside du virus qui ont une très grande importance fonctionnelle car elles assurent la reconnaissance du récepteur de pénétration cellulaire CD155). Le taux global de mutation fixées calculé Kt [(1.03 ± 0.10) × 10−2] est par définition très proche du taux des mutations silencieuses qui sont très largement plus fréquentes que les mutations non silencieuses puisqu'elles impactent le virus d'aucune façon. Les horloges Ks et Kt permettent d'étudier la divergence de deux isolats épidémiologiques très voisins alors que l'horloge Ka estime le temps d'évolution entre des génotypes différents ou des variants possédant des propriétés infectieuses distinctes. Ces changements découlent d'une ou plusieurs mutations non silencieuses affectant des parties du génome avec une forte implication fonctionnelle, comme les protéines capsides du poliovirus ou dans le cas du SARS-Cov2 le domaine de liaison au récepteur ACE2 de la protéine S. En 10 ans, le virus de la polio (d'une longueur d'environ 8kb) introduit dans les Andes a donc accumulé plus de 800 mutations, soit 10% de son génome, dont seulement environ 27 (0.3%) se situaient sur la capside. La capside est doublement importante en raison de sa structure géométrique très complexe et de sa fonction de pénétration, d'où un Ka très faible traduisant une horloge d'évolution très lente car la plupart des mutations dans cette région du génome sont délétères pour le virus.
De façon similaire, le ratio Ka/Ks = 0.054 (soit Ka 20 fois plus lent que Ks) pour la protéine S des coronavirus à SARS (SARSr-Rh-BatCoV) a été établi par Lau et al. en 2010, indiquant le caractère primordial de cette protéine pour la survie du virus chez les chauves-souris rhinolophes. Chez les chauves-souris, cette protéine est optimisée par l'évolution et de ce fait elle ne mute quasiment plus. Toute mutation de cette protéine entraînerait un affaiblissement de la capacité de pénétration cellulaire incompatible avec la survie du virus en compétition avec les autres souches virales au sein de l'espèce réservoir. Par contre, l'épidémie de SARS-Cov de 2002 a démontré que le ratio Ka/Ks était voisin de 1. pour les SARSr-CoV de civettes (1.5) et les SARSr-CoV humains (1.0) car le virus tend à optimiser sa pénétration cellulaire dans ces nouveaux hôtes.
Un problème général en ce qui concerne les virus à ARN, comme le SARS-Cov2, qui évoluent rapidement est que les tendances évolutives sur une large échelle sont difficiles à cerner. C'est-à-dire, les relations de parenté entre des virus similaires mais de génotypes différents, qui ont coévolué sur un large territoire et une très longue période de temps, sont difficiles à établir avec exactitude à cause de la méconnaissance de nombreux chaînons manquants. De plus, les virus se recombinent entre eux et avec d'autres d'autres virus de type différents. Il est donc impossible de reconstruire un arbre phylogénique complet les reliant ce qui entraîne l'inexactitude de la calibration de l'horloge moléculaire Ka fonctionnelle.
Estimation correcte de la date d'apparition de l'hypothétique ancêtre commun au SARS-Cov2 et RaTG13
Premièrement, nous reprenons la méthodologie de l'Institut de France de façon plus rigoureuse en utilisant le taux global de mutations fixées Kt = 1.1 ± 0.4 × 10−3 mutation/site/an, calculé avec précision par Duchene et al. entre début janvier et le 24 février. Ce taux est 2 fois plus rapide que celui estimé par l'Institut de France qui l'avait estimé pourtant sur une même periode. Soulignons qu'il est établi à un moment de l'épidémie où peu ou pas de variants de recombinaisons fixées ont émergé et que, compte tenu de la barre d'erreur, il indique que l'apparition du virus souche de l'épidémie humaine a eu lieu entre fin octobre et mi-décembre 2019.
Pour 1138 mutations (entre RaTG13 et SARS-Cov2) et une séquence de circa 30.000 nucléotides, nous obtenons un temps d'évolution situé entre 25 et 54 ans qui devrait être divisé par deux si l'on considère que les deux virus ont divergé à la même vitesse à partir du même ancêtre commun. Mais cela induit une erreur par ce que le virus RaTG13 a arrêté d'évoluer en 2013 (date de l'échantillon prélevé), ce que l'Institut de France a négligé en raison de leur estimation du temps d'évolution (50 à 100 ans) très supérieur à la différence temporelle entre l'apparition du SARS-Cov2 et le prélèvement. Mais avec des temps plus courts, nous devons ajuster plus finement le calcul (y + x = 25 ou y + x = 54 et y – x = 7, avec x et y étant les temps d'évolution du RaTG13 et du SARS-Cov2). Nous obtenons donc une date comprise entre 1990 et 2004 (au lieu de 1970 et 1995) pour l'apparition de l'hypothétique ancêtre commun.
Cependant l'horloge d'évolution utilisée dans ce calcul est établie sur l'évolution rapide d'une lignée virale sur deux mois et ne prend pas en compte la fréquence des rappariements ou réassortiments au long cours (sur des années) de variants proches, très importante chez les coronavirus de chauves-souris. Ce processus conduit nécessairement à une accélération de l'horloge moléculaire. Une idée du taux possible de fixation des mutations, prenant en compte l'évolution au long cours est donnée par l'article de Benvenuto et al., avec une valeur calculée de 6.58 × 10−3 mutation/site/an avec un intervalle de confiance de 95% entre 5.2 et 8.1 × 10−3 mutation/site/an. Cette valeur est 2 fois plus élevée par rapport à la valeur très sérieuse de 2.82 × 10−3 obtenue pour l'ORF1ab (voir chapitre 5) au cours de l'étude écoépidémiologique qui fait référence en la matière, conduite par Lau et al. entre Hong-Kong et la Chine, sur les migrations de chauves-souris rhinolophes (fer à cheval) et l’hétérogénéité de leur virus de type SARS.
L'estimation de Benvenuto et al. est probablement relativement approximative étant donné le faible nombre (n=3) de coronavirus connus proches de la lignée du SARS-Cov2. Il faut noter, en a parte, qu'ils restent étrangement extrêmement discret dans leur article au sujet des 3 virus les plus proches du SARS-Cov2, utilisés pour calibrer l'horloge évolutive. Ils ne se réfèrent pas à eux directement dans le texte et il faut consulter la figure décrivant l'arbre phylogénique qu'ils établissent pour apercevoir en petit caractères les noms de code GenBank de ces virus. Il s'agit du MG772933 et MG772934 et qui ne sont ni plus ni moins que des virus ZC45 et ZXC21, issus de la recherche militaire chinoise amplement décrite au chapitre 4 partie 3, le troisième virus étant le RaTG13.
Cette discrétion est évidemment conduite par la nécessité d'éviter que leur article soit repris et déformé par les sites d'information complotistes. Cependant, ce procédé maladroit des auteurs ne peut évidemment qu'attiser les sites complotistes, surtout que la dissidente de Hong Kong, Li Meng Yan, prétend tout simplement que le SARS-Cov2 a été fabriqué à partir des virus ZC45 et ZXC21. Cependant, nous allons voir plus loin cette hypothèse, bien que troublante, n'est pas étayée de preuves.
Il peut paraître étrange que des virus isolés par les chercheurs militaires à partir d'échantillon de colonies côtières de chauves-souris dans les provinces de Guangdong et de Fujian se retrouvent dans le calcul d'une horloge évolutive. On peut se demander évidemment comment il se fait que des virus identifiés dans des sites à 2000 km de la mine de Mojiang dans le Yunnan soient finalement relativement proches du SARS-Cov2. Mais n'oublions pas que le virus du pangolin est plus proche du SARS-Cov2 que les virus ZC45 et ZXC21. Il faut surtout comprendre que les seuls virus de type SARS à disposition sont le SARS-Cov, les ZC45 et ZXC21, celui du pangolin et le SARS-Cov2. Les militaires ont forcément séquencé en premier les virus de type SARS parmi les dizaines de coronavirus de chauves-souris qu'ils ont identifiés car ce sont les plus dangereux.
Benvenuto ne donne que peu d'indication de la fiabilité de son résultat. Il se contente de dire que ses calculs sont auto-cohérents car le modèle mathématique particulier utilisé pour établir d'horloge est celui le plus cohérent avec l'ensemble de l'arbre phylogénique (coefficient de corrélation R2 = 0.85). Le fait que les virus militaire soient géographiquement très éloignés est un plus pour la fiabilité de l'horloge. Cependant, comme il le note, la proximité temporelle de l'origine des séquences militaires pourrait affecter le résultat et engendrer un biais d'accélération de l'horloge.
Les valeurs de l'horloge calculées par Benvenuto et al. indiquent que le temps d'évolution entre le SARS-Cov2 et le RaTG13 se situerait entre 7,3 et 4,7 années. Cela donne une fourchette entre 2012 et 2015 recouvrant exactement par sa borne supérieure l'incident de la mine de Mojiang. De ce fait, le RaTG13 ou un virus extrêmement proche pourrait bien être l'ancêtre du SARS-Cov2. La borne inférieure de l'intervalle est sans signification car elle situerait l'ancêtre commun après l'apparition du RaTG13.
En utilisant la valeur obtenue par Lau et al., dont nous ne connaissons pas la barre d'erreur (non publié), nous obtenons la date de fin 2009 pour l'ancêtre commun du SARS-Cov2 et du RatG13. En tenant compte d'une marge d'erreur possible de 15% sur la valeur de Lau et al. on obtient un intervalle de temps compris entre 2008 et 2011. Ce qui montre que dans l'hypothèse probable ou la vitesse de l'horloge calculée par Benvenuto et al. serait surestimée nous obtiendrions un résultat qui continue d'indiquer le RatG13, ou un virus proche apparu entre fin 2008 et 2015, comme ancêtre commun du SARS-Cov2,. L'incident de la mine de Mojiang en 2012 se trouve au milieu de cette fenêtre temporelle. Notons que l'étude de Lau et al. a montré que l'ancêtre commun au SARS-Cov de fin 2002 et du coronavirus de chauve-souris le plus proche remonterait à 1995. C'est-à-dire environ le même intervalle de temps (7 ans) qui sépare l'apparition du SARS-Cov2 de l'incident de Mojiang.
En conclusion, de toute évidence le séquençage en 2018 du virus RaTG13, dont pourrait certainement descendre le SARS-Cov2, n'a pas été révélé avant février 2020. De même, l'incident épidémique de la mine de Mojiang a été caché à l'OMS. Les dates des fichiers de séquençage et les déclarations de Shi Zheng Li dans son interview à Science contredisent ce qu'elle a publié dans le journal Nature. L'attitude et les déclarations de Shi Zheng montrent qu'elle s'est trouvée en février 2020 dans l'obligation de révéler en urgence au Monde l'existence du virus RaTG13. D'un autre côté, elle ne peut pas avouer directement qu'elle savait que les mineurs de Mojiang avec été contaminés par un coronavirus de type SARS, ce que tout dans leur tableau clinique indique. D'ailleurs, s'il n'avait pas été question d'une infection par coronavirus de type SARS pourquoi serait-elle allée à la mine collecter des échantillons fécaux de chauves-souris ? Pourquoi cet incident n'a pas été déclaré à l'OMS ? Quel rôle a joué Shi Sheng Li dans cette mascarade ? Où sont passés les tonnes de guano extraites de la mine ? Tout cela appelle une enquête internationale et un audit méticuleux de l'Institut de virologie de Wuhan et de son laboratoire P4.
Le virus a incubé dans la population pendant une longue période Des preuves scientifiques indiscutables sont là qui montrent que le virus SARS-Cov2 était présent en Italie du nord (Lombardie) dès la fin de l'été 2019. Durant l'année 2019, et plus particulièrement l'été, un nombre extrordinaire de touristes chinois (pas moins de 3,5 millions) ont débarqué en Italie du nord. Les causes probables de cet engouement soudain pour l'Italie ont probablement été la guerre commerciale sino-américaine ainsi que les violences au cours des manifestations trop durement réprimées des gilets jaunes et les grèves à répétition en France. Cela veut dire qu'un ou des virus pré-pandémiques circulaient largement en Chine durant l'année 2019.
L'horloge moléculaire des coronavirus à SARS de chauves-souris indique qu'il ne faut que quelques années pour qu'un virus franchisse la barrière des espèces. La fréquence très élevée des réassortiments de coronavirus chez les chauves-souris en fait un réservoir sans cesse renouvelé de virus qui se comptent probablement par centaines ou milliers vu le nombre de colonies de chauves-souris en Chine. Les 10 000 marchés aux animaux sauvages et 20 000 fermes d'élevage de gibier, apparues ces 25 dernières années ont engendré une porosité sans précédent de la barrière des espèces. La Chine est devenue un incubateur géant à coronavirus à SARS par un mécanisme résonant d'amplification de contagiosité dû à des allers-retours de virus entre des animaux intermédiaires et l'être humain. Un exemple de ce mécanisme a été mis en évidence dans des fermes d'élevage de visons aux Pays-Bas, où le SARS-Cov2 est repassé de visons contaminés à l'être humain. Cette promiscuité omniprésente entre les chauves-souris, le gibier d'élevage et l'être humain qui n'est toujours pas contrôlée va augmenter la fréquence de transmission de zoonoses à l'homme si rien n'est fait dès à présent.
À LIRE AUSSI
L'article vous a plu ? Il a mobilisé notre rédaction qui ne vit que de vos dons.
L'information a un coût, d'autant plus que la concurrence des rédactions subventionnées impose un surcroît de rigueur et de professionnalisme.
Avec votre soutien, France-Soir continuera à proposer ses articles gratuitement car nous pensons que tout le monde doit avoir accès à une information libre et indépendante pour se forger sa propre opinion.
Vous êtes la condition sine qua non à notre existence, soutenez-nous pour que France-Soir demeure le média français qui fait s’exprimer les plus légitimes.
Si vous le pouvez, soutenez-nous mensuellement, à partir de seulement 1€. Votre impact en faveur d’une presse libre n’en sera que plus fort. Merci.