{"id":9101,"date":"2020-12-09T17:02:35","date_gmt":"2020-12-09T16:02:35","guid":{"rendered":"https:\/\/scienceetonnante.com\/?p=9101"},"modified":"2020-12-09T17:04:24","modified_gmt":"2020-12-09T16:04:24","slug":"le-repliement-des-proteines","status":"publish","type":"post","link":"https:\/\/scienceetonnante.com\/blog\/2020\/12\/09\/le-repliement-des-proteines\/","title":{"rendered":"Le repliement des prot\u00e9ines &#038; l&rsquo;I.A AlphaFold de DeepMind"},"content":{"rendered":"<p>Ca fait longtemps que je voulais faire ce sujet en vid\u00e9o, je l&rsquo;avais d&rsquo;ailleurs trait\u00e9 dans mon livre \u00ab\u00a0Insoluble mais vrai !\u00a0\u00bb consacr\u00e9 aux grands probl\u00e8mes ouverts de la science. L&rsquo;actualit\u00e9 m&rsquo;a devanc\u00e9 avec la publications des r\u00e9sultats de la comp\u00e9tition CASP, et l&rsquo;incroyable performance de l&rsquo;algorithme AlphaFold de DeepMind.<\/p>\n<p><iframe title=\"Le repliement des prot\u00e9ines : R\u00e9solu par l&#039;intelligence artificielle AlphaFold ?\" width=\"770\" height=\"433\" data-src=\"https:\/\/www.youtube.com\/embed\/OGewxRMME8o?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" class=\"lazyload\" data-load-mode=\"1\"><\/iframe><\/p>\n<p>Ce genre de sujet est assez compliqu\u00e9 \u00e0 traiter en profondeur, car on y touche \u00e0 plusieurs champs disciplinaires : la biologie \u00e9videmment, la chimie, la physique et maintenant l&rsquo;IA. Pour ceux qui seraient encore curieux, voici quelques compl\u00e9ments.<\/p>\n<h3>Les prot\u00e9ines c&rsquo;est compliqu\u00e9<\/h3>\n<p>Parlons pour commencer des prot\u00e9ines. Pour illustrer mon propos j&rsquo;ai pas mal h\u00e9sit\u00e9 entre plusieurs prot\u00e9ines. Je voulais quelque chose de pas trop gros mais qui soit quand m\u00eame parlant. J&rsquo;ai initialement pens\u00e9 \u00e0 l&rsquo;insuline, mais elle a deux inconv\u00e9nients : elle est en fait form\u00e9e de deux chaines (reli\u00e9es par des ponts disulfure), donc mon propos \u00e9tait un peu moins clair. Et en plus elle n&rsquo;a \u00ab\u00a0que\u00a0\u00bb 51 acides amin\u00e9s. Or pour distinguer les \u00ab\u00a0petits peptides\u00a0\u00bb des prot\u00e9ines, il y a une limite arbitrairement fix\u00e9e \u00e0 100 A.A., donc officiellement l&rsquo;insuline n&rsquo;est pas une prot\u00e9ine. En fait on s&rsquo;en fout, mais je sais qu&rsquo;il y a toujours quelques grincheux au fond qui attendent avec impatience que je dise un truc du genre \u00ab\u00a0l&rsquo;insuline est une prot\u00e9ine\u00a0\u00bb \ud83d\ude42<\/p>\n<p>Mais rassurez-vous, j&rsquo;ai dit plein d&rsquo;autres trucs faux. Par exemple ce que j&rsquo;ai montr\u00e9 comme \u00e9tant \u00ab\u00a0une prot\u00e9ine\u00a0\u00bb du SARS-Cov2 n&rsquo;est en fait qu&rsquo;un domaine, c&rsquo;est \u00e0 dire un morceau de prot\u00e9ine. La comp\u00e9tition CASP porte d&rsquo;ailleurs souvent seulement sur des domaines et pas des prot\u00e9ines enti\u00e8res, car on consid\u00e8re que les diff\u00e9rents domaines d&rsquo;une prot\u00e9ine se replient suffisamment ind\u00e9pendamment les uns des autres pour pouvoir les traiter plus ou moins s\u00e9par\u00e9ment.<\/p>\n<p>D&rsquo;ailleurs j&rsquo;ai choisi de ne pas introduire ces termes, mais pour les prot\u00e9ines on parle de structure primaire (pour les chaines), secondaires (avec les h\u00e9lices et feuillet), tertiaire (pour la forme compl\u00e8te) et quaternaire (pour les interactions avec les autres prot\u00e9ines). Vous verrez peut-\u00eatre passer souvent ces termes.<\/p>\n<p>Concernant les maladies provoqu\u00e9es par un mauvais repliement, j&rsquo;ai mentionn\u00e9 le cas de certaines maladies neurod\u00e9g\u00e9n\u00e9ratives caus\u00e9es par des substances amylo\u00efdes. Si j&rsquo;ai bien suivi, dans ce cas l\u00e0 \u00e7a n&rsquo;est pas une perte de fonction (li\u00e9e \u00e0 un mauvais repliement) qui pose probl\u00e8me, mais l&rsquo;accumulation en d\u00e9p\u00f4ts fibreux (plaques) qui causent des perturbations dans les tissus.<\/p>\n<h3>Structure et g\u00e9om\u00e9trie des chaines<\/h3>\n<p>J&rsquo;ai pass\u00e9 sous silence la mani\u00e8re dont les acides amin\u00e9s se lient pour effectivement former une chaine. Il s&rsquo;agit de la liaison peptique, qui permet d&rsquo;accrocher l&rsquo;acide d&rsquo;un AA avec l&rsquo;amine d&rsquo;un autre.<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-9102 aligncenter lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/1000px-AminoacidCondensation.svg_.png\" alt=\"\" width=\"1000\" height=\"233\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/1000px-AminoacidCondensation.svg_.png 1000w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/1000px-AminoacidCondensation.svg_-300x70.png 300w\" data-sizes=\"(max-width: 1000px) 100vw, 1000px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1000px; --smush-placeholder-aspect-ratio: 1000\/233;\" \/><\/p>\n<p>Un point int\u00e9ressant concerne la g\u00e9om\u00e9trie spatiale qu&rsquo;on obtient. Ci-dessous, vous avez une image du squelette de la chaine. On voit un acide amin\u00e9 au milieu, reli\u00e9 par une liaison peptique \u00e0 son pr\u00e9d\u00e9cesseur et son successeur. Pour caract\u00e9riser la g\u00e9om\u00e9trie du squelette, il faut donner les angles Phi et Psi de chaque acide amin\u00e9, ainsi que l&rsquo;angle associ\u00e9 \u00e0 la liaison peptidique (not\u00e9 ici \\(\\omega\\)). La nature de cette liaison fait que cet angle est contraint \u00e0 0 ou 180\u00b0, et donc les degr\u00e9s de libert\u00e9 restants ne concernent que les angles au sein de chaque AA (dits \u00ab\u00a0dih\u00e9draux\u00a0\u00bb)<\/p>\n<p><img decoding=\"async\" class=\"wp-image-9103 aligncenter lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/379px-Protein_backbone_PhiPsiOmega_drawing.svg_.png\" alt=\"\" width=\"332\" height=\"630\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/379px-Protein_backbone_PhiPsiOmega_drawing.svg_.png 379w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/379px-Protein_backbone_PhiPsiOmega_drawing.svg_-158x300.png 158w\" data-sizes=\"(max-width: 332px) 100vw, 332px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 332px; --smush-placeholder-aspect-ratio: 332\/630;\" \/>Il existe des repr\u00e9sentations permettant de visualiser les distributions des valeurs angles dih\u00e9draux. (Encore <a href=\"https:\/\/en.wikipedia.org\/wiki\/Ramachandran_plot\" target=\"_blank\" rel=\"noopener\">merci Wikip\u00e9dia<\/a>). On appelle \u00e7a un diagramme de Ramachandran<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-9104 aligncenter lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Ramachandran_plot_general_100K.jpg\" alt=\"\" width=\"750\" height=\"670\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Ramachandran_plot_general_100K.jpg 750w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Ramachandran_plot_general_100K-300x268.jpg 300w\" data-sizes=\"(max-width: 750px) 100vw, 750px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 750px; --smush-placeholder-aspect-ratio: 750\/670;\" \/><\/p>\n<p>Sur celui ci-dessus, on voit clairement des concentrations dans certaines r\u00e9gions qui correspondent aux h\u00e9lices alpha et aux feuillets beta.<\/p>\n<p>D&rsquo;ailleurs concernant les h\u00e9lices, j&rsquo;ai mentionn\u00e9 le cas le plus courant d&rsquo;une liaison avec l&rsquo;AA situ\u00e9 4 cases plus loin, mais les cas +3 et +5 existent aussi. On trouve d&rsquo;ailleurs un m\u00e9lange puisqu&rsquo;en moyenne une h\u00e9lice alpha est en fait une h\u00e9lice 3.6 (la valeur moyenne du pas.)<\/p>\n<h3>La cristallographie aux rayons X<\/h3>\n<p>Voici un sujet qui aurait m\u00e9rit\u00e9 plus d&rsquo;approfondissement, car il est \u00e0 la fois tr\u00e8s technique et tr\u00e8s important. Notons que d\u00e9j\u00e0 un certain nombre de prix Nobel ont d\u00e9j\u00e0 \u00e9t\u00e9 distribu\u00e9 pour la r\u00e9solution de structures de prot\u00e9ines par cette technique.<\/p>\n<p>L&rsquo;\u00e9tape de cristallisation semble particuli\u00e8rement ardue : il faut purifier, mettre dans un solvant, trouver des conditions de cristallisation. Un biochimiste avec qui j&rsquo;en ai discut\u00e9 (merci Antoine !) me disait qu&rsquo;il testait typiquement entre 600 et 1000 conditions de cristallisation diff\u00e9rente pour esp\u00e9rer en trouver une qui fonctionne !<\/p>\n<p>Ensuite sur l&rsquo;interpr\u00e9tation de la figure de diffraction, il s&rsquo;agit en fait d&rsquo;un processus it\u00e9ratif faisant intervenir des mod\u00e9lisations que l&rsquo;on va ensuite fitter aux donn\u00e9es exp\u00e9rimentales.<\/p>\n<p>Concernant d&rsquo;ailleurs les simulations que j&rsquo;ai \u00e9voqu\u00e9es, et l&rsquo;histoire des niveaux d&rsquo;\u00e9nergie, le param\u00e8tre que l&rsquo;on cherche \u00e0 minimiser est <strong>l&rsquo;\u00e9nergie libre<\/strong>, qui prend \u00e0 la fois en compte l&rsquo;\u00e9nergie et l&rsquo;entropie. En pratique, comme on est pas au z\u00e9ro absolu, ce qu&rsquo;on va avoir est plut\u00f4t une distribution de niveaux d&rsquo;\u00e9nergie.<\/p>\n<h3>La comp\u00e9tition CASP<\/h3>\n<p>Je n&rsquo;ai pas tout regard\u00e9 des r\u00e9sultats de la comp\u00e9tition CASP, mais tout est en ligne. On trouve notamment des <a href=\"https:\/\/www.predictioncenter.org\/casp14\/doc\/presentations\/\" target=\"_blank\" rel=\"noopener\">diapos de la conf\u00e9rence<\/a> qui vient d&rsquo;avoir lieu et au cours de laquelle les r\u00e9sultats ont \u00e9t\u00e9 annonc\u00e9s.<\/p>\n<p>On y trouve d&rsquo;ailleurs des r\u00e9ponses \u00e0 une question qu&rsquo;on peut l\u00e9gitimement se poser : est-ce que par chance la comp\u00e9tition de cette ann\u00e9e \u00e9tait \u00ab\u00a0plus facile\u00a0\u00bb que les autres ann\u00e9es, ce qui pourrait expliquer le score faramineux de DeepMind ? Eh bien a priori non.<\/p>\n<p>On peut caract\u00e9riser la difficult\u00e9 en regardant \u00e0 quelle point les domaines propos\u00e9s \u00e9taient \u00e9loign\u00e9s de chose connues, et voici le r\u00e9sultat en comparant aux ann\u00e9es pr\u00e9c\u00e9dentes (pour les 3 cat\u00e9gories)<\/p>\n<p><img decoding=\"async\" class=\"size-large wp-image-9105 aligncenter lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-13.25.08-1024x862.png\" alt=\"\" width=\"770\" height=\"648\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-13.25.08-1024x862.png 1024w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-13.25.08-300x252.png 300w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-13.25.08-1536x1293.png 1536w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-13.25.08-554x466.png 554w\" data-sizes=\"(max-width: 770px) 100vw, 770px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 770px; --smush-placeholder-aspect-ratio: 770\/648;\" \/><\/p>\n<p>On voit que la comp\u00e9tition CASP14 de 2020 est a priori la plus difficile de ces derni\u00e8res ann\u00e9es.<\/p>\n<p>Malgr\u00e9 tout, et c&rsquo;est important de le noter, la performance en pr\u00e9diction d&rsquo;AlphaFold2 est \u00e9videmment d\u00e9pendante du contenu des donn\u00e9es utilis\u00e9es pour entrainer les neurones. Si on s&rsquo;amusait \u00e0 inventer ex-nihilo des prot\u00e9ines (de fa\u00e7on totalement synth\u00e9tique) tr\u00e8s diff\u00e9rentes de celles existantes, il est vraisemblable que la performance ne serait pas si bonne. On ne peut pas dire qu&rsquo;AlphaFold2 soit \u00ab\u00a0universel\u00a0\u00bb dans sa capacit\u00e9 de pr\u00e9diction.<\/p>\n<h3>Le fonctionnement d&rsquo;Alphafold<\/h3>\n<p>Pour parler des entrailles de l&rsquo;algorithme, je me suis essentiellement bas\u00e9 sur le papier qui est sorti au d\u00e9but de l&rsquo;ann\u00e9e sur AlphaFold 1<\/p>\n<p><em>Senior, Andrew W., et al. \u00ab\u00a0<a href=\"https:\/\/www.nature.com\/articles\/s41586-019-1923-7\" target=\"_blank\" rel=\"noopener\">Improved protein structure prediction using potentials from deep learning<\/a>.\u00a0\u00bb Nature 577.7792 (2020): 706-710.<\/em><\/p>\n<p>Ainsi que sur le <a href=\"https:\/\/deepmind.com\/blog\/article\/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology\" target=\"_blank\" rel=\"noopener\">billet de blog sorti par DeepMind<\/a> pour CASP14. Entre temps, j&rsquo;ai aussi vu <a href=\"https:\/\/www.predictioncenter.org\/casp14\/doc\/presentations\/2020_12_01_TS_predictor_AlphaFold2.pdf\" target=\"_blank\" rel=\"noopener\">les diapos de cette pr\u00e9sentation<\/a> \u00e0 la conf\u00e9rence CASP.<\/p>\n<p>Dans le papier, on a une architecture pr\u00e9sent\u00e9e qui est celle dont j&rsquo;ai surtout parl\u00e9<\/p>\n<p><img decoding=\"async\" class=\"size-full wp-image-9107 aligncenter lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-14.40.40.png\" alt=\"\" width=\"1588\" height=\"1018\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-14.40.40.png 1588w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-14.40.40-300x192.png 300w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-14.40.40-1024x656.png 1024w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-14.40.40-1536x985.png 1536w\" data-sizes=\"(max-width: 1588px) 100vw, 1588px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1588px; --smush-placeholder-aspect-ratio: 1588\/1018;\" \/><\/p>\n<p>Comme je le dis dans la vid\u00e9o, l'\u00a0\u00bbimage\u00a0\u00bb en entr\u00e9e est tr\u00e8s riche, puisque pour chaque paire d&rsquo;acide amin\u00e9s, on a plus de 480 features. Deux points \u00e0 noter : en plus de la matrice de distance, on pr\u00e9dit \u00e9galement les angles dih\u00e9draux, et surtout ce ne sont pas des pr\u00e9dictions \u00ab\u00a0uniques\u00a0\u00bb mais des distributions.<\/p>\n<p>On peut le voir dans le papier, qui l&rsquo;illustre sur une matrice. On regarde l&rsquo;acide amin\u00e9 n\u00b029 (repr\u00e9sent\u00e9 par une seule ligne\/colonne dans la matrice), mais derri\u00e8re \u00e7a il y en fait une distribution de probabilit\u00e9 pour la distance \u00e0 chacun des autres AA.<\/p>\n<p><img decoding=\"async\" class=\"aligncenter size-full wp-image-9109 lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-16.00.44.png\" alt=\"\" width=\"1622\" height=\"802\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-16.00.44.png 1622w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-16.00.44-300x148.png 300w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-16.00.44-1024x506.png 1024w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-16.00.44-1536x759.png 1536w\" data-sizes=\"(max-width: 1622px) 100vw, 1622px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1622px; --smush-placeholder-aspect-ratio: 1622\/802;\" \/><\/p>\n<p>Le travail de reconstruction de la forme \u00e0 partir de la matrice de distance est en fait une maximisation de probabilit\u00e9.<\/p>\n<p>Tiens notez au passage que sur la matrice de distance, on \u00ab\u00a0voit\u00a0\u00bb bien les structures secondaires : l&rsquo;h\u00e9lice alpha ce sont les AA de 1 \u00e0 environ 14, o\u00f9 chaque AA est peu \u00e9loign\u00e9 de ses voisins. Les feuilles beta ce sont les petites \u00ab\u00a0anti diagonales\u00a0\u00bb<\/p>\n<p>Bon mais tout \u00e7a c&rsquo;\u00e9tait AlphaFold 1, qu&rsquo;est-ce qui a chang\u00e9 avec AlphaFold 2 ? On ne le sait pas compl\u00e8tement.\u00a0L&rsquo;architecture que semble adopter AlphaFold 2 semble potentiellement un peu diff\u00e9rente (ci-dessous un extrait de la conf\u00e9rence CASP)<\/p>\n<p><img decoding=\"async\" class=\"aligncenter size-full wp-image-9108 lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50.png\" alt=\"\" width=\"3096\" height=\"1694\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50.png 3096w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50-300x164.png 300w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50-1024x560.png 1024w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50-1536x840.png 1536w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/Capture-decran-2020-12-09-a-15.56.50-2048x1121.png 2048w\" data-sizes=\"(max-width: 3096px) 100vw, 3096px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 3096px; --smush-placeholder-aspect-ratio: 3096\/1694;\" \/><\/p>\n<p>Une id\u00e9e int\u00e9ressante qui m\u00e9rite d&rsquo;\u00eatre d\u00e9velopp\u00e9e, c&rsquo;est celle des \u00ab\u00a0MSA\u00a0\u00bb : <em>Multiple Sequence Alignement (<\/em>bien qu&rsquo;elle ne soit pas sp\u00e9cifique au travail de DeepMind). L&rsquo;id\u00e9e consiste pour une s\u00e9quence donn\u00e9e \u00e0 rechercher dans les bases de donn\u00e9es des s\u00e9quences qui ressemblent (par exemple codant pour un g\u00e8ne proche chez une autre esp\u00e8ce), et \u00e0 voir quelles sont les AA qui soit ont \u00e9t\u00e9 pr\u00e9serv\u00e9s, soit ont co-\u00e9volu\u00e9. Quand deux AA varient toujours ensemble, cela laisse penser que changer l&rsquo;un sans changer l&rsquo;autre n&rsquo;est pas viable, et donc que ces deux AA doivent avoir un r\u00f4le structurel li\u00e9. C&rsquo;est ce qu&rsquo;on trouve dans l&rsquo;image ci-dessous (extrait toujours des diapos de la conf\u00e9rence)<\/p>\n<p><img decoding=\"async\" class=\"aligncenter size-full wp-image-9110 lazyload\" data-src=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA.png\" alt=\"\" width=\"3350\" height=\"1422\" data-srcset=\"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA.png 3350w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA-300x127.png 300w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA-1024x435.png 1024w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA-1536x652.png 1536w, https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/MSA-2048x869.png 2048w\" data-sizes=\"(max-width: 3350px) 100vw, 3350px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 3350px; --smush-placeholder-aspect-ratio: 3350\/1422;\" \/><\/p>\n<p>Toujours sur AlphaFold, une question qu&rsquo;on peut se poser concerne le temps (et le nombre de processeurs) n\u00e9cessaires pour le faire tourner. Apparemment, pour la partie \u00ab\u00a0entrainement\u00a0\u00bb, on parle de 128 TPU (Tensor Processing Unit) pendant quelques semaines. C&rsquo;est beaucoup, mais \u00e9videmment pas quand on a Google derri\u00e8re. Pour la partie pr\u00e9diction, c&rsquo;est moins clair. Sur du deep learning classique (un r\u00e9seau utilis\u00e9 en feed forward), la pr\u00e9diction va tr\u00e8s vite. L\u00e0 \u00e7a semble plus compliqu\u00e9. Il semblerait que DeepMind ait \u00e9t\u00e9 \u00e9vasif l\u00e0-dessus pour l&rsquo;instant. Ca serait plut\u00f4t de l&rsquo;ordre de plusieurs heures, en tout cas pas \u00ab\u00a0quelques millisecondes\u00a0\u00bb.<\/p>\n<p>Donc on peut se demander si, pour la conception de nouveaux m\u00e9dicaments, AlphaFold peut \u00eatre pour l&rsquo;instant comp\u00e9titif face \u00e0 des approches exp\u00e9rimentales \u00ab\u00a0haut-d\u00e9bit\u00a0\u00bb qui consistent \u00e0 tester des tas de mol\u00e9cules de fa\u00e7on parall\u00e8le. Je ne connais pas assez la question pour r\u00e9pondre !<\/p>\n<p><em>Merci \u00e0 Antoine Schramm du Max Planck Institute, qui a r\u00e9pondu \u00e0 mes questions na\u00efves et tordues !<\/em><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ca fait longtemps que je voulais faire ce sujet en vid\u00e9o, je l&rsquo;avais d&rsquo;ailleurs trait\u00e9 dans mon livre \u00ab\u00a0Insoluble mais vrai !\u00a0\u00bb consacr\u00e9 aux grands probl\u00e8mes ouverts de la science. L&rsquo;actualit\u00e9 m&rsquo;a devanc\u00e9 avec la publications des r\u00e9sultats de la comp\u00e9tition CASP, et l&rsquo;incroyable performance de l&rsquo;algorithme AlphaFold de DeepMind. Ce genre de sujet est<\/p>\n","protected":false},"author":1,"featured_media":9114,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[7,45],"tags":[],"class_list":{"0":"post-9101","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-biologie","8":"category-informatique"},"jetpack_featured_media_url":"https:\/\/scienceetonnante.com\/blog\/wp-content\/uploads\/2020\/12\/fond.png","jetpack_sharing_enabled":true,"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/posts\/9101","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/comments?post=9101"}],"version-history":[{"count":7,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/posts\/9101\/revisions"}],"predecessor-version":[{"id":9117,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/posts\/9101\/revisions\/9117"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/media\/9114"}],"wp:attachment":[{"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/media?parent=9101"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/categories?post=9101"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/scienceetonnante.com\/blog\/wp-json\/wp\/v2\/tags?post=9101"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}