Tag

Statistiques

Browsing

En ces temps troublés, j’ai eu bien du mal à trouver un sujet à traiter qui me motive, et qui nous sorte des réflexions sur le COVID-19. Le salut est finalement venu d’un sujet un peu en dehors de ma zone habituelle…et qui n’est pas sans résonance avec l’actualité !

https://www.youtube.com/watch?v=yeX_Zs7zztY

Tout d’abord, je voudrais remercier celui par qui ce sujet est arrivé à mes neurones : Cyrille Rossant dont l’excellent livre sur le calcul interactif en Python mentionnait l’article de Reinhart et Rogoff comme une bonne raison de s’intéresser de près à la reproductibilité des expériences numériques.

Je crois que j’en avais déjà entendu parler (probablement dans cette tribune), mais l’histoire était sortie de ma mémoire…

Dans cette nouvelle vidéo, je m’attaque à ces fameuses « études américaines » auxquelles ont fait dire tout et son contraire…

https://www.youtube.com/watch?v=NkdczX1Sq-U

Détail amusant : quand j’ai écrit le script, j’ai imaginé au hasard un sujet d' »étude américaine » : le heavy metal et la dépression. Or après j’ai vérifié, il existe bien des publications ayant étudié cette association ! D’ailleurs les résultats ont l’air subtils car en non-randomisé, il semblerait que l’écoute du metal soit plutôt corrélée avec les symptômes dépressifs, mais qu’en traitement randomisé il ait un effet bénéfique. Paradoxal, non ? Mais bon j’avoue que je n’ai pas creusé.

Quelques petits compléments d’usage, pour ceux qui voudraient aller plus loin…

Une rediffusion qui date un peu, mais sur un sujet intriguant : les fluctuations des marchés financiers !

Il y a quelques jours le prix 2011 du « Meilleur jeune économiste français » a été décerné à Xavier Gabaix, qui travaille et enseigne à l’Université de New-York. En collaboration avec des physiciens, il s’est notamment penché sur la question des fluctuations des marchés financiers, et a proposé un modèle pour tenter d’expliquer l’universalité de ces fluctuations.

Les fluctuations du CAC40

On le sait bien, les marchés financiers fluctuent, et ce de manière apparemment imprévisible. Mais en analysant un historique de ces fluctuations, on peut observer des choses intéressantes, notamment mesurer la probabilité d’apparition des évènements extrêmes que sont les fortes hausses ou fortes baisses.

Prenons notre bon vieux CAC40, et regardons son historique depuis une vingtaine d’années (ci-contre). On va s’intéresser à ses fluctuations d’un jour sur l’autre, exprimées en pourcentage. Vous savez ce chiffre que nous annonce le présentateur à la fin du journal télé « La bourse de Paris a clôturé en baisse de 2.12% ».

p5_champagneLa nouvelle a fait grand bruit parmi les chercheurs : d’après un statisticien américain, il se pourrait que presque 25% des résultats publiés dans littérature scientifique soient tout simplement faux.

Voilà qui ne va pas aider la science, déjà pas mal discréditée aux yeux d’une partie de nos concitoyens. Mais qu’est-ce que cette nouvelle veut dire ?

Pour le comprendre, il faut se pencher sur la méthode scientifique que les chercheurs utilisent pour valider leurs résultats, celle qui leur permet de décider si oui ou non ils ont vraiment trouvé quelque chose.

homer-simpsonNon, le paradoxe de Simpson ne tire pas son nom de Homer, mais de Edward Simpson, le statisticien qui l’a décrit pour la première fois en 1951. Il s’agit d’un de ces paradoxes mathématiques qui peut nous faire des noeuds à la tête, mais qui malheureusement est bien plus qu’une simple curiosité : bien comprendre ce paradoxe peut s’avérer essentiel pour prendre les bonnes décisions !

Alors si vous ne connaissez pas ce phénomène statistique très contre-intuitif, lisez la suite, et les bras devraient vous en tomber !

moby-dick-rockwell-kent-illusLe livre Moby Dick, publié par Hermann Melville en 1851, ne connut semble-t-il qu’un succès modeste lors de sa première parution. Ce n’est qu’après la Première Guerre mondiale – et plus de 20 ans après la mort de Melville – que le livre fut finalement acclamé par le public et la critique.

Moby Dick fait partie aujourd’hui des œuvres majeures de la littérature anglo-saxonne, et est considéré comme un livre unique, à la langue et au style bien particulier. L’alliance de la numérisation massive des livres et des techniques d’analyse de données permet aujourd’hui de comprendre pourquoi.

Il y a quelques jours le prix 2011 du « Meilleur jeune économiste français » a été décerné à Xavier Gabaix, qui travaille et enseigne à l’Université de New-York. En collaboration avec des physiciens, il s’est notamment penché sur la question des fluctuations des marchés financiers, et a proposé un modèle pour tenter d’expliquer l’universalité de ces fluctuations.

Les fluctuations du CAC40

On le sait bien, les marchés financiers fluctuent, et ce de manière apparemment imprévisible. Mais en analysant un historique de ces fluctuations, on peut observer des choses intéressantes, notamment mesurer la probabilité d’apparition des évènements extrêmes que sont les fortes hausses ou fortes baisses.

Prenons notre bon vieux CAC40, et regardons son historique depuis une vingtaine d’années (ci-contre). On va s’intéresser à ses fluctuations d’un jour sur l’autre, exprimées en pourcentage. Vous savez ce chiffre que nous annonce le présentateur à la fin du journal télé « La bourse de Paris a clôturé en baisse de 2.12% ».

En principe, notre ADN sait beaucoup de choses sur nous. Mais il n’est pas si simple de faire parler la quantité immense d’information qu’il contient. En 2008, des chercheurs ont réussi à montrer qu’il est possible de lire nos origines géographiques dans nos gènes, moyennant une méthode statistique adaptée : l’analyse en composantes principales.

A la pêche aux gènes

Pour faire parler nos gènes, il y a deux difficultés à surmonter : transcrire les informations contenues dans notre ADN en données numériques, puis trouver les bonnes méthodes statistiques qui permettent d’exploiter ces données.

Pour réaliser leur étude publiée dans Nature [1], John Novembre et ses collaborateurs sont partis d’une population de 3192 individus européens dont ils ont réalisé un génotypage. Mais qu’est-ce que cela signifie, génotyper ?

C’est Noël, et je ne vais probablement pas beaucoup écrire dans les 2 semaines à venir. Alors parlons justement de la trêve de Noël.

Il semble que cette expression ait été popularisée au cours de la Première Guerre Mondiale, alors que des soldats des deux fronts fraternisaient ensemble au soir du 24 décembre. Et en amour comme à la guerre, il semble que cette trêve existe bien.

En tout cas c’est ce que montrent les étonnantes statistiques compilées par David McCandless et Lee Byron, grâce à notre ami Facebook.