Average color of national flags


Intoduction

The goal of this article is to create a map of each national flag average color. All of the national flags are made from several combinations of colors with specific proportions in their design (except for the Lybian flag which consists on a green rectangle). Caution should also be taken regarding the shade of each color. The blue in the french flag is not the same blue as in the Swedish flag or the blue in the US flag for example... Computation should then be done country by country.

Process

To do so, one just need to "read" the flag from a picture file. This picture will be easily transformed into a matrix of colors (one pixel of the flag will be of one specific color). Once done, it is easy to count the proportion of each color on the flag and average it to create one unique color. You can see some examples below:





These examples show some easy cases but same type of result could be obtained for trickier flag designs.

Result

 

Once done for all the countries, a map could be drawn with the "average" color of each country's national flag.



Interpretation


I am not sure an interpretation could be of any relevance, but it appears that African flags tends to be more green-blackish compared to the rest of the world. On the other hand, South American flags have more vivid colors and north hemisphere countries tends to mostly use a mix of blue and red that results in different shades of pink/purple.



Carte des toilettes publiques de Paris


Et si on veut aller aux petits coins?


La vie est bien faite, la mairie de Paris propose en open data la localisation de toutes les sanisettes et toilettes de la capitale. On peut donc calculer la densité de sanitaires par km². On peut inclure dans le calcul les deux bois (de Vincennes et de Boulogne) puisque nous disposons de l’intégralité du positionnement des différents d'espaces d'aisance. Ici, les 644 points disponibles sont représentés. On supposera dans la suite de cet article que la base de données de la ville de Paris est exhaustive. Je n'ai pas les moyens, ni l'envie (hihihi) d'aller les vérifier une par une. Certains sanitaires de la ville semblent aussi être gérés sous forme de concession et peuvent ne pas apparaitre dans ces résultats. Chaque petit point foncé sur la carte représente une sanisette ou des toilettes.


La carte ci-dessus montre que le IVème arrondissement compte 18 sanitaires par km² suivi par le Xème et le XVIIIème. Les arrondissements les plus mal lotis disposent de moins de 5 sanitaires par km².

De manière plus précise, il est possible (et laborieux), de créer une grille virtuelle (ici il s'agit d'une grille 200 par 200) et à chaque point de cette grille on va évaluer le temps de marche a pied nécessaire pour atteindre les toilettes les plus proches. Pour cela on utilisera une API permettant de calculer les temps de trajet (comme ce que propose Google et plein d'autres sites). La limite de ces API est souvent le nombre de requête que l'on peut effectuer gratuitement ainsi que le temps de calcul. Pour estimer environ 20 000 distances il a fallut plusieurs heures.
Une fois cela fait, on peut alors colorier le résultat. Pour que les différentes zones soit plus facilement visibles, il a été décidé de classer chacun de ces points en cinq catégories en fonction du temps de marche : 

- Moins de 2 minutes de marche à pied aux toilettes les plus proches,
- Entre 2 et 5 minutes, 
- Entre 5 et 10 minutes,
- Entre 10 et 15 minutes et enfin 
- Plus de 15 minutes de marche à pied.
 

 
Évidemment les zones les plus délaissées sont les bois de Vincennes et de Boulogne où il faudra savoir anticiper vos besoins (sinon vous allez vous cacher derrière un arbre, il y en a plein). Il existe malgré tout des zones dans Paris intramuros où il faudra marcher quand même une dizaine de minutes avant de trouver le Graal de faïence.

Répartition par arrondissement

Le graphique ci-dessous représente la probabilité d'être dans chacune des catégories de temps pour chaque arrondissement. Ainsi, dans le XIIème arrondissement, vous aurez à marcher plus de 10 minutes dans la moitié des cas (principalement à cause du bois de Vincennes). On observe a peu près le même résultat pour le XVIème. Finalement, un arrondissement plus compliqué que prévu est le Ier arrondissement, que l'on pourrait supposer bien desservit de par sa position centrale dans la ville mais il y sera peu probable d'y trouver des toilettes sans marche au moins 5 minutes (2/3 des cas).

Conclusion

 

Cette analyse semble montrer une grande disparité dans la répartition des toilettes publiques de la capitale qui ne semble pas forcement liée à leur position respective (les arrondissement centraux ne sont pas nécessairement les mieux lotis).


Cartes des arbres de Paris


Répartition des arbres dans Paris

La mairie de Paris propose en open data plein de jeux de données qui permettent de faire de jolies cartes.

La première carte que l'on peut faire est celle de la répartition des arbres dans les différents arrondissements. En effet, chaque arbre de Paris est localisé et on dispose de différentes informations les concernant (diamètre, hauteur..) On peut alors faire des statistiques par arrondissement. La carte suivante indique la densité d'arbre par arrondissement (exprimée en nombre d'arbres par km²). 

Il faut noter cependant une adaptation qui a du être faite concernant le bois de Boulogne et le bois de Vincennes. En effet, ces deux bois font partie des arrondissements de Paris (le XVIème et le XIIème) mais la mairie ne propose pas d'information sur les massifs, les chiffres sont donc très largement sous-estimés. De plus, ajouter les arbres de ces deux bois augmentent de manière très importante la densité d'arbre par km².

Pour le XIIème arrondissement, en excluant le bois de Vincennes on compte 1974 arbres par km² et en incluant le bois on a 9553 arbres par km².
Pour le XVIème arrondissement, en excluant le bois de Boulogne on compte 2164 arbres par km² et en incluant le bois on a 10208 arbres par km².

Dans la carte qui suit, chaque point gris-vert représente un arbre, sur la surface de la ville on en compte 164 000.


 Tableau de synthèse

ArrondissementSuperficie (km²)Nb d'arbresDensité
11.821705934
20.99538543
31.1712441062
41.627651727
52.542499984
62.151783828
74.0987862148
83.8872461868
92.181188545
102.8934361188
113.6759191615
126.38126001975
137.15169042364
145.61120172140
158.49172892035
167.91171192164
175.67110711953
186104591744
196.79144322125
205.98155722603



Approximation de π grace au triangle de Pascal (le grand frère)

La formule de Leibniz pour approximer π


Il existe de nombreuses manières d'approximer le nombre π. Dans l'antiquité on se contenait d'approximer π au moyen de fractions plus ou moins complexes. Mais dès le Moyen-Age c'est par le biais de séries que l'on a pu avoir les meilleures résultats. Ces séries sont juste des suites (infinies) d'opérations qui, à chaque étape (ou itération) se rapprocheront de plus en plus de la valeur de π. L’inconvénient de cette méthode est que comme ces suites sont infinies, la précision du résultat dépend du nombre d’itération que l'on peut calculer ce qui est limité par le temps que l'on peut y passer et les moyens technologiques à disposition. 

La formule de Madhava-Leibniz fut calculée à l'époque pour les 21 premiers termes ce qui permis de trouver la valeur de π à la 11ème décimale :

Formule de Madhava-Leibniz

Vous pouvez tenter de calculer les 21 premiers termes à la main et me dire combien de temps ça vous a pris.

Une autre version intéressante est attribuée elle aussi à Leibniz, qui fut le premier à réellement l'expliciter (même si Gregory avait défini le cas général et que la formule de Leibniz en est dérivée pour un cas très simple). Elle est définie de la façon suivante :

Formule de Leibniz
Leibniz, hippie avant l'heure

Cette formule est très simple puisqu'elle consiste en une somme de fraction unitaires (c'est à dire de fractions où le numérateur vaut 1) divisée par tous les nombres impairs. C'est simple et facile à se rappeler. Cependant elle à l’inconvénient de converger trèèès lentement ce qui la rend globalement inutile en pratique. Il faut noter que ces nombres impairs composent la deuxième "diagonale"du triangle de Pascal (ça semble trivial mais cela a un intérêt pour la suite)




La formule de Toloza

Une autre version a été trouvée par Jonas Toloza en 2007[1] qui a crée une seconde série qui approxime π en utilisant une série de nombres particulière. La formule est la suivante :

Formule de Toloza

Ici on ne divise pas 1 par des nombres impairs, mais par une série de nombres (1,3,5,10,15,21...) qui se trouvent être ceux composant la troisième "diagonale" du triangle de Pascal. C'est là où ça devient amusant. Les gens se sont alors mis à chercher si il était possible d'utiliser les nombres issus des diagonales du triangle de Pascal pour créer ces séries.


A ce stade, on commence donc à voir où cet article veut en venir.

La formule de Hardisky


Plus récemment, en 2017, Hardisky[2] a trouvé aussi une suite utilisant un élément sur deux mais cette fois-ci dans la quatrième diagonale du triangle de Pascal. La formule étant la suivante :
Formule d'Hardisky




La démonstration des formules de Hardisky et Toloza se basent toutes les deux sur une transformation de la série de Nilakantha Somayaji (1444-1544, oui, c'est pas récent), mathématicien indien qui développa la série suivante :



Ces séries numériques ont vu leur convergence prouvée (oui, le but n'est pas juste de trouver une série qui semble tendre vers π, il faut aussi le prouver) Il existe aussi des formules pour les deux autres diagonales suivantes, elles se sont pas formellement prouvées mais c'est surtout parce qu'au final chaque diagonale possède cette propriété :







On constate ainsi que pour les séries utilisant les chiffres des "diagonales" paires (celles de Leibniz, Hardisky et pour la 6ème rangée) on utilise uniquement une valeur sur 2 et en alternant les signes + et -. Pour les diagonales "impaires", il semble qu'on utilise toutes les valeurs de la diagonale mais en faisant des paires d'additions et de soustractions.

Vitesse de convergence

 

Ces séries convergeant toutes vers π, il peut être interessant de voir si leur vitesse de convergence est très différente. Pour cela nous pouvons calculer les 100 premières valeurs pour chacune des formules et évaluer à chaque fois l'écart (en valeur absolue) entre la valeur obtenue et π. On cherche donc à obtenir une valeur qui se rapproche rapidement de 0.


Le graphique ci-dessus (avec l'axe des ordonnées exprimé en valeur logarithmique) montre que la méthode de Leibniz est bien celle qui converge le moins rapidement puisqu'en utilisant les 100 première valeurs on tombe péniblement à un écart de 0.01 avec π. Alors que plus les séries sont "évoluées" plus cette convergence est rapide.
Avec la formule de Toloza et celle pour la cinquième diagonale on observe des oscillations. Cela s'explique par le fait que la série n'alterne pas pour chaque terme addition et soustraction (comme c'est le cas pour les séries des diagonales paires), mais qu'elle fait des paires d'additions et des paires de soustractions, cela implique donc qu'on s'éloigne deux fois de suite de la vraie valeur puis on s'en rapproche deux fois de suite, ce qui lui donne cet aspect oscillatoire mais ne l'empêche pas néanmoins de converger vers la solution.
En calculant l'estimation par la méthode de Hardisky pour les 100 premières valeurs on obtient 3.1415924, on est donc correct pour les 6 premières décimales (d'où une erreur à 10e-6). Pour la version la plus aboutie on atteint 10 décimales exactes à l'issue des 100 premières itérations.

Conclusion

A notre époque, il existe des séries bien plus efficaces puisque chaque itération améliore la précision de plusieurs décimales à chaque itération (un des algorithme le plus utilisé trouve 8 décimales supplémentaires par itérations). L’intérêt réside donc plutôt dans la découverte de cette relation entre π et le triangle de Pascal qui n'ont a priori aucun rapport. Vous avez pu constater que les preuves "officielles" sont très récentes mais il semble très probable que ces propriétés soient connues depuis plusieurs siècles. Il est probable que personne ne s'est réellement embeté à le démontrer puisque l’intérêt est assez faible.

Votre conduite influence-t-elle les autres conducteurs?

Manipulation mentale et conduite en voiture

La question traitée dans cet article est de savoir si la manière dont un conducteur se comporte sur la route peut avoir une influence positive (ou négative) sur les conducteurs de véhicules qui l'entourent. Pour vérifier cela, il faut mettre en place une expérience simple dont les effets sont quantifiables. Le fait de "bien" conduire étant un domaine très vaste, nous allons regarder quelque chose de plus basique et de plus facilement quantifiable : le fait d'utiliser ou non son clignotant à une intersection.

Le question est donc de savoir si il est possible d'influencer les gens afin qu'ils utilisent (ou non) leur clignotant lorsqu'ils tournent à un carrefour.

Matériel

 

Pour réaliser cette expérience il faut une voiture équipée d'un clignotant et un carrefour. Comme nous allons tester si le fait que l'expérimentateur utilise son clignotant influence les conducteurs autour de lui, il est nécessaire de prendre un carrefour un peu particulier. En effet, si on choisit une intersection complexe et un peu dangereuse, il est possible que par défaut 99% des usagers de la route utilisent déjà leur clignotant. Il sera alors plus difficile d'évaluer l'impact positif de notre comportement si il faut mesurer une variation très faible de ce pourcentage (il est difficile de prouver qu'il y a une influence significative si vous arrivez à faire passer le pourcentage de gens mettant leur clignotant de 99% à 99.5%, cela nécessite plusieurs milliers d'observations).


La solution consiste donc à choisir une intersection où peu de gens utilisent leur clignotant pour tourner (dans l'idéal autour de 50%). Une telle intersection existe et ça tombe bien, elle est sur le trajet que j'emprunte chaque matin pour aller au travail. C'est d'ailleurs cette intersection qui m'a donné l'idée de l'étude puisqu'il m'arrivait parfois d'y oublier de mettre mon clignotant mais en voyant le véhicule me précédant l'utiliser, cela me rappelait que je l'avais oublié. 

Voici la raison pour laquelle peu de personnes utilisent leur clignotant pour tourner à ce carrefour précis : ce carrefour est équipé de feu tricolore à chacune de ses voies et possède la particularité d'être un carrefour à 3 voies (et non pas 4 comme la plupart du temps). De plus, le matin, la grande majorité des gens suivent la route principale qui se dirige vers la grande ville, ce qui implique que le fait de mettre son clignotant semble superflu.


En effet, lorsque les deux voies parallèles sont au vert (Cas 1), la troisième voie est au rouge (logique) mais lorsque la voie unique passe au vert, deux phénomènes se produisent (Cas 2 ) :
- C'est la seule voie dont les véhicules se déplacent (donc utiliser son clignotant sert uniquement a prévenir les véhicules qui vous suivent)
- Tout le monde tourne à gauche le matin en direction de la grande ville toute proche (alors que la route à droite ne mène qu'à quelques bourgs proches). Une estimation empirique liée à mes observations indique qu'à l'heure de pointe du matin au moins 95% des véhicules de cette voie tournent à gauche. Votre clignotant n'est donc utile que pour le véhicule qui vous suit (puisque toutes les autres voies sont à l'arrêt) et il existe de forte chance pour que vous suiviez la même direction que tout le monde. Il n'est donc pas étonnant que les conducteurs ne ressentent pas forcément tout le temps le besoin de prévenir de leur action.


Méthode

Pour quantifier cette influence il suffit donc, chaque matin et de manière aléatoire (oui, il s'agit d'une expérience randomisée, n'en déplaise au Professeur Raoult) d'actionner ou non mon clignotant et de constater si le véhicule qui me suis (et qui a donc une bonne visibilité sur mes clignotants arrière) l'actionne lui aussi. 

Un test de puissance a été réalisé pour estimer le nombre d'observations nécessaires pour mettre en évidence une différence de proportion de 15 points. Les deux proportions a comparer étant :
- Le taux de personnes qui me suivent et mettant leur clignotant quand je le met aussi.
- Le taux de personnes qui met suivent et mettant leur clignotant alors que je ne l'ai pas activé.

Pour un risque alpha à 10% on tombe environ à 100 observations pour chacun de ces groupes. Il fallait donc 200 observations. Sachant que je n'avais qu'une observation par jour, cela implique que cette expérience allait durer au moins 200 jours. Au final elle a duré plus d'un an et demi. Évidemment il n'y avait pas d'observations le week-end mais j'ai aussi décidé d'éliminer les fois où le véhicule qui me suivait était un véhicule professionnel (bus, camion, ...) ainsi que les rares fois où le véhicule tournait à droite mais c'est surtout l'immense nombre de fois où j'oubliais de regarder ce qu'avait fait le véhicule derrière parce que j'avais la tête ailleurs qui a rallongé la durée de cette expérience (que celui qui n'a jamais eu l'esprit ailleurs en allant au boulot me jette la première pierre). Ce fut donc une expérience de longue haleine.

Résultats

Sans plus attendre, les résultats :

Le véhicule derrière moi
n'actionne pas son clignotant
Le véhicule derrière moi
actionne son clignotant
Je n'actionne pas mon clignotant5248
J'actionne mon clignotant3664


Ainsi, quand je ne met pas mon clignotant, la personne qui me suit n'actionne le sien que dans 48% des cas alors que quand je met mon clignotant, la personne qui me suit l'actionne 64% du temps. Il y a donc une différence de 16 points. Le test statistique de comparaison de deux moyennes indique, dans notre cas, une p-value à 0.011 ce qui semble donc confirmer qu'il y a bien eu une influence significative de mon comportement sur les actions des véhicules derrière moi.

Il reste encore des récalcitrants mais mon action a permis d'influencer (environ) 30% des personnes qui ne mettaient pas leur clignotant (52-36)/52.

Conclusion

Cette étude montre qu'il est possible que notre comportement positif ait un impact sur les conducteurs qui nous entourent et que dans ce cas précis, on parvient même a faire changer le comportement "négatif" de 30% d'entre eux. Évidemment nous nous sommes mis dans un cas idéal, grâce à une intersection au profil particulier. Dans le cas plus classique d'une intersection où 90% des gens mettraient déjà leur clignotant pour tourner, votre attitude positif ne parviendrait à faire monter ce taux qu'à 93%, donc un gain minime de 3%. Mais cela permet néanmoins de prouver que si vous conduisez bien, vous aiderez les autres à bien conduire aussi.