Les analyses de grandes quantités de données peuvent dévoiler des choses très intéressantes. C'est d'ailleurs la découverte de phénomènes invisibles à première vue qui m'attire particulièrement dans ce monde de l'analyse et de la visualisation des données.

Aujourd'hui, je vous parle d'une analyse réalisée par l'équipe de Datagenetics. Les données qu'ils ont récoltées et analysées proviennent de 3,4 millions de codes PIN qui ont fuité suite à diverses attaques.

Cette grande base de données nous permet d’analyser les tendances et de mieux comprendre les choix des utilisateurs, pas toujours très originaux, en matière de sécurité numérique.


Les codes PIN les plus courants. Adapté de datagenetics.com / informationisbeautiful

Comment lire ce graphique ?

Ce joli graphique représente les combinaisons possibles de codes PIN de quatre chiffres, ainsi que la fréquence d'utilisation de ces codes.

L'axe vertical et l'axe horizontal vont de 00 à 99 et représentent respectivement les deux premiers et deux derniers chiffres du code PIN. Chaque case représente donc une combinaison de quatre chiffres.

La couleur de la case représente la fréquence d'apparition du code parmi l'ensemble des données analysées. Plus la couleur est claire, plus le code est couramment utilisé. À l'inverse, les cases plus foncées indiquent des combinaisons moins fréquentes.

On peut d'ores et dèjà remarquer trois choses :

  • Grande diagonale claire : Cette diagonale indique que l'utilisation répétée de deux mêmes paires (comme 5353 ou 8181) est courante.
  • Ligne horizontale claire : Cette ligne correspond aux combinaisons commençant par 19. Vous l'aurez deviné, ce sont les codes choisis pour correspondre aux dates de naissance. On remarque aussi que cela commence à s'éclaircir au début des années 2000, reflétant les années de naissance plus récentes.
  • Carré plus clair en bas à gauche : Ce carré, qui va jusqu'à 12 en vertical et environ 30 en horizontal, pourrait bien vous rappeler quelque chose. En effet, il représente les dates d'anniversaire de vous-même, de vos proches, de vos enfants ou de vos petits-enfants ! Ce carré, ce sont toutes les personnes qui utilisent une date de naissance en MM/JJ.

Vous voyez qu'on peut déjà tirer pas mal d'informations de ce graphique.

En continuant l'analyse, on peut ensuite dresser le top des codes PIN les plus utilisés, et le top des moins utilisés.

Le top des codes PIN les plus utilisés :

  • 1234 : Indétrônable.
  • 4321 : Pas mal aussi
  • Le fameux 0000 : Très facile à mémoriser et souvent le code pin par défaut.
  • 7777, 2000, 1111, 1212, 1004, 4444, 6969, 3333 : D'autres exemples de séquences simples et répétitives.

Les codes PIN les moins utilisés :

8557, 8438, 9539, 7063, 6827, 0859, 6793, 0738, 6835, 8093.

Globalement ce sont toutes les combinaisons non répétitives qui ne sont pas une date au format MM/JJ ou JJ/MM.


Améliorer la sécurité de vos codes PIN

Maintenant que vous savez ce qu'est un code PIN commun ou un code PIN rare, il ne vous reste plus qu'à changer le vôtre. Mais oubliez les dates d'anniversaire ou les répétitions de chiffres. Choisissez quelque chose de simple. Par exemple : prenez les décimales de pi positionnées aux indices correspondant aux nombres premiers !

Blague à part, je suis sûr que vous pouvez trouver quelque chose de non prévisible, mais facile à retenir !

Ce type d'analyse est extrapolable à tout mot de passe. Il ne faut pas lésiner sur la sécurité, surtout à une époque où nous sommes très dépendants de nos comptes et autres identités numériques. Un compte sécurisé peut vous éviter bien des ennuis.

Sur ce, je m'en vais modifier mon code PIN qui était, sans mentir, dans le top 10 des codes les plus utilisés.

❤️
Merci de m'avoir lu. Pour me soutenir, partagez le lien infografix.blog