Cloudflare est tombé ce matin. Downdetector aussi. Le site qui te dit que c'est cassé était cassé parce que c'était cassé.
Cloudflare est tombé ce matin à 11h20 UTC. “Pic de trafic inhabituel” selon leur status page, ce qui en langage corpo veut dire “on sait pas ce qui s’est passé mais tout est en feu”.
X, ChatGPT, Spotify, Facebook, Canva, plein de sites crypto… erreurs 500 partout. L’action NET a perdu 3,5% en pré-market. Plus de 11 500 rapports de panne sur X rien qu’aux US.
Mais là où ça devient magnifique.
Downdetector était down aussi
Downdetector, LE site que les gens utilisent pour vérifier si des services sont down, est tombé avec. Pourquoi? Parce qu’il utilise Cloudflare pour bloquer les bots.

Le site qui te dit que c’est down… était down parce que c’était down.
On a atteint un niveau d’ironie infrastructurelle assez rare. On invente pas des trucs pareils.
L’internet “décentralisé” ne l’est pas
On aime penser qu’internet est ce réseau distribué et résilient. C’est faux. Une poignée de providers portent la majorité du trafic.
Cloudflare à lui seul gère environ 20% du trafic web mondial. AWS en porte une part similaire. Quand l’un d’eux éternue, la moitié d’internet attrape la grippe.
Et voilà le truc: ton monitoring, ton alerting, ta status page… y’a de bonnes chances que tout ça soit derrière le même CDN que ton app.
Quand ça pète, tu sais pas que ça a pété. Tes users le savent avant toi.
La vraie leçon
Ne diversifie pas juste tes clouds pour le plaisir de cocher la case multicloud. Diversifie tes dépendances critiques.
Ton DNS. Ton CDN. Ton système d’alerting. Ta status page.
Si tout passe par le même tuyau, t’as un single point of failure déguisé en “haute disponibilité”. Ca a l’air redondant sur le schéma d’archi. Ca ne l’est pas.
Quelques actions concrètes:
- Utilise un DNS provider différent de ton CDN principal
- Héberge ta status page sur un autre provider (GitHub Pages marche très bien pour ça)
- Aie un alerting qui ne dépend pas de ton infra principale
- Garde un moyen de communiquer avec tes users qui ne nécessite pas ta stack principale
Le fix
Cloudflare Access et WARP sont revenus en premier. Les services se rétablissent pendant que j’écris.
Mais la prochaine fois que quelqu’un présente une archi “haute disponibilité” avec un SPOF caché, repense à ce matin. Le détecteur de pannes ne pouvait pas détecter les pannes. C’est le genre de mode de défaillance auquel personne ne pense jusqu’à ce que ça arrive.
La redondance c’est pas avoir deux de tout. C’est avoir deux de tout qui ne partagent pas un point de défaillance commun.
Vous avez aimé cet article ?
Faites-le savoir ! Un partage, c'est toujours apprécié.