Les arsouyes ont les pieds dans l'eau

Les vacances scolaires sont commencées depuis deux semaines et nous prenions tout doucement un rythme plus estival lorsqu’une fuite d’eau a inondé la pièce où se trouvent nos serveurs...

Comme vous le savez déjà, nous pratiquons l’auto-hébergement. Au départ, parce qu’on est geek et qu’on adore ça, mettre en place un réseau et configurer des services. C’est toujours valorisant de voir le résultat. Sans compter l’indépendance et le confort numérique que ça nous apporte.

Ensuite, l’auto-hébergement nous permet de rester au contact du terrain. Contrairement à beaucoup de consultants, qui on rapidement fait leur deuil technique, nous ne voyons pas comment nous pourrions conseiller efficacement nos clients, ou faire de l’informatique légale (pénale ou civil), bref, rester crédibles, sans expérience concrète du sujet et de ses problématiques réelles.

Et cette semaine, le sort avait justement décidé de nous en faire gagner, de l’expérience...

Mini-inondation, photo prise après avoir arrêté les serveurs.
Mini-inondation, photo prise après avoir arrêté les serveurs.

Alors qu’on déjeunait, on entend un bruit, avons-nous lancé une lessive ? Non, pas ce matin. Pourtant, le bruit est insistant et évoque de l’eau... On ouvre les portes et on découvre 2cm d’eau équitablement répartie... le temps de couper la vanne générale, le geyser s’interrompt et on va pouvoir gérer le problème.

Techniquement, on a déplacé la baie, fait venir des plombiers puis corrigé quelques petites choses qui n’avaient pas redémarré automatiquement.

Réagir

Après avoir coupé l’arrivée d’eau à la vanne générale, la situation n’empire plus, c’est chouette, mais on n’en est qu’au début...

Premier dans notre liste de priorité, les serveurs. Avec 2 cm d’eau, ils ne risquent pas grand chose. La baie a un débattement suffisamment haut et les câbles ne touchent pas l’eau. Par prudence (et pour dégager de la place), on va quand même les arrêter (proprement) puis les débrancher et les déménager dans l’arrière cuisine, sous la baie.

Pour les reconnaître facilement, nous avions utilisé des câbles réseau de couleur différente. Le truc, c’est qu’on a jamais documenté ça et, dans la précipitation, on l’a pas noté non plus... Pour l’AD, c’est facile, une seule prise et on sait où elle va. Pour proxmox, il y en a deux... Après un ip addr show, on repère la carte qui supporte les vlans et on peut brancher les deux derniers câbles.

Les serveurs, sous la baie de brassage.
Les serveurs, sous la baie de brassage.

Le temps que les serveurs démarrent, on vérifie qu’Internet et le NAS sont accessibles et on peut passer à la suite. Appeler l’assurance et le plombier et leur faire comprendre que, non, avec des enfants, on ne peut pas attendre lundi sans eau courante (5 jours). Vider les lieux de tout ce qui traine par terre et écoper l’eau.

Les plombiers nous ont casé le lendemain midi, entre d’autres clients qui avaient pris rendez-vous. On peut de nouveau prendre des douches (pour les toilettes, on puisait l’eau dans la piscine).

Respirer et corriger

Heureusement, nous n’avons eu aucun dégât. Physiquement, seuls quelques cartons vides sont foutus. Informatiquement, tout fonctionne comme avant. Enfin presque...

activedia @ pixabay
activedia @ pixabay

On a d’abord constaté quelques ratés réseaux : des latences inexplicables sur certains sites, des coupures lorsque la mibox lit un film sur le NAS... en fait, c’était l’IPv6 des routeurs qui ne s’était pas remontée toute seule. Il a suffit de redémarrer le maître pour qu’il se reconfigure correctement, puis redémarrer l’esclave dans un deuxième temps.

Certains services accessoires n’étaient pas disponibles, le temps de s’en rendre compte, de se connecter à proxmox et voir que c’est normal :

Ces deux corrections faites, on est de nouveau en ligne 🎉.

Et maintenant ?

Il reste encore quelques petits détails, comme re-déménager les serveurs à leur place parce que là, ils ne sont pas climatisés, ce qui oblige à laisser une porte ouverte et le bruit va finir par nous taper sur le système. Mis à part quelques petits problèmes annexes, tout est revenu à la normale très rapidement (la coupure réseau n’a pas duré 15 minutes et la coupure d’eau a été corrigée en 30 heures).

La prochaine fois que nous parlerons de gestion de pannes avec un client, nous pourrons ajouter « Petite Innondation » à nos achievements :

Un peu d’originalité avec de l’eau ne fait pas de mal. Pour le feu, on préfère attendre mais on vous racontera.