Toutes les newsletters
#64

Newsletter du 07 Avril 2026

IADockerréseauKubernetesAPIon-callopen sourceLLMsécurité

Il y a quelques années, j'aurais dit que l'IA dans une newsletter DevOps c'était aussi pertinent qu'un festival de street art à Montargis.

Et puis GPT-4 est arrivé, puis les agents, puis les LLMs sur Kubernetes, puis quelqu'un a demandé à un modèle probabiliste de gérer sa prod, et là j'ai compris que l'IA était devenue mon problème, que je le veuille ou non.

Alors j'ai décidé d'en parler parce que ignorer ce qui est en train de remodeler nos infrastructures, nos outils et nos métiers c'est une stratégie qui a autant d'avenir que de ne pas faire ses mises à jour de sécurité.

Je vais donc faire une petite place à la veille IA dans ces pages, avec le même niveau d'enthousiasme mesuré et de cynisme affectueux que j'applique au reste.

Cyril

La pépite de la semaine

On a tous vécu ça : trois heures à lutter avec des variables d'environnement, un reverse proxy qui refuse de causer, et un docker-compose.yml qui ressemble à une lettre de rupture mal rédigée. Les cowboys de chez 37signals ont décidé d'en finir avec ce bordel et proposent ONCE, une plateforme qui installe et gère vos applis Docker avec la même philosophie que leurs produits : sobre, opinionated, et ça marche du premier coup. L'appli est fetchée, installée, bootée, avec mises à jour automatiques, backups, TUI de monitoring et même un healthcheck intégré. Pas de Kubernetes, pas de Helm chart, pas de certification spécialisée requise. Compatible avec n'importe quelle image Docker qui sert du HTTP sur le port 80, ce qui couvre à peu près tout ce que vous avez toujours voulu auto-héberger sans jamais oser le faire. Tourne sur Linux, macOS, un VPS, un Raspberry Pi, ou le vieux ThinkPad qui prend la poussière sous votre bureau et que vous appelez encore "serveur de dev" pour vous donner bonne conscience.

Lire l'article

Le coeur de la veille

Real time network diagnostic in your terminal Une TUI réseau écrite en Rust, zéro config, qui affiche en temps réel vos interfaces, connexions, latences DNS et santé de la passerelle sans vous demander de lire une page de man. Le truc sympa c'est le Flight Recorder : Shift+R pour armer une fenêtre glissante de 5 minutes, Shift+F pour geler l'incident qui vient de se produire, Shift+E pour exporter un bundle complet avec pcap, connexions, DNS et un summary.md lisible par un humain, ce qui sera utile pour expliquer à votre manager ce qui s'est passé sans avoir à reconstituer l'incident de mémoire à 3h du matin. Ça tourne sur macOS et Linux, ça s'installe en une ligne via brew ou cargo, et sudo vous donne en plus la capture de paquets avec décodage TLS, HTTP, DNS et une vingtaine d'autres protocoles. Pour ceux qui passent leur vie à jongler entre iftop, ss, tcpdump et Wireshark en espérant que le problème réseau attende poliment qu'ils aient ouvert le bon outil.

A one-line K8s fix that saved 600 hours a year Pendant des mois, l'équipe infra de Cloudflare a consciencieusement réveillé son ops d'astreinte 100 fois par mois pour regarder K8s faire un chgrp récursif sur des millions de fichiers, parce que c'est le comportement par défaut et que personne ne remet en question les comportements par défaut, c'est bien connu. 30 minutes de restart, 50 heures bloquées par mois, un on-call qui développe une relation compliquée avec son téléphone, pourtant la solution existe depuis Kubernetes 1.20 sous le nom fsGroupChangePolicy: OnRootMismatch, ce qui fait donc environ cinq ans qu'elle attendait dans la doc que quelqu'un tombe dessus par accident. Une ligne de YAML plus tard, le restart prend 30 secondes et 600 heures annuelles ont été rendues à des gens qui auraient pu les passer à faire n'importe quoi d'autre, y compris lire la documentation Kubernetes, ce qui aurait réglé le problème cinq ans plus tôt mais bon, on n'en est plus là.

Privacy-first API platform Postman bouffe 800 Mo de RAM, vous demande un compte, stocke vos collections dans le cloud et a décidé à un moment que devenir un monstre était une stratégie produit viable. ApiArk fait la même chose avec 60 Mo, sans compte, sans cloud, en stockant tout en YAML versionnable dans votre repo comme un être humain normal. Construit sur Tauri v2 plutôt qu'Electron, ce qui signifie que votre laptop ne ressemblera pas à un radiateur pendant que vous testez un endpoint. Ça gère REST, GraphQL, gRPC, WebSocket, SSE et MQTT, propose des mock servers locaux, du monitoring cron-based sans passer par le serveur de quelqu'un d'autre, et importe vos collections Postman en trois clics pour que vous puissiez tourner la page sans cérémonie et constater que vos requêtes sont maintenant des fichiers YAML que vous possédez réellement, concept apparemment révolutionnaire en 2026.

How we designed empathetic alert sounds for on-call Datadog a publié un billet sur la refonte de ses sons de notification on-call, et c'est soit le signe qu'ils se soucient vraiment du bien-être de leurs ingénieurs, soit qu'ils avaient un budget R&D à écouler avant la fin du trimestre, probablement les deux. La démarche est sérieuse : études sur la perception auditive, recherches en sécurité aérienne et médicale, collaboration avec un studio audio spécialisé. On y apprend par exemple que les sons graves autour de 520 Hz réveillent jusqu'à dix fois mieux que les alarmes aiguës traditionnelles, ce qui va à l'encontre de tout ce qu'on a toujours cru et explique peut-être pourquoi votre PagerDuty actuel vous laisse parfois dormir à poings fermés. Ils ont aussi identifié quatre profils de responders : celui qui bosse dans le bruit, celui qui ne veut pas réveiller sa famille, celui qui dort et le quatrième qui préfère une notification avec une blague dedans, ce dernier profil étant clairement écrit par quelqu'un qui n'a jamais géré un incident SEV1 à 4h du matin. Le résultat c'est une bibliothèque de sons qui va du grelot discret au woof d'un chien, parce que la boîte s'appelle Datadog et qu'ils n'allaient quand même pas rater ça.

En bref

The 49MB web page Shubham Gupta a ouvert le New York Times et regardé l'onglet réseau par curiosité malsaine. 422 requêtes, 49 Mo, deux minutes de chargement. Windows 95 tenait dans moins que ça, et avant d'avoir lu un seul mot de journalisme, son navigateur avait déjà participé à une enchère publicitaire en temps réel, reconstruit son identité cross-site pour douze régies différentes, et reçu trois modales superposées dont deux en violation de ses propres CGU. Les devs du Times détestent ça autant que vous, mais personne ne commande vraiment ce système, il s'est juste optimisé tout seul vers le pire résultat possible comme une IA mal alignée avec un objectif de CPM.

15 years of forking - Waterfox Compiler Firefox en 64 bits à 16 ans dans sa chambre, coller ça sur SourceForge et se retrouver avec 50 000 téléchargements en une semaine, c'est le genre de success story qui se termine normalement par une levée de fonds en série A et un hoodie à son nom. Sauf qu'Alex Graf était sur une île méditerranéenne sans réseau tech, sans mentor, et avec des cours à pas rater, ce qui explique sans doute pourquoi quinze ans plus tard il gère encore tout ça seul en se demandant ce qu'il a raté. Le bilan est honnête jusqu'au malaise : les partenariats search c'était le modèle, Bing a décidé que non, et certains mois sont dans le rouge, ce qui dans la bouche d'un fondateur de navigateur indépendant est à peu près aussi surprenant que d'apprendre que l'eau est mouillée. La vraie leçon c'est celle que tout le monde connaît et que personne n'applique : ne jamais mettre sa survie économique dans les mains d'un seul partenaire qui peut vous envoyer un email poli un mardi matin pour tout changer. Quinze ans de Waterfox, c'est finalement le retour d'expérience le plus sincère sur ce que coûte vraiment de faire du logiciel qui respecte ses utilisateurs : beaucoup d'argent, beaucoup de nuits blanches, et un créateur qui n'arrive pas à lâcher l'affaire malgré tout, ce qui est à la fois attendrissant et légèrement inquiétant.

Sous les pavés l'IA

Open Notebook On a tous ce cimetière de PDFs, d'articles et de vidéos YouTube sauvegardés avec les meilleures intentions du monde et jamais ouverts depuis. Open Notebook est une plateforme open source qui ingère tout ça, le vectorise, et vous laisse interroger votre propre base de connaissance via le modèle de votre choix, le tout sans envoyer votre contexte chez Google comme le fait NotebookLM avec son sourire rassurant. Le pipeline RAG supporte les liens, PDFs, TXT, PPT et YouTube, vous gardez la main sur ce que l'IA peut voir ou pas, et vous choisissez vos modèles plutôt que de subir ceux qu'on a décidés pour vous. Le générateur de podcast qui transforme vos notes en épisodes audio est soit une feature géniale pour les gens qui apprennent en écoutant, soit un signal inquiétant sur notre rapport à la lecture, je vous laisse trancher. Un RAG pour les gouverner tous, pour ceux qui veulent un NotebookLM self-hosted où les données restent là où on les met.

LLMs on K8S La CNCF a publié un billet sur la sécurité des LLMs sous Kubernetes, et la conclusion tient en une phrase : Kubernetes sait que vos pods sont healthy, il n'a aucune idée de ce qu'ils font. Déployer Ollama derrière un Service en supposant que l'isolation réseau règle le problème c'est comme mettre un vigile devant une banque et supposer qu'il lit dans les pensées des clients. L'OWASP LLM Top 10 recense les façons classiques de se faire avoir : prompt injection parce que les LLMs font confiance aux utilisateurs comme un stagiaire son premier jour, fuite de credentials parce que le modèle génère du texte plausible sans notion de ce qui est secret, supply chain sur des blobs binaires qu'on ne peut pas auditer, et excessive agency quand on donne à un système probabiliste accès à des APIs qui font de vraies choses. La solution c'est une gateway devant le modèle, exactement comme partout ailleurs, sauf que cette fois personne ne l'a fait parce que les pods étaient healthy et que ça suffisait.