📖 Rappel : Dans le chapitre précédent, on a couvert le modèle réseau Kubernetes, les CNI et les Network Policies. Ici, on monte d’un cran avec le Service Mesh — la couche invisible qui sécurise, observe et contrôle toutes les communications entre tes microservices.

Quand tu gères un cluster avec des dizaines de services, la question n’est plus “mes pods se parlent-ils ?” mais “comment se parlent-ils ?”. Le trafic est-il chiffré ? Que se passe-t-il quand un service lag ? Qui appelle qui, avec quelle latence et quel taux d’erreur ? Le Service Mesh répond à tout ça — sans modifier une seule ligne de code applicatif. C’est de l’infrastructure pure, transparente pour tes développeurs.

Pourquoi c’est important

Dans une architecture microservices classique, chaque équipe gère elle-même les retries, les timeouts, le TLS mutuel, le circuit breaking… et elle le fait dans son langage, avec son framework. Le résultat, c’est un patchwork fragile et impossible à auditer.

🔥 Cas réel : Une fintech européenne avec 40+ microservices laissait chaque équipe coder sa propre logique de retry. Lors d’un incident sur le service de paiement, les retries en cascade ont provoqué un effet domino : le service lent recevait encore plus de requêtes, qui timaient out, ce qui déclenchait d’autres retries en amont. Un classique de retry storm. Après l’adoption d’Istio, la logique de retry a été déplacée dans le mesh avec des budgets de retry et du circuit breaking. Les incidents en cascade ont été divisés par 5.

Le Service Mesh résout ce problème en déplaçant toute la complexité réseau hors de ton code. Le principe : un conteneur proxy léger (appelé sidecar) est injecté automatiquement à côté de chaque pod. Ce proxy intercepte tout le trafic entrant et sortant de façon transparente. Tes applications n’en savent rien — elles continuent à appeler http://backend:8080 comme d’habitude, et le mesh s’occupe du reste.

💡 Tip DevOps : L’injection du sidecar se fait via un mutating admission webhook. Tu n’as pas à modifier tes Deployments — il suffit de labelliser le namespace. Kubernetes injecte le sidecar automatiquement à la création de chaque pod.

Comprendre le concept

Un Service Mesh repose sur deux composants fondamentaux :

Le Data Plane — ce sont les sidecar proxies déployés à côté de chaque pod. Envoy pour Istio, linkerd2-proxy (en Rust) pour Linkerd. Ils interceptent tout le trafic, appliquent le mTLS, gèrent les retries et le load balancing, collectent les métriques (latence, taux d’erreur, throughput).

Le Control Plane — c’est le cerveau. Il distribue la configuration à tous les sidecars, gère la rotation des certificats TLS, centralise les politiques de sécurité et de routage. Pour Istio, c’est istiod. Pour Linkerd, c’est le destination controller.

Le flux concret quand Service A appelle Service B : App A → Sidecar A → (tunnel mTLS) → Sidecar B → App B. Tout est chiffré, tracé, contrôlé. Zéro modification côté applicatif.

🧠 À retenir : Le Service Mesh est une couche infrastructure. Il ne remplace pas ton code métier — il libère tes développeurs de tout le boilerplate réseau (TLS, retries, observabilité) pour qu’ils se concentrent sur la logique business.

Commandes essentielles

Installer Istio

Pour démarrer avec Istio, installe le CLI istioctl puis déploie le control plane avec le profil demo (idéal pour du dev/test). Ensuite, active l’injection automatique de sidecars sur ton namespace cible :

# Télécharger istioctl et l'ajouter au PATH
curl -L https://istio.io/downloadIstio | sh -
cd istio-* && export PATH=$PWD/bin:$PATH

# Installer le control plane (profil demo)
istioctl install --set profile=demo -y

# Activer l'injection sidecar automatique
kubectl label namespace production istio-injection=enabled

# Vérifier la santé du mesh
istioctl analyze
kubectl get pods -n istio-system

Gérer le trafic avec VirtualService

La puissance d’Istio, c’est le routage déclaratif. Ce VirtualService envoie 90% du trafic vers v1 et 10% vers v2 (canary), avec des retries automatiques sur les erreurs 5xx :

apiVersion: networking.istio.io/v1beta1
kind: VirtualService
metadata:
  name: payment-service
  namespace: production
spec:
  hosts:
    - payment-service
  http:
    - route:
        - destination:
            host: payment-service
            subset: v1
          weight: 90
        - destination:
            host: payment-service
            subset: v2
          weight: 10
      retries:
        attempts: 3
        perTryTimeout: 2s
        retryOn: 5xx,reset,connect-failure
      timeout: 10s

⚠️ Attention : Un VirtualService sans DestinationRule associée ne fonctionnera pas. Les subsets v1 et v2 doivent être définis dans une DestinationRule qui mappe les labels de tes pods. C’est l’erreur n°1 des débutants Istio.

Sécuriser avec mTLS et AuthorizationPolicy

Pour activer le chiffrement mTLS obligatoire et implémenter du zero-trust (chaque service déclare explicitement qui peut l’appeler) :

# Forcer mTLS sur tout le namespace
apiVersion: security.istio.io/v1beta1
kind: PeerAuthentication
metadata:
  name: default
  namespace: production
spec:
  mtls:
    mode: STRICT
---
# Seul le frontend peut appeler le backend, et uniquement en GET/POST sur /api
apiVersion: security.istio.io/v1beta1
kind: AuthorizationPolicy
metadata:
  name: backend-authz
  namespace: production
spec:
  selector:
    matchLabels:
      app: backend
  rules:
    - from:
        - source:
            principals: ["cluster.local/ns/production/sa/frontend"]
      to:
        - operation:
            methods: ["GET", "POST"]
            paths: ["/api/v1/*"]

L’alternative légère : Linkerd

Linkerd est le choix quand tu veux un mesh simple, performant et avec peu de friction. Son proxy est écrit en Rust : ~10 MB de RAM par sidecar (contre ~50 MB pour Envoy/Istio) et ~1ms de latence ajoutée :

# Installer le CLI Linkerd
curl --proto '=https' --tlsv1.2 -sSfL https://run.linkerd.io/install | sh
export PATH=$HOME/.linkerd2/bin:$PATH

# Déployer le control plane
linkerd install --crds | kubectl apply -f -
linkerd install | kubectl apply -f -
linkerd check

# Activer l'injection + dashboard d'observabilité
kubectl annotate namespace production linkerd.io/inject=enabled
linkerd viz install | kubectl apply -f -
linkerd viz dashboard &

💡 Tip DevOps : Linkerd active mTLS par défaut, sans aucune configuration. Dès que le sidecar est injecté, tout le trafic pod-to-pod est chiffré automatiquement. Zéro YAML de sécurité à écrire — c’est sa killer feature.

Cas concret entreprise

🔥 Cas réel : Un e-commerce avec 25 microservices veut adopter Istio sans big bang. Voici la stratégie en 4 phases qui a fonctionné :

Phase 1 — Observabilité pure. Installer Istio en mode PERMISSIVE, injecter les sidecars namespace par namespace en commençant par le staging. Aucun changement de comportement pour les applications, mais tu obtiens immédiatement les golden signals (latence, taux d’erreur, throughput) par service via Kiali.

Phase 2 — mTLS progressif. Basculer en STRICT namespace par namespace. D’abord les environnements non-critiques (monitoring, logging), puis staging, et enfin production. À chaque étape, vérifier avec istioctl analyze qu’aucun service ne communique sans sidecar.

Phase 3 — Traffic management. Introduire les VirtualServices pour les canary deployments sur les services critiques (paiement, checkout). Configurer le circuit breaking via les DestinationRules avec outlierDetection : les pods qui renvoient trop d’erreurs 5xx sont automatiquement éjectés du pool de load balancing.

Phase 4 — Zero-trust. Déployer les AuthorizationPolicies pour verrouiller les communications : chaque service ne peut appeler que les services dont il a explicitement besoin. C’est la cerise sur le gâteau sécurité.

Pour débugger le réseau à chaque phase, garde un pod netshoot sous la main :

# Pod de debug réseau éphémère
kubectl run netshoot --image=nicolaka/netshoot -it --rm -- bash

# Depuis le pod : tester la connectivité vers un service
curl -v http://backend.production.svc.cluster.local:8080/health

# Depuis ta machine : vérifier les endpoints
kubectl get endpoints backend -n production

Pièges fréquents

⚠️ Attention — Les erreurs classiques qui font perdre des heures :

Le namespace sans label d’injection. C’est l’erreur la plus courante. Sans istio-injection=enabled (ou l’annotation Linkerd), aucun sidecar n’est injecté. Tes pods tournent “nus” et tu te demandes pourquoi rien ne fonctionne. Vérifie toujours avec kubectl get ns --show-labels.

Basculer en STRICT trop tôt. Si un seul pod n’a pas encore de sidecar quand tu passes en STRICT mTLS, il ne pourra plus communiquer avec le reste du mesh. Utilise PERMISSIVE pendant toute la phase de migration, et ne bascule que quand istioctl analyze est vert.

Ignorer l’overhead mémoire. Chaque sidecar Envoy consomme ~50 MB de RAM. Sur un cluster de 200 pods, ça représente 10 GB rien que pour les sidecars. Ajuste tes requests/limits et prévois la capacité en amont.

Ne pas mesurer la latence ajoutée. Un mesh ajoute 1-5ms de latence par hop. Sur une chaîne de 6 microservices, c’est potentiellement 30ms de plus. Mesure avant/après avec le dashboard Linkerd ou Kiali, et assure-toi que tes SLOs sont toujours respectés.

Mélanger Istio et Linkerd. Un seul mesh par cluster. Les deux interceptent le trafic via iptables — ils ne cohabitent pas. Choisis l’un ou l’autre.

🧠 À retenir : Istio = puissant mais lourd (~50 MB/sidecar, 2-5ms). Linkerd = léger et simple (~10 MB/sidecar, ~1ms). Choisis Linkerd pour le mTLS et l’observabilité. Choisis Istio si tu as besoin du traffic management avancé (canary, fault injection, traffic mirroring).

Exercice pratique

Objectif : Déployer Linkerd et observer le trafic chiffré entre deux services.

Installe Linkerd sur ton cluster de test avec linkerd install --crds | kubectl apply -f - puis linkerd install | kubectl apply -f -
Crée un namespace mesh-demo avec l’annotation linkerd.io/inject=enabled
Déploie un serveur nginx et un pod client qui boucle des requêtes curl vers le serveur
Installe le dashboard d’observabilité : linkerd viz install | kubectl apply -f -
Observe les métriques live : linkerd viz stat deploy -n mesh-demo
Vérifie que le mTLS est actif entre les deux services : linkerd viz edges deploy -n mesh-demo

Bonus : Mesure le temps de réponse curl avec et sans sidecar Linkerd pour quantifier l’overhead réseau du mesh.

À retenir

Le Service Mesh gère la communication inter-services via des sidecar proxies — mTLS, retries, observabilité — sans toucher au code applicatif
Istio est le mesh complet : traffic management avancé (canary, fault injection, mirroring), sécurité fine avec AuthorizationPolicy, mais plus lourd en ressources
Linkerd est le mesh léger : mTLS par défaut, proxy Rust ultra-performant, parfait quand tu n’as pas besoin du routing avancé d’Istio
Adopte un mesh progressivement : observabilité → mTLS PERMISSIVE → STRICT → traffic management → zero-trust
Utilise netshoot pour le debug réseau, istioctl analyze pour valider Istio, linkerd check pour Linkerd
Le mesh a un coût : mesure l’overhead en RAM, CPU et latence avant de l’imposer en production

Service Mesh : Istio et Linkerd

Pourquoi c’est important

Comprendre le concept

Commandes essentielles

Installer Istio

Gérer le trafic avec VirtualService

Sécuriser avec mTLS et AuthorizationPolicy

L’alternative légère : Linkerd

Cas concret entreprise

Pièges fréquents

Exercice pratique

À retenir

🖥️ Pratique sur ton propre serveur

Contenu réservé aux abonnés

Série pas encore débloquée

Série : Apprendre Kubernetes

Articles liés

CNI et networking K8s en détail

GitOps : principes et architecture

Workflow GitOps et comparaison des outils