Ingénieur DevOps/SRE avec 25+ ans d'expérience dont 8 ans dédiés au DevOps et à la fiabilisation des systèmes critiques. J’ai réduit de 30% le temps de déploiement via l’industrialisation CI/CD, augmenté de 20% la détection anticipée d’incidents par une observabilité renforcée, et mis en place des SLOs / error budgets pilotant les releases. Passionné par l’automatisation (toil reduction), le chaos engineering et l’IA appliquée à l’IT.
Expérience professionnelle
- CI/CD & automatisation : Industrialisation du pipeline de release (Jenkins, Artifactory) permettant une réduction de 30% du temps de déploiement. Automatisation de tâches critiques via Shell/Python pour éliminer les erreurs manuelles et réduire le toil.
- Supervision & observabilité : Optimisation de la supervision (Geneos, Dynatrace, ELK, Grafana) avec mise en place d’alertes proactives, entraînant une augmentation de 20% de la détection anticipée d’incidents. Contribution à la définition des SLIs et SLOs pour les services critiques.
- Production & batch : Gestion et fiabilisation des chaînes Autosys, réduction notable des incidents batch et amélioration de la stabilité applicative.
- Migrations & obsolescence : Contribution aux migrations Oracle/Sybase et aux mises à niveau d’infrastructures critiques, garantissant la continuité de service.
- Pratiques SRE : Mise en place d’un error budget pour guider les décisions de release. Lancement d’expériences de chaos engineering (injection de latence) sur environnements de préproduction.
- Architecture & haute disponibilité : Conception et gestion de clusters Linux/Windows (DRBD, OCFS2, Keepalived) pour des environnements de trading à haute criticité.
- Automatisation & développement : Développement d’outils internes (Shell, Python, Java) permettant de fiabiliser les opérations et de réduire la charge manuelle.
- Gestion transverse : Pilotage de projets IT, coordination technique, amélioration continue, supervision de la production et de la sécurité. Rédaction de blameless post‑mortems après incidents majeurs.
- Gestion des environnements de dev, qualification, préprod, prod.
- Automatisation des déploiements via Git/GitLab CI.
- UX design (HTML5/CSS3/jQuery) et développement de plugins WordPress.
- Administration Debian, développement PHP/MySQL, optimisation de services web et automatisation de tâches systèmes.
- Elaboration de projets pour la création d'échanges (WebServices SOAP) entre Assercar et ses assureurs partenaires.
- Zabaion Web Agency (PHP/Magento), ClickGraph.fr (Prestashop, Windows Server), Clover Tech. (support IT), Tecnohipica C.A. (webmaster), Datamatic (Clipper, réseaux Lantastic).
Compétences techniques
Cloud & Infrastructure as Code
AWS (EC2, S3, VPC), GCP, Azure – concepts & labs.
Terraform, Ansible, Pulumi (bases).
Docker (conteneurs, Compose), Kubernetes (kind, k3s, déploiements).
CI/CD & GitOps modernes
Jenkins (pipelines, shared libs), GitLab CI, GitHub Actions.
ArgoCD, Flux (GitOps sur K8s).
Artifactory, Autosys (batch).
Observabilité & Monitoring
Prometheus (métriques, exporters, Alertmanager), Grafana.
Dynatrace, Geneos, ELK, Datadog (APM/logs).
OpenTelemetry, PagerDuty.
Systèmes & Réseaux (HA)
Linux (Debian/Ubuntu/RHEL), Windows Server.
Clustering HA : DRBD, OCFS2, Keepalived, VPN, load balancing.
Scripting avancé (Shell, Python).
Langages & Développement
Python, Shell, Go (apprentissage), Java, PHP.
Bases de données : MySQL, SQL Server, Oracle, Sybase.
C++, Arduino (embarqué).
SRE & Résilience
SLI / SLO / Error Budget, Toil Reduction, Chaos Engineering.
Blameless post-mortems, gestion d’incidents (IC/IM).
IA & Automatisation
Prompt engineering pour LLMs (GPT, Gemini, Llama).
Génération de code, analyse de logs, documentation assistée.
Pratiques & Méthodologies SRE
Indicateurs & Objectifs
SLI / SLO / SLA : Définition et suivi d’indicateurs de niveau de service (latence, disponibilité).
Réduction de la Toil
Automatisation des tâches répétitives (déploiements, redémarrages, tickets) pour se concentrer sur la valeur ajoutée.
Chaos Engineering
Injections de pannes contrôlées (latence, crash) pour valider la résilience.
Post‑Mortems sans blame
Culture d’amélioration continue, rétrospectives factuelles et actions correctives.
Formation & Certifications
-
Développeur Logiciel (Licence Pro) – Campus Ris Orangis (2010–2011)
PHP, SQL, Ajax, XML/XSLT, jQuery, POO. -
Développeur ASP / Admin Windows – UCAB, Caracas (1993–1996)
ASP, ODBC, fondamentaux Windows Server. -
Développeur Clipper 5.3 / C++ – Institution privée, Caracas (1992–1993)
Programmation orientée objet, compilation. - Auto‑formation continue – Kubernetes, Terraform, Cloud (AWS/GCP/Azure), Chaos engineering.