SRE: Observability (m/w/d)
Als Site Reliability Engineer mit Schwerpunkt Observability sorgst du für vollständige Transparenz und tiefgehende Einblicke in unsere IT-Systeme. Dich erwarten spannende Herausforderungen, modernste Technologien und ein starkes Team, das Automatisierung, Effizienz und kontinuierliche Verbesserung lebt.
Das machst Du bei uns
- Aufbau und Weiterentwicklung der Observability-Strategie:
- Entwicklung und Betrieb einer umfassenden Observability-Strategie für unsere Plattformen und Systeme.
- Sicherstellung einer optimalen Überwachung von Performance, Verfügbarkeit und Sicherheit.
- Monitoring-, Logging- und Tracing-Lösungen:
- Implementierung und Optimierung von Monitoring-, Logging- und Tracing-Technologien.
- Evaluierung und Integration neuer Observability-Tools und Best Practices.
- Dashboards, Alarmierung und Analysen:
- Entwicklung und Wartung von Dashboards für eine umfassende Systemüberwachung.
- Einrichtung von Alarmierungs- und Analysemechanismen zur frühzeitigen Fehlererkennung und -behebung.
- Zusammenarbeit und Integration:
- Enge Zusammenarbeit mit Entwicklern, DevOps-Teams und anderen Stakeholdern.
- Integration von Observability-Praktiken in den Softwareentwicklungszyklus.
- Performance-Analysen & Kapazitätsplanung:
- Durchführung von Performance-Analysen zur Optimierung von Systemen.
- Kapazitätsplanung zur Sicherstellung eines stabilen und skalierbaren Betriebs.
- Incident Response & Root Cause Analysen:
- Unterstützung bei der Automatisierung von Betriebsprozessen und Verbesserung von SRE-Prinzipien.
- Durchführung von Post-Mortems und Root Cause Analysen nach Incidents zur kontinuierlichen Verbesserung.
Das hast Du drauf
- Mindestens 5 Jahre Berufserfahrung in der Site Reliability Engineering, DevOps oder Softwareentwicklung mit Fokus Automation & Configuration Management
- Sprachkenntnisse: Sehr gute Deutschkenntnisse (fließend in Wort und Schrift) und/oder sehr gute Englischkenntnisse (fließend in Wort und Schrift)
- Diese Rolle erfordert eine Präsenz an zwei Tagen pro Woche in unserem Hamburger Büro für Teammeetings. Wir unterstützen flexible Arbeitsmodelle, während wir gleichzeitig eine effektive Zusammenarbeit im Team sicherstellen.
- Fundierte Kenntnisse in Observability-Tools wie z.B. Prometheus, Grafana
- Erfahrung mit Logging-Technologien wie ELK Stack oder Splunk
- Kenntnisse in Cloud-Technologien (AWS, Azure) und Container-Orchestrierung (Kubernetes, Docker)
- Gute Programmier- und Skripting-Kenntnisse (z. B. Python)
- Erfahrung mit Infrastructure-as-Code (Terraform, Ansible) von Vorteil
- Starke analytische Fähigkeiten und lösungsorientierte Denkweise
- Teamfähigkeit, Kommunikationsstärke und die Fähigkeit, komplexe technische Zusammenhänge verständlich zu vermitteln
Das erwartet Dich bei uns
- Großartiger Teamspirit
- Unbefristetes Arbeitsverhältnis
- Flexible Arbeitszeiten und mobiles Arbeiten
- Individuelle Weiterbildungsmöglichkeiten
- Bezuschussung für eine Mitgliedschaft bei Urban-Sports-Club(M oder L)
- 3x wöchentliches Sportangebot mit einem Fitnesstrainer
- Regelmäßige Team-Events für ein starkes Miteinander
- Nutze unser JobRad-Leasing-Modell und fahre dein Wunschfahrrad dienstlich sowie privat
- Möglichkeit in Abstimmung mit dem Team zeitweise remote aus dem Ausland zu arbeiten
- Bezuschussung des 58-Euro-Tickets ("Deutschlandticket")
Haben wir Dein Interesse geweckt?
Dein Ansprechpartner ist Moritz.
iVentureGroup GmbH
Human Resources
Wendenstraße 21b
20097 Hamburg
Bei Fragen kannst Du uns auch gerne jederzeit eine E-Mail an jobs@iventuregroup.com schreiben.
Wir freuen uns darauf von Dir zu hören!