Deine Aufgaben
- Betrieb und kontinuierliche Weiterentwicklung der Infrastruktur für unsere AI-Plattform (On-Premises und Hybrid)
- Verantwortung für den Container-Betrieb (Docker; perspektivisch auch Kubernetes), einschließlich Image-Management, Deployments und Rollbacks
- Administration von GPU-Servern und -Clustern (Kapazität, Performance, Stabilität), insbesondere für lokale Modelle (z. B. Whisper, Embedding-Modelle und perspektivisch weitere)
- Aufbau und Optimierung von CI/CD-Pipelines in GitLab, inklusive automatisierter Deployments, Artefakt-Management sowie Qualitäts- und Sicherheitschecks
- Entwicklung und Betreuung von Schnittstellen (REST APIs) zur Integration interner Systeme und Datenquellen (z. B. Kanzlei-Management-Systeme, SharePoint/M365)
- Sicherstellung eines stabilen Betriebs durch Monitoring, Logging sowie Incident- und Root-Cause-Analysen inklusive Performance-Optimierung
- Umsetzung von Security- und Compliance-Anforderungen („by design“), insbesondere in Bezug auf Zugriffsrechte, Secrets/Keys, Systemhärtung und Audit-Logging
- Enge Zusammenarbeit mit dem AI- und IT-Team bei der Umsetzung neuer Use Cases (z. B. Datenflüsse, Berechtigungen, Betriebsanforderungen)
Dein Profil
- Mehrjährige Erfahrung als DevOps, Platform oder Systems Engineer in produktionsnahen Umgebungen
- Sehr gute praktische Kenntnisse im Umgang mit Docker (Build, Betrieb, Troubleshooting, Container-Netzwerke, Logging)
- Erfahrung mit REST APIs (Integration, Authentifizierung, Debugging und Fehleranalyse)
- Sehr gute Kenntnisse in Python oder TypeScript/JavaScript (mindestens eine Sprache)
- Fundierte Linux-Kenntnisse sowie stark im Netzwerk-Troubleshooting (z. B. DNS, TLS, Proxies, Firewalls)
- Strukturierter Umgang mit Versionsverwaltung und Code-Reviews (z. B. Git-Flow oder Trunk-based Development)
- Idealerweise erste Erfahrung mit Kubernetes oder die klare Bereitschaft, dich schnell in Themen wie Deployments, Services, Ingress und Helm einzuarbeiten
- Kenntnisse in Infrastructure as Code (z. B. Terraform, Ansible), Secrets-Management und Reverse Proxies (z. B. Nginx, Traefik) sind von Vorteil
- Erfahrung mit Monitoring- und Logging-Stacks (z. B. Prometheus, Grafana, ELK) ist ein Plus
- Grundkenntnisse in Datenbanken (PostgreSQL, NoSQL) sowie Interesse an Vektor-Datenbanken
- Idealerweise erste Berührungspunkte mit GPU-Infrastruktur (z. B. CUDA, Treiber, GPU-Nutzung in Containern)
Warum wir?
- Spannende Projekte im Bereich AI und Legal Tech
- Wir wissen, dass Familie eine zentrale Rolle in deinem Leben spielt. Deshalb unterstützen wir dich mit einem Kinderbetreuungszuschuss und begleiten dich gerne bei der Suche nach einem passenden Kita-Platz für dein Kind.
- Wir legen großen Wert auf dein Wohlbefinden und wissen, wie wichtig es ist, gesund zu bleiben und sich rundum wohlzufühlen. Deshalb bieten wir dir ein umfangreiches Angebot an hochwertigen Sport- und Wellnesseinrichtungen. Mit exklusivem Zugang zu EGYM Wellpass kannst du deine Fitness verbessern und deinen Arbeitsalltag perfekt ausbalancieren.
- Aber auch wenn du keine Zeit oder Lust auf Sport hast, haben wir die perfekte Lösung für dich! Unser Hrmony-Sachbezug ermöglicht es dir, dein individuelles Gutschein- und Abopaket zusammenzustellen. Ob Rewe, IKEA, HelloFresh, Deutschlandticket oder Spotify - du hast die Wahl!
- Und wenn es um gemeinsame Mittagessen mit deinen Kolleg:innen geht, haben wir auch dafür eine praktische Lösung. Nutze einfach unsere digitalen Essensmarken.
Haben wir dein Interesse geweckt?
Dann freuen wir uns auf deine Bewerbung mit dem Talent Rocket Profil!