Site Reliability Engineering - Seminar / Kurs von GFU Cyrus AG

Inhalte

  • Einführung in Site Reliability Engineering (SRE)
    • Überblick und Ziele: Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale.
    • Prinzipien und Konzepte: Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen.
    • Anwendungsbereiche: Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird (z.B. große verteilte Systeme, Cloud-Umgebungen).
  • Grundlegende SRE-Prinzipien
    • Service Level Objectives (SLOs) und Service Level Agreements (SLAs): Definition und Bedeutung.
    • Error Budgets: Konzept und Anwendung von Error Budgets zur Verwaltung von Systemstabilität und Featureentwicklung.
    • Reduzierung der operativen Last: Automatisierung, Toil-Reduzierung und Best Practices zur Effizienzsteigerung.
  • SRE-Tools und Technologien
    • Überwachungs- und Logging-Tools: Einführung in gängige Überwachungs- und Logging-Tools (z.B. Prometheus, Grafana, ELK Stack).
    • Incident Management: Tools und Prozesse zur Incident-Erkennung und -Behebung (z.B. PagerDuty, Opsgenie).
    • Automatisierungs-Tools: Nutzung von Automatisierungs- und Konfigurationsmanagement-Tools (z.B. Ansible, Terraform).
  • Einrichtung einer SRE-Umgebung
    • Infrastruktur als Code: Implementierung von Infrastructure as Code (IaC) für zuverlässige und wiederholbare Umgebungsbereitstellung.
    • CI/CD-Pipelines: Aufbau und Verwaltung von Continuous Integration und Continuous Deployment Pipelines zur Automatisierung von Tests und Bereitstellungen.
    • Sicherheitsaspekte: Einführung in Sicherheitsaspekte und Best Practices im SRE-Umfeld.
  • Praktische Übung 1: Einrichtung einer Überwachungs- und Incident Management-Lösung
    • Problemstellung: Einrichtung einer Überwachungs- und Incident Management-Lösung für eine Beispielanwendung.
    • Lösung: Installation und Konfiguration von Prometheus und Grafana zur Überwachung, Einrichtung von Incident Management-Tools wie PagerDuty.
    • Ergebnis: Ein funktionierendes Überwachungs- und Incident Management-System für die Beispielanwendung.
  • Fehleranalyse und Fehlerbehebung
    • Root Cause Analysis (RCA): Techniken zur Fehleranalyse und Ursachenfindung.
    • Post-Mortem-Analysen: Erstellung und Nutzung von Post-Mortem-Berichten zur kontinuierlichen Verbesserung.
    • Chaos Engineering: Einführung in Chaos Engineering und praktische Ansätze zur Implementierung.
  • Kapazitätsplanung und Leistungsoptimierung
    • Kapazitätsplanung: Techniken und Tools zur effektiven Planung und Verwaltung der Systemkapazität.
    • Leistungsoptimierung: Methoden zur Analyse und Optimierung der Systemleistung.
    • Skalierbarkeit: Strategien zur Sicherstellung der Skalierbarkeit von Systemen und Anwendungen.
  • Sicherheit und Compliance im SRE
    • Sicherheitsmanagement: Implementierung von Sicherheitsrichtlinien und Best Practices.
    • Compliance: Einhaltung gesetzlicher Vorschriften und Industriestandards (z.B. GDPR, HIPAA).
    • Incident Response: Planung und Durchführung von Sicherheitsvorfällen und Notfallwiederherstellung.
  • Kultur und Zusammenarbeit
    • SRE-Kultur: Aufbau und Förderung einer SRE-Kultur innerhalb des Unternehmens.
    • Zusammenarbeit zwischen Entwicklung und Betrieb: Methoden zur Förderung der Zusammenarbeit und Kommunikation zwischen Entwicklungsteams und SREs.
    • Schulung und Weiterbildung: Strategien zur kontinuierlichen Weiterbildung und Schulung von SRE-Teams.
  • Praktische Übung 2: Implementierung eines vollständigen SRE-Projekts
    • Problemstellung: Implementierung eines vollständigen SRE-Projekts zur Sicherstellung der Zuverlässigkeit und Skalierbarkeit einer Anwendung.
    • Lösung: Anwendung der erlernten Techniken und Tools zur Überwachung, Fehlerbehebung, Kapazitätsplanung und Leistungsoptimierung.
    • Ergebnis: Ein vollständiges SRE-Projekt, das die Zuverlässigkeit und Skalierbarkeit der Anwendung sicherstellt und eine Dokumentation der Implementierung und Ergebnisse.
  • Einführung in Site Reliability Engineering (SRE)
    • Überblick und Ziele: Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale.
    • Prinzipien und Konzepte: Kerngedanken hinter SRE ...
Mehr Informationen >>

Lernziele

Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Projekte planen, entwickeln, integrieren und testen, um verschiedene Anforderungen abzudecken und die Systemleistung zu optimieren.
Am Ende des Seminars sind die Teilnehmenden in der Lage, SRE-Praktiken effektiv zu nutzen, um die Zuverlässigkeit, Skalierbarkeit und Sicherheit ihrer Systeme zu verbessern. Sie lernen, wie sie Proje ... Mehr Informationen >>

Zielgruppen

Dieses Seminar richtet sich an Site Reliability Engineers, DevOps-Ingenieure, Systemadministratoren, Softwareentwickler und IT-Experten, die ihre Kenntnisse in der Nutzung von SRE-Praktiken zur Verbesserung der Zuverlässigkeit und Skalierbarkeit ihrer Systeme erweitern möchten. Grundlegende Kenntnisse in Systemadministration, DevOps und Cloud-Computing sind hilfreich
Dieses Seminar richtet sich an Site Reliability Engineers, DevOps-Ingenieure, Systemadministratoren, Softwareentwickler und IT-Experten, die ihre Kenntnisse in der Nutzung von SRE-Praktiken zur Verbes ... Mehr Informationen >>

Termine und Orte

+++ Catalog API +++

SG-Seminar-Nr.: 8056660

Anbieter-Seminar-Nr.: 4124

Termine

  • 27.08.2025 - 28.08.2025

    Köln, DE

  • 17.12.2025 - 18.12.2025

    Köln, DE

  • 12.02.2026 - 13.02.2026

    Köln, DE

  • 21.05.2026 - 22.05.2026

    Köln, DE

  • 27.08.2026 - 28.08.2026

    Köln, DE

Seminare mit Termin haben Plätze verfügbar. Rechnung erfolgt durch Veranstalter. Für MwSt. Angabe auf den Termin klicken.

Jetzt buchen ›
Seminar merken ›
Vergleichen

Semigator berücksichtigt

  • Frühbucher-Preise
  • Last-Minute-Preise
  • Gruppenkonditionen

und verfügt über Sonderkonditionen mit einigen Anbietern.

Der Anbieter ist für den Inhalt verantwortlich.

Veranstaltungsinformation

  • Seminar / Kurs
  • Deutsch
    • Zertifikat
  • 14 h
  •  
  • Anbieterbewertung (153)

Ihre Vorteile mehr erfahren

  • Anbietervergleich von über 1.500 Seminaranbietern
  • Vollständige Veranstaltungsinformationen
  • Schnellbuchung
  • Persönlicher Service