Inhalt des Trainings
Dieses Training vermittelt den Teilnehmern Techniken zur Überwachung und Verbesserung der Infrastruktur - und Anwendungsleistung in der Google Cloud.
Key Learnings
- Erläutern des Zwecks und der Funktionen der Google Cloud Operations Suite
- Implementieren der Überwachung für mehrere Cloud-Projekte
- Erstellen von Benachrichtigungsrichtlinien, Betriebszeitprüfungen und Warnungen
- Installieren und Verwalten von Ops Agent zum Sammeln von Protokollen für Compute Engine
- Erläutern von Cloud Operations für GKE
- Analysieren von VPC-Flow-Protokollen und Firewall-Regelprotokollen
- Analysieren und Exportieren von Cloud Audit Logs Instanzen
- Profiling und Identifizieren ressourcenintensiver Funktionen in einer Anwendung
- Analysieren der Kosten für die Ressourcennutzung zur Überwachung von Komponenten in Google Cloud
Detail-Inhalte
Anhand einer Kombination aus Präsentationen, Demos, praktischen Übungen und realen Fallstudien sammeln die Teilnehmer*innen Erfahrungen mit Full-Stack-Monitoring, Echtzeit-Protokollverwaltung und -analyse, Debugging von Code in der Produktion, Aufspüren von Engpässen in der Anwendungsleistung und Erstellung von Profilen für CPU- und Speichernutzung.
Einführung in die Google Cloud Operations Suite
- Beschreiben des Zwecks und der Möglichkeiten der Google Cloud Operations Suite
- Erläutern des Zwecks des Cloud Monitoring-Tools
- Erläutern des Zwecks der Cloud Logging und Error Reporting Tools
- Erläutern des Zwecks der Application Performance Management-Tools
Überwachung kritischer Systeme
- Cloud Monitoring verwenden, um Metriken für mehrere Cloud-Projekte anzuzeigen
- Erklären Sie die verschiedenen Arten von Dashboards und Diagrammen, die erstellt werden können
- Erstellen eines Uptime-Checks
- Erkären der Architektur des Cloud-Betriebs
- Erklären und demonstrieren des Zweck der Verwendung von Monitoring Query Language (MQL) für die Überwachung
Alerting-Richtlinien
- Erläutern von Alerting-Strategien
- Erläutern von Alerting Policies
- Erläutern des Fehlerbudgets
- Erklären, warum Server-Level-Indikatoren (SLIs), Service-Level-Ziele (SLOs) und Service-Level-Agreements (SLAs) wichtig sind
- Arten von Alarmen und deren häufige Verwendung zu identifizieren
- Cloud Monitoring zur Verwaltung von Diensten verwenden
Erweiterte Protokollierung und Analyse
- Funktionen des Log Explorers verwenden
- Erläutern der Funktionen und Vorteile von protokollbasierten Metriken
- Definieren von Protokollsenken (Einschlussfilter) und Ausschlussfiltern
- Erläutern, wie BigQuery zur Analyse von Protokollen verwendet werden kann
- Exportieren von Protokollen in BigQuery zur Analyse
- Verwenden von Log-Analysen auf Google Cloud
Arbeiten mit Cloud-Audit-Protokollen
- Erläutern von Cloud Audit Logs
- Auflisten und Erklären verschiedener Audit-Protokolle
- Erläutern der Merkmale und Funktionalitäten der verschiedenen Audit-Protokolle
- Auflisten der besten Praktiken zur Implementierung von Audit-Protokollen
Konfigurieren von Google Cloud Services für Observability
- Verwenden von Ops Agent mit Compute Engine
- Aktivieren und Verwenden von Kubernetes Monitoring
- Erklären der Vorteile der Verwendung von Google Cloud Managed Service für Prometheus
- Erläutern der Verwendung von PromQL zur Abfrage von Cloud Monitoring Metriken
- Erläutern der Verwendung von Open Telemetry
- Erläutern von benutzerdefinierten Metriken
Überwachen des Google-Cloud-Netzwerks
- Sammeln und Analysieren von VPC Flow Logs und Firewall Rules Logs
- Aktivieren und Überwachen Sie Packet Mirroring
- Erklären der Möglichkeiten des Network Intelligence Center
Untersuchen von Problemen mit der Anwendungsleistung
- Erläutern der Merkmale, Vorteile und Funktionalitäten von Error Reporting, Cloud Trace und Cloud Profiler
Optimieren der Kosten für die Operations Suite
- Analysieren der Kosten für die Ressourcennutzung für überwachungsbezogene Komponenten innerhalb von Google Cloud
- Implementieren von Best Practices zur Kontrolle der Kosten für die Überwachung innerhalb von Google Cloud