CC

Offizieller MLS-C01 Pr\u00FCfungsleitfaden

Pr\u00FCfungsformat, Bereiche und Vorbereitungstipps

AWS Certified Machine Learning - Specialty (MLS-C01) Exam-Leitfaden

Einführung

Der AWS Certified Machine Learning - Specialty (MLS-C01) Exam ist für Personen gedacht, die eine Rolle in der Entwicklung von Künstlicher Intelligenz und Maschinellem Lernen (KI/ML) oder Data Science ausüben. Der Exam validiert die Fähigkeit eines Kandidaten, ML-Lösungen für gegebene Geschäftsprobleme unter Verwendung der AWS Cloud zu entwerfen, zu erstellen, bereitzustellen, zu optimieren, zu trainieren, abzustimmen und zu warten.

Der Exam validiert auch die Fähigkeit eines Kandidaten, die folgenden Aufgaben auszuführen:

  • Auswählen und Begründen des geeigneten ML-Ansatzes für ein gegebenes Geschäftsproblem.
  • Identifizieren geeigneter AWS-Dienste zur Implementierung von ML-Lösungen.
  • Entwerfen und Implementieren von skalierbaren, kostenoptimierten, zuverlässigen und sicheren ML-Lösungen.

Beschreibung des Zielkandidaten

Der Zielkandidat sollte über 2 oder mehr Jahre Erfahrung in der Entwicklung, Architektur und dem Betrieb von ML- oder Deep Learning-Workloads in der AWS Cloud verfügen.

Empfohlenes AWS-Wissen

Der Zielkandidat sollte über folgendes AWS-Wissen verfügen:

  • Die Fähigkeit, die Intuition hinter grundlegenden ML-Algorithmen auszudrücken
  • Erfahrung mit der Durchführung grundlegender Hyperparameter-Optimierung
  • Erfahrung mit ML- und Deep Learning-Frameworks
  • Die Fähigkeit, Modell-Trainings-Best Practices zu befolgen
  • Die Fähigkeit, Bereitstellungs-Best Practices zu befolgen
  • Die Fähigkeit, Betriebliche Best Practices zu befolgen

Wissen, das nicht im Fokus des Zielkandidaten liegt

Die folgende Liste enthält Wissen, das vom Zielkandidaten nicht erwartet wird. Diese Liste ist nicht erschöpfend. Wissen in den folgenden Bereichen liegt nicht im Fokus des Exams:

  • Umfangreiche oder komplexe Algorithmusentwicklung
  • Umfangreiche Hyperparameter-Optimierung
  • Komplexe mathematische Beweise und Berechnungen
  • Erweiterte Netzwerk- und Netzwerkdesign-Konzepte
  • Erweiterte Datenbank-, Sicherheits- und DevOps-Konzepte
  • DevOps-bezogene Aufgaben für Amazon EMR

Siehe Anhang für eine Liste der Technologien und Konzepte, die im Exam erscheinen könnten, eine Liste der im Fokus stehenden AWS-Dienste und -Funktionen sowie eine Liste der nicht im Fokus stehenden AWS-Dienste und -Funktionen.

Examinhalt

Antworttypen

Es gibt zwei Arten von Fragen im Exam:

  • Mehrfachauswahl: Hat eine richtige Antwort und drei falsche Antworten (Ablenker)
  • Mehrfachnennung: Hat zwei oder mehr richtige Antworten von fünf oder mehr Antwortoptionen

Wählen Sie eine oder mehrere Antworten aus, die die Aussage am besten vervollständigen oder die Frage am besten beantworten. Ablenker oder falsche Antworten sind Antwortoptionen, die ein Kandidat mit unvollständigem Wissen oder Können auswählen könnte. Ablenker sind in der Regel plausible Antworten, die dem Themengebiet entsprechen.

Nicht beantwortete Fragen werden als falsch gewertet; es gibt keine Strafe für Raten. Der Exam umfasst 50 Fragen, die in Ihre Punktzahl einfließen.

Nicht bewerteter Inhalt

Der Exam umfasst 15 nicht bewertete Fragen, die sich nicht auf Ihre Punktzahl auswirken. AWS sammelt Informationen über die Leistung bei diesen nicht bewerteten Fragen, um diese Fragen für zukünftigen Einsatz als bewertete Fragen zu evaluieren. Diese nicht bewerteten Fragen werden im Exam nicht gekennzeichnet.

Examenergebnisse

Der AWS Certified Machine Learning - Specialty (MLS-C01) Exam hat eine Bestanden/Nicht Bestanden-Bewertung. Der Exam wird gegen einen Mindeststandard bewertet, der von AWS-Fachleuten unter Befolgung branchenüblicher Zertifizierungsrichtlinien und -richtlinien festgelegt wird.

Ihre Ergebnisse für den Exam werden als normierte Punktzahl von 100-1.000 gemeldet. Die Mindestpunktzahl zum Bestehen beträgt 750. Ihre Punktzahl zeigt, wie Sie im Exam insgesamt abgeschnitten haben und ob Sie bestanden haben. Normierte Bewertungsmodelle helfen, Punktzahlen über mehrere Examformen hinweg anzugleichen, die möglicherweise leicht unterschiedliche Schwierigkeitsgrade aufweisen.

Ihr Ergebnisbericht könnte eine Tabelle mit Klassifizierungen Ihrer Leistung auf Ebene der einzelnen Abschnitte enthalten. Der Exam verwendet ein kompensatorisches Bewertungsmodell, d.h. Sie müssen in jedem Abschnitt keine Bestehensgrenze erreichen. Sie müssen nur den Gesamtexam bestehen.

Jeder Abschnitt des Exams hat eine spezifische Gewichtung, so dass einige Abschnitte mehr Fragen haben als andere. Die Tabelle der Klassifizierungen enthält allgemeine Informationen, die Ihre Stärken und Schwächen hervorheben. Seien Sie vorsichtig bei der Interpretation der Rückmeldungen auf Abschnittsebene.

Inhaltsübersicht

Dieser Exam-Leitfaden enthält Gewichtungen, Inhaltsbereiche und Aufgabenstellungen für den Exam. Dieser Leitfaden liefert keine vollständige Liste der Inhalte des Exams. Es ist jedoch zusätzlicher Kontext für jede Aufgabenstellung verfügbar, um Ihnen bei der Vorbereitung auf den Exam zu helfen.

Der Exam hat die folgenden Inhaltsbereiche und Gewichtungen:

  • Bereich 1: Datenerfassung (20% des bewerteten Inhalts)
  • Bereich 2: Explorative Datenanalyse (24% des bewerteten Inhalts)
  • Bereich 3: Modellierung (36% des bewerteten Inhalts)
  • Bereich 4: Implementierung und Betrieb des Maschinellen Lernens (20% des bewerteten Inhalts)

Bereich 1: Datenerfassung

Aufgabenstellung 1.1: Erstellen von Datenablageorten für ML.

  • Identifizieren von Datenquellen (z.B. Inhalt und Standort, Primärquellen wie Benutzerdaten).
  • Bestimmen von Speichermedien (z.B. Datenbanken, Amazon S3, Amazon Elastic File System [Amazon EFS], Amazon Elastic Block Store [Amazon EBS]).

Aufgabenstellung 1.2: Identifizieren und Implementieren einer Datenaufnahmeslösung.

  • Identifizieren von Datenjob-Stilen und -Arten (z.B. Batch-Laden, Streaming).
  • Orchestrieren von Datenaufnahme-Pipelines (batchbasierte ML-Workloads und streamingbasierte ML-Workloads).
    • Amazon Kinesis
    • Amazon Data Firehose
    • Amazon EMR
    • AWS Glue
    • Amazon Managed Service for Apache Flink
  • Planen von Jobs.

Aufgabenstellung 1.3: Identifizieren und Implementieren einer Datentransformationslösung.

  • Transformieren von Daten im Durchsatz (ETL, AWS Glue, Amazon EMR, AWS Batch).
  • Verarbeiten ML-spezifischer Daten mit MapReduce (z.B. Apache Hadoop, Apache Spark, Apache Hive).

Bereich 2: Explorative Datenanalyse

Aufgabenstellung 2.1: Bereinigen und Vorbereiten von Daten für die Modellierung.

  • Identifizieren und Behandeln von fehlenden Daten, beschädigten Daten und Stoppwörtern.
  • Formatieren, Normalisieren, Erweitern und Skalieren von Daten.
  • Bestimmen, ob ausreichend beschriftete Daten vorhanden sind.
    • Identifizieren von Milderungsstrategien.
    • Verwenden von Datenbeschriftungstools (z.B. Amazon Mechanical Turk).

Aufgabenstellung 2.2: Durchführen von Merkmalsentwicklung.

  • Identifizieren und Extrahieren von Merkmalen aus Datensätzen, einschließlich aus Datenquellen wie Text, Sprache, Bilder und öffentliche Datensätze.
  • Analysieren und Bewerten von Konzepten für Merkmalsentwicklung (z.B. Binning, Tokenisierung, Ausreißer, synthetische Merkmale, One-Hot-Encoding, Dimensionalitätsreduktion von Daten).

Aufgabenstellung 2.3: Analysieren und Visualisieren von Daten für ML.

  • Erstellen von Grafiken (z.B. Streudiagramme, Zeitreihen, Histogramme, Box-Plots).
  • Interpretieren beschreibender Statistiken (z.B. Korrelation, Zusammenfassungsstatistiken, p-Wert).
  • Durchführen von Clusteranalysen (z.B. hierarchisch, diagnostisch, Ellbogenplot, Clustergröße).

Bereich 3: Modellierung

Aufgabenstellung 3.1: Formulieren von Geschäftsproblemen als ML-Probleme.

  • Bestimmen, wann ML verwendet werden soll und wann nicht.
  • Den Unterschied zwischen überwachtem und unüberwachtem Lernen kennen.
  • Auswählen zwischen Klassifizierung, Regression, Prognose, Clustering, Empfehlung und Grundlagenmodellen.

Aufgabenstellung 3.2: Auswählen des geeigneten Modells(e) für ein gegebenes ML-Problem.

  • XGBoost, logistische Regression, k-Means, lineare Regression, Entscheidungsbäume, Random Forests, RNN, CNN, Ensemble, Transfer Learning und große Sprachmodelle (LLMs)
  • Die Intuition hinter den Modellen ausdrücken.

Aufgabenstellung 3.3: Trainieren von ML-Modellen.

  • Aufteilen der Daten in Training und Validierung (z.B. Kreuzvalidierung).
  • Verstehen von Optimierungstechniken für ML-Training (z.B. Gradientenabstieg, Verlustfunktionen, Konvergenz).
  • Auswählen geeigneter Rechenressourcen (z.B. GPU oder CPU, verteilt oder nicht verteilt).
    • Auswählen geeigneter Rechenplattformen (Spark oder nicht-Spark).
  • Aktualisieren und Neutrainieren von Modellen.
    • Batch oder Echtzeit/Online

Aufgabenstellung 3.4: Durchführen der Hyperparameter-Optimierung.

  • Durchführen von Regularisierung.
    • Dropout
    • L1/L2
  • Durchführen von Kreuzvalidierung.
  • Initialisieren von Modellen.
  • Verstehen der neuronalen Netzwerkarchitektur (Schichten und Knoten), Lernrate und Aktivierungsfunktionen.
  • Verstehen baumbasierter Modelle (Anzahl der Bäume, Anzahl der Ebenen).
  • Verstehen linearer Modelle (Lernrate).

Aufgabenstellung 3.5: Evaluieren von ML-Modellen.

  • Vermeiden von Über- oder Unteranpassung.
    • Erkennen und Behandeln von Verzerrung und Varianz.
  • Auswerten von Metriken (z.B. Fläche unter der Kurve [AUC]-Receiver Operating Characteristic [ROC], Genauigkeit, Präzision, Recall, Root Mean Square Error [RMSE], F1-Score).
  • Interpretieren von Konfusionsmatrizen.
  • Durchführen von Offline- und Online-Modell-Evaluierungen (A/B-Tests).
  • Vergleichen von Modellen anhand von Metriken (z.B. Zeit zum Trainieren eines Modells, Qualität des Modells, Entwicklungskosten).
  • Durchführen von Kreuzvalidierung.

Bereich 4: Implementierung und Betrieb des Maschinellen Lernens

Aufgabenstellung 4.1: Erstellen von ML-Lösungen für Leistung, Verfügbarkeit, Skalierbarkeit, Belastbarkeit und Fehlertoleranz.

  • Protokollieren und Überwachen von AWS-Umgebungen.
    • AWS CloudTrail und Amazon CloudWatch
    • Erstellen von Fehlerüberwachungslösungen.
  • Bereitstellen in mehreren AWS-Regionen und mehreren Verfügbarkeitszonen.
  • Erstellen von AMIs und Golden Images.
  • Erstellen von Docker-Containern.
  • Bereitstellen von Auto Scaling-Gruppen.
  • Dimensionieren von Ressourcen (z.B. Instanzen, Provisioned IOPS, Volumes).
  • Durchführen von Load Balancing.
  • Befolgen von AWS-Best Practices.

Aufgabenstellung 4.2: Empfehlen und Implementieren der geeigneten ML-Dienste und -Funktionen für ein gegebenes Problem.

  • ML auf AWS (Anwendungsdienste), zum Beispiel:
    • Amazon Polly
    • Amazon Lex
    • Amazon Transcribe
    • Amazon Q
  • Verstehen von AWS-Dienstquoten.
  • Bestimmen, wann eigene Modelle zu erstellen sind und wann Amazon SageMaker integrierte Algorithmen zu verwenden sind.
  • Verstehen von AWS-Infrastruktur (z.B. Instanztypen) und Kostenaspekte.
    • Verwenden von Spot-Instanzen zum Trainieren von Deep Learning-Modellen mithilfe von AWS Batch.

Aufgabenstellung 4.3: Anwenden grundlegender AWS-Sicherheitspraktiken auf ML-Lösungen.

  • AWS Identity and Access Management (IAM)
  • S3-Bucket-Richtlinien
  • Sicherheitsgruppen
  • VPCs
  • Verschlüsselung und Anonymisierung

Aufgabenstellung 4.4: Bereitstellen und Betreiben von ML-Lösungen.

  • Exponieren von Endpunkten und Interagieren damit.
  • Verstehen von ML-Modellen.
  • Durchführen von A/B-Tests.
  • Neutrainieren von Pipelines.
  • Debuggen und Fehlerbeheben von ML-Modellen.
    • Erkennen und Mildern von Leistungsrückgängen.
    • Überwachen der Modellleistung.

Anhang

Technologien und Konzepte, die im Exam auftreten könnten

Die folgende Liste enthält Technologien und Konzepte, die im Exam auftreten könnten. Diese Liste ist nicht erschöpfend und kann sich ändern. Die Reihenfolge und Platzierung der Elemente in dieser Liste ist kein Hinweis auf ihre relative Gewichtung oder Bedeutung im Exam:

  • Aufnahme und Erfassung
  • Verarbeitung und ETL
  • Datenanalyse und Visualisierung
  • Modelltraining
  • Modellbereitstellung und Inferenz
  • Betriebliches ML
  • AWS ML-Anwendungsdienste
  • Sprachen relevant für ML (z.B. Python, Java, Scala, R, SQL)
  • Notebooks und integrierte Entwicklungsumgebungen (IDEs)

Im Fokus stehende AWS-Dienste und -Funktionen

Die folgende Liste enthält AWS-Dienste und -Funktionen, die im Fokus des Exams stehen. Diese Liste ist nicht erschöpfend und kann sich ändern. AWS-Angebote erscheinen in Kategorien, die mit den Hauptfunktionen der Angebote übereinstimmen:

Analytics:

  • Amazon Athena
  • Amazon Data Firehose
  • Amazon EMR
  • AWS Glue
  • Amazon Kinesis
  • Amazon Kinesis Data Streams
  • AWS Lake Formation
  • Amazon Managed Service for Apache Flink
  • Amazon OpenSearch Service
  • Amazon QuickSight

Compute:

  • AWS Batch
  • Amazon EC2
  • AWS Lambda

Container:

  • Amazon Elastic Container Registry (Amazon ECR)
  • Amazon Elastic Container Service (Amazon ECS)
  • Amazon Elastic Kubernetes Service (Amazon EKS)
  • AWS Fargate

Datenbank:

  • Amazon Redshift

Internet der Dinge:

  • AWS IoT Greengrass

Maschinelles Lernen:

  • Amazon Bedrock
  • Amazon Comprehend
  • AWS Deep Learning AMIs (DLAMI)
  • Amazon Forecast
  • Amazon Fraud Detector
  • Amazon Lex
  • Amazon Kendra
  • Amazon Mechanical Turk
  • Amazon Polly
  • Amazon Q
  • Amazon Rekognition
  • Amazon SageMaker
  • Amazon Textract
  • Amazon Transcribe
  • Amazon Translate

Management und Governance:

  • AWS CloudTrail
  • Amazon CloudWatch

Netzwerk und Content Delivery:

  • Amazon VPC

Sicherheit, Identität und Compliance:

  • AWS Identity and Access Management (IAM)

Speicher:

  • Amazon Elastic Block Store (Amazon EBS)
  • Amazon Elastic File System (Amazon EFS)
  • Amazon FSx
  • Amazon S3

Nicht im Fokus stehende AWS-Dienste und -Funktionen

Die folgende Liste enthält AWS-Dienste und -Funktionen, die nicht im Fokus des Exams stehen. Diese Liste ist nicht erschöpfend und kann sich ändern. AWS-Angebote, die völlig unabhängig von den Zielarbeitsrollen für den Exam sind, sind aus dieser Liste ausgeschlossen:

Analytics:

  • AWS Data Pipeline

Maschinelles Lernen:

  • AWS DeepRacer
  • Amazon Machine Learning (Amazon ML)