AWS 기계 학습 - 전문가 (MLS-C01) 시험 가이드

소개

AWS 기계 학습 - 전문가(MLS-C01) 시험은 인공지능 및 기계 학습(AI/ML) 개발이나 데이터 과학 업무를 수행하는 개인을 대상으로 합니다. 이 시험은 후보자의 AWS 클라우드에서 비즈니스 문제를 해결하기 위한 ML 솔루션을 설계, 구축, 배포, 최적화, 학습, 튜닝 및 유지관리 할 수 있는 능력을 검증합니다.

이 시험은 또한 후보자의 다음 작업을 수행할 수 있는 능력을 검증합니다:

비즈니스 문제에 대한 적절한 ML 접근방식 선택 및 정당성 제시
ML 솔루션 구현을 위한 적절한 AWS 서비스 식별
확장 가능하고, 비용 최적화되며, 안정적이고 안전한 ML 솔루션 설계 및 구현

대상 후보자 설명

대상 후보자는 AWS 클라우드에서 ML 또는 딥 러닝 워크로드를 개발, 설계 및 실행하는 경험이 2년 이상 있어야 합니다.

권장되는 AWS 지식

대상 후보자는 다음과 같은 AWS 지식을 보유해야 합니다:

기본 ML 알고리즘의 직관을 표현할 수 있는 능력
기본 하이퍼파라미터 최적화 경험
ML 및 딥 러닝 프레임워크 경험
모델 학습 모범 사례 준수 능력
배포 모범 사례 준수 능력
운영 모범 사례 준수 능력

대상 후보자의 범위를 벗어나는 지식

다음 목록에는 대상 후보자에게 기대되지 않는 지식이 포함되어 있습니다. 이 목록은 포괄적이지 않습니다. 다음 분야의 지식은 시험 범위를 벗어납니다:

복잡한 알고리즘 개발
복잡한 하이퍼파라미터 최적화
복잡한 수학적 증명 및 계산
고급 네트워킹 및 네트워크 설계
고급 데이터베이스, 보안 및 DevOps 개념
Amazon EMR에 대한 DevOps 관련 작업

부록에는 시험에 나올 수 있는 기술과 개념 목록, 범위에 포함되는 AWS 서비스 및 기능 목록, 범위를 벗어나는 AWS 서비스 및 기능 목록이 포함되어 있습니다.

시험 내용

응답 유형

시험에는 두 가지 유형의 문제가 포함됩니다:

다중 선택: 1개의 정답과 3개의 오답(방해 요소)이 있습니다.
다중 응답: 5개 이상의 응답 옵션 중 2개 이상의 정답이 있습니다.

질문의 진술을 가장 잘 완성하거나 질문에 가장 잘 답변하는 하나 이상의 응답을 선택하십시오. 방해 요소 또는 오답은 지식이나 기술이 부족한 후보자가 선택할 수 있는 응답 옵션입니다. 방해 요소는 일반적으로 내용 영역과 일치하는 타당한 응답입니다.

답변하지 않은 문제는 오답으로 처리됩니다. 맞춰 보기하는 것에 대한 벌칙은 없습니다. 이 시험에는 점수에 영향을 미치는 50개의 문제가 포함되어 있습니다.

점수에 반영되지 않는 내용

이 시험에는 점수에 반영되지 않는 15개의 문제가 포함되어 있습니다. AWS는 이러한 점수에 반영되지 않는 문제들의 성과에 대한 정보를 수집하여 향후 채점 문제로 사용할 수 있도록 평가합니다. 이러한 점수에 반영되지 않는 문제는 시험에서 식별되지 않습니다.

시험 결과

AWS 기계 학습 - 전문가(MLS-C01) 시험은 합격 또는 불합격 지정으로 결과가 나옵니다. 이 시험은 AWS 전문가가 인증 산업 모범 사례와 지침을 따라 수립한 최소 기준에 대해 채점됩니다.

시험 결과는 100-1,000 점수로 보고됩니다. 합격 점수는 750점 이상입니다. 귀하의 점수는 전체 시험에서의 성과와 합격 여부를 보여줍니다. 등급 점수 모델은 다소 다른 난이도 수준을 가질 수 있는 여러 시험 양식 간의 점수를 균등화하는 데 도움이 됩니다.

점수 보고서에는 각 섹션 수준의 성과 분류표가 포함될 수 있습니다. 이 시험은 보상 채점 모델을 사용하므로, 각 섹션에서 합격 점수를 받을 필요가 없습니다. 전체 시험에서만 합격하면 됩니다.

시험의 각 섹션에는 특정 가중치가 있어 일부 섹션에는 다른 섹션보다 더 많은 문제가 포함되어 있습니다. 성과 분류표에는 귀하의 강점과 약점을 강조하는 일반 정보가 포함되어 있습니다. 섹션 수준 피드백을 해석할 때는 주의해야 합니다.

내용 개요

이 시험 가이드에는 시험의 가중치, 내용 영역 및 작업 명세가 포함되어 있습니다. 이 가이드는 시험 내용의 포괄적인 목록을 제공하지 않습니다. 그러나 각 작업 명세에 대한 추가 내용을 제공하여 시험 준비에 도움이 됩니다.

이 시험에는 다음과 같은 내용 영역과 가중치가 있습니다:

영역 1: 데이터 엔지니어링 (점수 내용의 20%)
영역 2: 탐색적 데이터 분석 (점수 내용의 24%)
영역 3: 모델링 (점수 내용의 36%)
영역 4: 기계 학습 구현 및 운영 (점수 내용의 20%)

영역 1: 데이터 엔지니어링

작업 명세 1.1: ML을 위한 데이터 저장소 생성

데이터 소스 식별(예: 콘텐츠 및 위치, 사용자 데이터 등의 기본 소스)
저장 매체 결정(예: 데이터베이스, Amazon S3, Amazon Elastic File System [Amazon EFS], Amazon Elastic Block Store [Amazon EBS])

작업 명세 1.2: 데이터 수집 솔루션 식별 및 구현

데이터 작업 스타일 및 유형 식별(예: 일괄 로드, 스트리밍)
데이터 수집 파이프라인 오케스트레이션(일괄 기반 ML 워크로드 및 스트리밍 기반 ML 워크로드)
- Amazon Kinesis
- Amazon Data Firehose
- Amazon EMR
- AWS Glue
- Amazon Managed Service for Apache Flink
작업 예약

작업 명세 1.3: 데이터 변환 솔루션 식별 및 구현

데이터 변환(ETL, AWS Glue, Amazon EMR, AWS Batch)
MapReduce를 사용하여 ML 특정 데이터 처리(예: Apache Hadoop, Apache Spark, Apache Hive)

영역 2: 탐색적 데이터 분석

작업 명세 2.1: 모델링을 위해 데이터 정리 및 준비

누락된 데이터, 손상된 데이터, 중지 단어 식별 및 처리
데이터 형식, 정규화, 증강, 스케일링
충분한 레이블 데이터 여부 결정
- 완화 전략 식별
- 데이터 레이블링 도구 사용(예: Amazon Mechanical Turk)

작업 명세 2.2: 특징 엔지니어링 수행

텍스트, 음성, 이미지, 공개 데이터세트와 같은 데이터 소스에서 특징 식별 및 추출
특징 엔지니어링 개념 분석 및 평가(예: 빈 분할, 토큰화, 이상치, 합성 특징, 원-핫 인코딩, 데이터 차원 축소)

작업 명세 2.3: ML을 위한 데이터 분석 및 시각화

그래프 생성(예: 산점도, 시계열, 히스토그램, 박스 플롯)
설명 통계 해석(예: 상관관계, 요약 통계, p-값)
클러스터 분석 수행(예: 계층적, 진단, 팔꿈치 플롯, 클러스터 크기)

영역 3: 모델링

작업 명세 3.1: 비즈니스 문제를 ML 문제로 정의

ML을 사용해야 하는 경우와 사용하지 말아야 하는 경우 결정
지도 학습과 비지도 학습의 차이 알기
분류, 회귀, 예측, 클러스터링, 추천, 기초 모델 중에서 선택

작업 명세 3.2: 주어진 ML 문제에 적합한 모델 선택

XGBoost, 로지스틱 회귀, k-means, 선형 회귀, 의사 결정 트리, 랜덤 포레스트, RNN, CNN, 앙상블, 전이 학습, 대규모 언어 모델(LLMs)
모델의 직관 표현

작업 명세 3.3: ML 모델 학습

학습 및 검증 데이터 분할(예: 교차 검증)
ML 학습을 위한 최적화 기법 이해(예: 경사 하강법, 손실 함수, 수렴)
적절한 컴퓨팅 리소스 선택(예: GPU 또는 CPU, 분산 또는 비분산)
- 적절한 컴퓨팅 플랫폼 선택(Spark 또는 non-Spark)
모델 업데이트 및 재학습
- 일괄 또는 실시간/온라인

작업 명세 3.4: 하이퍼파라미터 최적화 수행

정규화 수행
- 드롭아웃
- L1/L2
교차 검증 수행
모델 초기화
신경망 아키텍처(층 및 노드), 학습률, 활성화 함수 이해
트리 기반 모델(트리 수, 레벨 수) 이해
선형 모델(학습률) 이해

작업 명세 3.5: ML 모델 평가

과적합 또는 과소적합 방지
- 편향과 분산 탐지 및 처리
평가 지표 평가(예: AUC-ROC, 정확도, 정밀도, 재현율, RMSE, F1 점수)
혼동 행렬 해석
오프라인 및 온라인 모델 평가(A/B 테스트)
지표를 사용하여 모델 비교(예: 모델 학습 시간, 모델 품질, 엔지니어링 비용)
교차 검증 수행

영역 4: 기계 학습 구현 및 운영

작업 명세 4.1: 성능, 가용성, 확장성, 복원력 및 내결함성을 갖춘 ML 솔루션 구축

AWS 환경 로깅 및 모니터링
- AWS CloudTrail 및 Amazon CloudWatch
- 오류 모니터링 솔루션 구축
다중 AWS 리전 및 다중 가용 영역에 배포
AMI 및 골든 이미지 생성
Docker 컨테이너 생성
Auto Scaling 그룹 배포
리소스 크기 조정(예: 인스턴스, 프로비저닝된 IOPS, 볼륨)
부하 분산 수행
AWS 모범 사례 준수

작업 명세 4.2: 주어진 문제에 적합한 ML 서비스 및 기능 권장 및 구현

AWS의 ML(애플리케이션 서비스), 예:
- Amazon Polly
- Amazon Lex
- Amazon Transcribe
- Amazon Q
AWS 서비스 할당량 이해
맞춤형 모델을 구축할지 아니면 Amazon SageMaker 기본 제공 알고리즘을 사용할지 결정
AWS 인프라(예: 인스턴스 유형) 및 비용 고려 사항 이해
- AWS Batch를 사용하여 스팟 인스턴스로 딥 러닝 모델 학습

작업 명세 4.3: ML 솔루션에 기본 AWS 보안 방법론 적용

AWS Identity and Access Management(IAM)
S3 버킷 정책
보안 그룹
VPC
암호화 및 익명화

작업 명세 4.4: ML 솔루션 배포 및 운영화

엔드포인트 노출 및 상호 작용
ML 모델 이해
A/B 테스트 수행
재교육 파이프라인
ML 모델 디버그 및 문제 해결
- 성능 저하 탐지 및 완화
- 모델 성능 모니터링

부록

시험에 나올 수 있는 기술 및 개념

다음 목록에는 시험에 나올 수 있는 기술과 개념이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. 이 목록의 항목 순서와 배치는 시험에서의 상대적 비중이나 중요성을 나타내지 않습니다:

수집 및 수집
처리 및 ETL
데이터 분석 및 시각화
모델 학습
모델 배포 및 추론
ML 운영화
AWS ML 애플리케이션 서비스
ML 관련 언어(예: Python, Java, Scala, R, SQL)
노트북 및 통합 개발 환경(IDE)

범위에 포함되는 AWS 서비스 및 기능

다음 목록에는 시험에 포함되는 AWS 서비스와 기능이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. AWS 제품은 해당 제품의 주요 기능에 맞춰 범주화되어 있습니다:

분석:

Amazon Athena
Amazon Data Firehose
Amazon EMR
AWS Glue
Amazon Kinesis
Amazon Kinesis Data Streams
AWS Lake Formation
Amazon Managed Service for Apache Flink
Amazon OpenSearch Service
Amazon QuickSight

컴퓨팅:

AWS Batch
Amazon EC2
AWS Lambda

컨테이너:

Amazon Elastic Container Registry(Amazon ECR)
Amazon Elastic Container Service(Amazon ECS)
Amazon Elastic Kubernetes Service(Amazon EKS)
AWS Fargate

데이터베이스:

Amazon Redshift

사물 인터넷:

AWS IoT Greengrass

기계 학습:

Amazon Bedrock
Amazon Comprehend
AWS Deep Learning AMIs(DLAMI)
Amazon Forecast
Amazon Fraud Detector
Amazon Lex
Amazon Kendra
Amazon Mechanical Turk
Amazon Polly
Amazon Q
Amazon Rekognition
Amazon SageMaker
Amazon Textract
Amazon Transcribe
Amazon Translate

관리 및 거버넌스:

AWS CloudTrail
Amazon CloudWatch

네트워킹 및 콘텐츠 전송:

Amazon VPC

보안, 자격, 규정 준수:

AWS Identity and Access Management(IAM)

스토리지:

Amazon Elastic Block Store(Amazon EBS)
Amazon Elastic File System(Amazon EFS)
Amazon FSx
Amazon S3

범위에서 벗어나는 AWS 서비스 및 기능

다음 목록에는 시험 범위에서 벗어나는 AWS 서비스와 기능이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. 대상 직무와 전혀 관련이 없는 AWS 제품은 이 목록에서 제외되었습니다:

분석:

AWS Data Pipeline

기계 학습:

AWS DeepRacer
Amazon Machine Learning(Amazon ML)

버전 2.4 MLS-C01

\uACF5\uC2DD MLS-C01 \uC2DC\uD5D8 \uAC00\uC774\uB4DC

AWS 기계 학습 - 전문가 (MLS-C01) 시험 가이드

소개

대상 후보자 설명

권장되는 AWS 지식

대상 후보자의 범위를 벗어나는 지식

시험 내용

응답 유형

점수에 반영되지 않는 내용

시험 결과

내용 개요

영역 1: 데이터 엔지니어링

작업 명세 1.1: ML을 위한 데이터 저장소 생성

작업 명세 1.2: 데이터 수집 솔루션 식별 및 구현

작업 명세 1.3: 데이터 변환 솔루션 식별 및 구현

영역 2: 탐색적 데이터 분석

작업 명세 2.1: 모델링을 위해 데이터 정리 및 준비

작업 명세 2.2: 특징 엔지니어링 수행

작업 명세 2.3: ML을 위한 데이터 분석 및 시각화

영역 3: 모델링

작업 명세 3.1: 비즈니스 문제를 ML 문제로 정의

작업 명세 3.2: 주어진 ML 문제에 적합한 모델 선택

작업 명세 3.3: ML 모델 학습

작업 명세 3.4: 하이퍼파라미터 최적화 수행

작업 명세 3.5: ML 모델 평가

영역 4: 기계 학습 구현 및 운영

작업 명세 4.1: 성능, 가용성, 확장성, 복원력 및 내결함성을 갖춘 ML 솔루션 구축

작업 명세 4.2: 주어진 문제에 적합한 ML 서비스 및 기능 권장 및 구현

작업 명세 4.3: ML 솔루션에 기본 AWS 보안 방법론 적용

작업 명세 4.4: ML 솔루션 배포 및 운영화

부록

시험에 나올 수 있는 기술 및 개념

범위에 포함되는 AWS 서비스 및 기능

분석:

컴퓨팅:

컨테이너:

데이터베이스:

사물 인터넷:

기계 학습:

관리 및 거버넌스:

네트워킹 및 콘텐츠 전송:

보안, 자격, 규정 준수:

스토리지:

범위에서 벗어나는 AWS 서비스 및 기능

분석:

기계 학습: