AWS 기계 학습 - 전문가 (MLS-C01) 시험 가이드
소개
AWS 기계 학습 - 전문가(MLS-C01) 시험은 인공지능 및 기계 학습(AI/ML) 개발이나 데이터 과학 업무를 수행하는 개인을 대상으로 합니다. 이 시험은 후보자의 AWS 클라우드에서 비즈니스 문제를 해결하기 위한 ML 솔루션을 설계, 구축, 배포, 최적화, 학습, 튜닝 및 유지관리 할 수 있는 능력을 검증합니다.
이 시험은 또한 후보자의 다음 작업을 수행할 수 있는 능력을 검증합니다:
- 비즈니스 문제에 대한 적절한 ML 접근방식 선택 및 정당성 제시
- ML 솔루션 구현을 위한 적절한 AWS 서비스 식별
- 확장 가능하고, 비용 최적화되며, 안정적이고 안전한 ML 솔루션 설계 및 구현
대상 후보자 설명
대상 후보자는 AWS 클라우드에서 ML 또는 딥 러닝 워크로드를 개발, 설계 및 실행하는 경험이 2년 이상 있어야 합니다.
권장되는 AWS 지식
대상 후보자는 다음과 같은 AWS 지식을 보유해야 합니다:
- 기본 ML 알고리즘의 직관을 표현할 수 있는 능력
- 기본 하이퍼파라미터 최적화 경험
- ML 및 딥 러닝 프레임워크 경험
- 모델 학습 모범 사례 준수 능력
- 배포 모범 사례 준수 능력
- 운영 모범 사례 준수 능력
대상 후보자의 범위를 벗어나는 지식
다음 목록에는 대상 후보자에게 기대되지 않는 지식이 포함되어 있습니다. 이 목록은 포괄적이지 않습니다. 다음 분야의 지식은 시험 범위를 벗어납니다:
- 복잡한 알고리즘 개발
- 복잡한 하이퍼파라미터 최적화
- 복잡한 수학적 증명 및 계산
- 고급 네트워킹 및 네트워크 설계
- 고급 데이터베이스, 보안 및 DevOps 개념
- Amazon EMR에 대한 DevOps 관련 작업
부록에는 시험에 나올 수 있는 기술과 개념 목록, 범위에 포함되는 AWS 서비스 및 기능 목록, 범위를 벗어나는 AWS 서비스 및 기능 목록이 포함되어 있습니다.
시험 내용
응답 유형
시험에는 두 가지 유형의 문제가 포함됩니다:
- 다중 선택: 1개의 정답과 3개의 오답(방해 요소)이 있습니다.
- 다중 응답: 5개 이상의 응답 옵션 중 2개 이상의 정답이 있습니다.
질문의 진술을 가장 잘 완성하거나 질문에 가장 잘 답변하는 하나 이상의 응답을 선택하십시오. 방해 요소 또는 오답은 지식이나 기술이 부족한 후보자가 선택할 수 있는 응답 옵션입니다. 방해 요소는 일반적으로 내용 영역과 일치하는 타당한 응답입니다.
답변하지 않은 문제는 오답으로 처리됩니다. 맞춰 보기하는 것에 대한 벌칙은 없습니다. 이 시험에는 점수에 영향을 미치는 50개의 문제가 포함되어 있습니다.
점수에 반영되지 않는 내용
이 시험에는 점수에 반영되지 않는 15개의 문제가 포함되어 있습니다. AWS는 이러한 점수에 반영되지 않는 문제들의 성과에 대한 정보를 수집하여 향후 채점 문제로 사용할 수 있도록 평가합니다. 이러한 점수에 반영되지 않는 문제는 시험에서 식별되지 않습니다.
시험 결과
AWS 기계 학습 - 전문가(MLS-C01) 시험은 합격 또는 불합격 지정으로 결과가 나옵니다. 이 시험은 AWS 전문가가 인증 산업 모범 사례와 지침을 따라 수립한 최소 기준에 대해 채점됩니다.
시험 결과는 100-1,000 점수로 보고됩니다. 합격 점수는 750점 이상입니다. 귀하의 점수는 전체 시험에서의 성과와 합격 여부를 보여줍니다. 등급 점수 모델은 다소 다른 난이도 수준을 가질 수 있는 여러 시험 양식 간의 점수를 균등화하는 데 도움이 됩니다.
점수 보고서에는 각 섹션 수준의 성과 분류표가 포함될 수 있습니다. 이 시험은 보상 채점 모델을 사용하므로, 각 섹션에서 합격 점수를 받을 필요가 없습니다. 전체 시험에서만 합격하면 됩니다.
시험의 각 섹션에는 특정 가중치가 있어 일부 섹션에는 다른 섹션보다 더 많은 문제가 포함되어 있습니다. 성과 분류표에는 귀하의 강점과 약점을 강조하는 일반 정보가 포함되어 있습니다. 섹션 수준 피드백을 해석할 때는 주의해야 합니다.
내용 개요
이 시험 가이드에는 시험의 가중치, 내용 영역 및 작업 명세가 포함되어 있습니다. 이 가이드는 시험 내용의 포괄적인 목록을 제공하지 않습니다. 그러나 각 작업 명세에 대한 추가 내용을 제공하여 시험 준비에 도움이 됩니다.
이 시험에는 다음과 같은 내용 영역과 가중치가 있습니다:
- 영역 1: 데이터 엔지니어링 (점수 내용의 20%)
- 영역 2: 탐색적 데이터 분석 (점수 내용의 24%)
- 영역 3: 모델링 (점수 내용의 36%)
- 영역 4: 기계 학습 구현 및 운영 (점수 내용의 20%)
영역 1: 데이터 엔지니어링
작업 명세 1.1: ML을 위한 데이터 저장소 생성
- 데이터 소스 식별(예: 콘텐츠 및 위치, 사용자 데이터 등의 기본 소스)
- 저장 매체 결정(예: 데이터베이스, Amazon S3, Amazon Elastic File System [Amazon EFS], Amazon Elastic Block Store [Amazon EBS])
작업 명세 1.2: 데이터 수집 솔루션 식별 및 구현
- 데이터 작업 스타일 및 유형 식별(예: 일괄 로드, 스트리밍)
- 데이터 수집 파이프라인 오케스트레이션(일괄 기반 ML 워크로드 및 스트리밍 기반 ML 워크로드)
- Amazon Kinesis
- Amazon Data Firehose
- Amazon EMR
- AWS Glue
- Amazon Managed Service for Apache Flink
- 작업 예약
작업 명세 1.3: 데이터 변환 솔루션 식별 및 구현
- 데이터 변환(ETL, AWS Glue, Amazon EMR, AWS Batch)
- MapReduce를 사용하여 ML 특정 데이터 처리(예: Apache Hadoop, Apache Spark, Apache Hive)
영역 2: 탐색적 데이터 분석
작업 명세 2.1: 모델링을 위해 데이터 정리 및 준비
- 누락된 데이터, 손상된 데이터, 중지 단어 식별 및 처리
- 데이터 형식, 정규화, 증강, 스케일링
- 충분한 레이블 데이터 여부 결정
- 완화 전략 식별
- 데이터 레이블링 도구 사용(예: Amazon Mechanical Turk)
작업 명세 2.2: 특징 엔지니어링 수행
- 텍스트, 음성, 이미지, 공개 데이터세트와 같은 데이터 소스에서 특징 식별 및 추출
- 특징 엔지니어링 개념 분석 및 평가(예: 빈 분할, 토큰화, 이상치, 합성 특징, 원-핫 인코딩, 데이터 차원 축소)
작업 명세 2.3: ML을 위한 데이터 분석 및 시각화
- 그래프 생성(예: 산점도, 시계열, 히스토그램, 박스 플롯)
- 설명 통계 해석(예: 상관관계, 요약 통계, p-값)
- 클러스터 분석 수행(예: 계층적, 진단, 팔꿈치 플롯, 클러스터 크기)
영역 3: 모델링
작업 명세 3.1: 비즈니스 문제를 ML 문제로 정의
- ML을 사용해야 하는 경우와 사용하지 말아야 하는 경우 결정
- 지도 학습과 비지도 학습의 차이 알기
- 분류, 회귀, 예측, 클러스터링, 추천, 기초 모델 중에서 선택
작업 명세 3.2: 주어진 ML 문제에 적합한 모델 선택
- XGBoost, 로지스틱 회귀, k-means, 선형 회귀, 의사 결정 트리, 랜덤 포레스트, RNN, CNN, 앙상블, 전이 학습, 대규모 언어 모델(LLMs)
- 모델의 직관 표현
작업 명세 3.3: ML 모델 학습
- 학습 및 검증 데이터 분할(예: 교차 검증)
- ML 학습을 위한 최적화 기법 이해(예: 경사 하강법, 손실 함수, 수렴)
- 적절한 컴퓨팅 리소스 선택(예: GPU 또는 CPU, 분산 또는 비분산)
- 적절한 컴퓨팅 플랫폼 선택(Spark 또는 non-Spark)
- 모델 업데이트 및 재학습
작업 명세 3.4: 하이퍼파라미터 최적화 수행
- 정규화 수행
- 교차 검증 수행
- 모델 초기화
- 신경망 아키텍처(층 및 노드), 학습률, 활성화 함수 이해
- 트리 기반 모델(트리 수, 레벨 수) 이해
- 선형 모델(학습률) 이해
작업 명세 3.5: ML 모델 평가
- 과적합 또는 과소적합 방지
- 평가 지표 평가(예: AUC-ROC, 정확도, 정밀도, 재현율, RMSE, F1 점수)
- 혼동 행렬 해석
- 오프라인 및 온라인 모델 평가(A/B 테스트)
- 지표를 사용하여 모델 비교(예: 모델 학습 시간, 모델 품질, 엔지니어링 비용)
- 교차 검증 수행
영역 4: 기계 학습 구현 및 운영
작업 명세 4.1: 성능, 가용성, 확장성, 복원력 및 내결함성을 갖춘 ML 솔루션 구축
- AWS 환경 로깅 및 모니터링
- AWS CloudTrail 및 Amazon CloudWatch
- 오류 모니터링 솔루션 구축
- 다중 AWS 리전 및 다중 가용 영역에 배포
- AMI 및 골든 이미지 생성
- Docker 컨테이너 생성
- Auto Scaling 그룹 배포
- 리소스 크기 조정(예: 인스턴스, 프로비저닝된 IOPS, 볼륨)
- 부하 분산 수행
- AWS 모범 사례 준수
작업 명세 4.2: 주어진 문제에 적합한 ML 서비스 및 기능 권장 및 구현
- AWS의 ML(애플리케이션 서비스), 예:
- Amazon Polly
- Amazon Lex
- Amazon Transcribe
- Amazon Q
- AWS 서비스 할당량 이해
- 맞춤형 모델을 구축할지 아니면 Amazon SageMaker 기본 제공 알고리즘을 사용할지 결정
- AWS 인프라(예: 인스턴스 유형) 및 비용 고려 사항 이해
- AWS Batch를 사용하여 스팟 인스턴스로 딥 러닝 모델 학습
작업 명세 4.3: ML 솔루션에 기본 AWS 보안 방법론 적용
- AWS Identity and Access Management(IAM)
- S3 버킷 정책
- 보안 그룹
- VPC
- 암호화 및 익명화
작업 명세 4.4: ML 솔루션 배포 및 운영화
- 엔드포인트 노출 및 상호 작용
- ML 모델 이해
- A/B 테스트 수행
- 재교육 파이프라인
- ML 모델 디버그 및 문제 해결
부록
시험에 나올 수 있는 기술 및 개념
다음 목록에는 시험에 나올 수 있는 기술과 개념이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. 이 목록의 항목 순서와 배치는 시험에서의 상대적 비중이나 중요성을 나타내지 않습니다:
- 수집 및 수집
- 처리 및 ETL
- 데이터 분석 및 시각화
- 모델 학습
- 모델 배포 및 추론
- ML 운영화
- AWS ML 애플리케이션 서비스
- ML 관련 언어(예: Python, Java, Scala, R, SQL)
- 노트북 및 통합 개발 환경(IDE)
범위에 포함되는 AWS 서비스 및 기능
다음 목록에는 시험에 포함되는 AWS 서비스와 기능이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. AWS 제품은 해당 제품의 주요 기능에 맞춰 범주화되어 있습니다:
분석:
- Amazon Athena
- Amazon Data Firehose
- Amazon EMR
- AWS Glue
- Amazon Kinesis
- Amazon Kinesis Data Streams
- AWS Lake Formation
- Amazon Managed Service for Apache Flink
- Amazon OpenSearch Service
- Amazon QuickSight
컴퓨팅:
- AWS Batch
- Amazon EC2
- AWS Lambda
컨테이너:
- Amazon Elastic Container Registry(Amazon ECR)
- Amazon Elastic Container Service(Amazon ECS)
- Amazon Elastic Kubernetes Service(Amazon EKS)
- AWS Fargate
데이터베이스:
사물 인터넷:
기계 학습:
- Amazon Bedrock
- Amazon Comprehend
- AWS Deep Learning AMIs(DLAMI)
- Amazon Forecast
- Amazon Fraud Detector
- Amazon Lex
- Amazon Kendra
- Amazon Mechanical Turk
- Amazon Polly
- Amazon Q
- Amazon Rekognition
- Amazon SageMaker
- Amazon Textract
- Amazon Transcribe
- Amazon Translate
관리 및 거버넌스:
- AWS CloudTrail
- Amazon CloudWatch
네트워킹 및 콘텐츠 전송:
보안, 자격, 규정 준수:
- AWS Identity and Access Management(IAM)
스토리지:
- Amazon Elastic Block Store(Amazon EBS)
- Amazon Elastic File System(Amazon EFS)
- Amazon FSx
- Amazon S3
범위에서 벗어나는 AWS 서비스 및 기능
다음 목록에는 시험 범위에서 벗어나는 AWS 서비스와 기능이 포함되어 있습니다. 이 목록은 포괄적이지 않으며 변경될 수 있습니다. 대상 직무와 전혀 관련이 없는 AWS 제품은 이 목록에서 제외되었습니다:
분석:
기계 학습:
- AWS DeepRacer
- Amazon Machine Learning(Amazon ML)
버전 2.4 MLS-C01