AWS 认证机器学习工程师 - 助理 (MLA-C01) 考试指南

简介

AWS 认证机器学习工程师 - 助理 (MLA-C01) 考试验证考生在 AWS 云上构建、运营、部署和维护机器学习 (ML) 解决方案和管道的能力。

该考试还验证考生完成以下任务的能力:

摄取、转换、验证和准备 ML 建模的数据。
选择通用建模方法、训练模型、调整超参数、分析模型性能并管理模型版本。
根据要求选择部署基础设施和端点、设置计算资源并配置自动扩展。
设置自动化编排 ML 工作流程的持续集成和持续交付 (CI/CD) 管道。
监控模型、数据和基础设施以检测问题。
通过访问控制、合规性功能和最佳实践保护 ML 系统和资源。

目标考生描述

目标考生应该至少有 1 年使用 Amazon SageMaker 和其他 AWS 服务进行 ML 工程的经验。目标考生还应该至少有 1 年从事相关工作,如后端软件开发、DevOps 开发、数据工程或数据科学。

目标考生不在考试范围内的工作任务

以下列表包含目标考生不被期望能够执行的工作任务。此列表并非详尽无遗。这些任务超出考试范围:

设计和架构全面的端到端 ML 解决方案
制定最佳实践和指导 ML 策略
与广泛的服务或新工具和技术进行集成
深入钻研两个或两个以上 ML 领域(例如自然语言处理 [NLP]、计算机视觉)
量化模型并分析准确性的影响

请参阅附录中的 AWS 服务和功能列表,了解考试范围内和考试范围外的内容。

考试内容

题型

考试包含以下一种或多种题型:

单项选择题:有一个正确答案和三个错误答案 (干扰项)。
多项选择题:从五个或更多个选项中有两个或更多个正确答案。您必须选择所有正确答案才能获得分数。
排序题:有 3-5 个答案,需要按正确顺序完成指定任务。您必须选择正确的答案并将其按正确顺序排列才能获得分数。
匹配题:有一个 3-7 个提示的列表要与一个答案列表进行匹配。您必须正确匹配所有对才能获得分数。
案例分析:有一个情景,其中包含两个或更多个与该情景有关的问题。每个问题都会单独评分。您需要回答案例分析中的每一个问题才能获得分数。

未回答的考试问题会被评为错误。没有猜测惩罚。考试包括会影响您成绩的 50 个问题。¹

非评分内容

考试还包括 15 个不会影响您成绩的非评分问题。AWS 会收集这些非评分问题的性能信息,以评估将来将这些问题用作评分问题的可能性。这些非评分问题在考试中不会被标识。

¹ 不适用于考试的测试版。您可以在 AWS 认证网站上找到有关测试版考试的更多信息。

考试结果

AWS 认证机器学习工程师 - 助理 (MLA-C01) 考试采用通过/不通过的评定方式。考试成绩是根据 AWS 专业人士遵循认证行业最佳实践和指南制定的最低合格标准进行评分的。

考试成绩以 100-1,000 的标准分数形式报告。及格分数为 720 分。您的分数反映了您在整个考试中的表现以及您是否通过。标准化评分模型有助于在可能具有略微不同难度水平的多个考试形式之间进行比较。

您的成绩报告可能包含对各部分性能的等级评定。考试采用补偿性评分模型,这意味着您无需在每个部分都及格。只需通过整体考试即可。

考试的每个部分都有特定的权重,因此某些部分的题目数量比其他部分多。等级评定表包含了一般信息,突出了您的优势和弱点。在解释部分反馈时请谨慎。

内容大纲

本考试指南包括考试的权重、内容域和任务陈述。但是,它并未提供考试内容的全面列表。但是,每个任务陈述都提供了额外的上下文,以帮助您为考试做准备。

考试包括以下内容域和权重:

域 1: 机器学习 (ML) 数据准备 (28% 的评分内容)
域 2: ML 模型开发 (26% 的评分内容)
域 3: ML 工作流程的部署和编排 (22% 的评分内容)
域 4: ML 解决方案监控、维护和安全 (24% 的评分内容)

域 1: 机器学习 (ML) 数据准备

任务陈述 1.1: 摄取和存储数据。

知识:

数据格式和摄取机制(例如,已验证和未验证格式、Apache Parquet、JSON、CSV、Apache ORC、Apache Avro、RecordIO)
如何使用核心 AWS 数据源(例如,Amazon S3、Amazon Elastic File System [Amazon EFS]、Amazon FSx for NetApp ONTAP)
如何使用 AWS 流数据源摄取数据 (例如,Amazon Kinesis、Apache Flink、Apache Kafka)
AWS 存储选项,包括用例和权衡

技能:

通过使用相关 AWS 服务选项(例如,Amazon S3 Transfer Acceleration、Amazon EBS Provisioned IOPS)从存储(例如,Amazon S3、Amazon Elastic Block Store [Amazon EBS]、Amazon EFS、Amazon RDS、Amazon DynamoDB)中提取数据
根据数据访问模式选择合适的数据格式(例如,Parquet、JSON、CSV、ORC)
将数据摄取到 Amazon SageMaker Data Wrangler 和 SageMaker Feature Store 中
从多个源合并数据(例如,通过使用编程技术、AWS Glue、Apache Spark)
解决涉及容量和可伸缩性的数据摄取和存储问题进行故障排除和调试
基于成本、性能和数据结构做出初步存储决策

任务陈述 1.2: 转换数据并执行特征工程。

知识:

数据清洗和转换技术(例如,检测和处理异常值、填充缺失数据、合并、去重)
特征工程技术(例如,数据缩放和标准化、特征拆分、分箱、对数转换、归一化)
编码技术(例如,one-hot 编码、二进制编码、标签编码、令牌化)
探索、可视化或转换数据和特征的工具(例如,SageMaker Data Wrangler、AWS Glue、AWS Glue DataBrew)
转换流数据的服务(例如,AWS Lambda、Spark)
创建高质量标记数据集的数据注释和标记服务

技能:

使用 AWS 工具(例如,AWS Glue、AWS Glue DataBrew、在 Amazon EMR 上运行的 Spark)转换数据
使用 AWS 工具(例如,SageMaker Feature Store)创建和管理特征
使用 AWS 服务(例如,SageMaker Ground Truth、Amazon Mechanical Turk)验证和标记数据

任务陈述 1.3: 确保数据完整性并准备数据进行建模。

知识:

数字、文本和图像数据的预训练偏差指标(例如,类别失衡 [CI]、标签比例差 [DPL])
解决数字、文本和图像数据集中 CI 的策略(例如,合成数据生成、重采样)
加密数据的技术
数据分类、匿名化和掩码
合规性要求的影响(例如,个人身份信息 [PII]、受保护的健康信息 [PHI]、数据驻留)

技能:

验证数据质量(例如,使用 AWS Glue DataBrew 和 AWS Glue Data Quality)
识别和减轻数据中的偏差源(例如,选择偏差、测量偏差),使用 AWS 工具(例如,SageMaker Clarify)
准备数据以降低预测偏差(例如,通过数据集拆分、洗牌和增强)
配置数据以加载到模型训练资源(例如,Amazon EFS、Amazon FSx)

域 2: ML 模型开发

任务陈述 2.1: 选择建模方法。

知识:

ML 算法的功能和适当用途,以解决业务问题
如何使用 AWS 人工智能 (AI) 服务(例如,Amazon Translate、Amazon Transcribe、Amazon Rekognition、Amazon Bedrock)来解决特定的业务问题
在模型选择或算法选择过程中如何考虑可解释性
SageMaker 内置算法及其应用场景

技能:

评估可用数据和问题复杂度,确定 ML 解决方案的可行性
比较和选择适合解决特定问题的 ML 模型或算法
选择内置算法、基础模型和解决方案模板(例如,在 SageMaker JumpStart 和 Amazon Bedrock 中)
根据成本选择模型或算法
选择 AI 服务来解决常见的业务需求

任务陈述 2.2: 训练和细化模型。

知识:

训练过程中的元素(例如,epoch、steps、batch size)
减少模型训练时间的方法(例如,早停、分布式训练)
影响模型大小的因素
提高模型性能的方法
正则化技术的好处(例如,dropout、权重衰减、L1 和 L2)
超参数调优技术(例如,随机搜索、贝叶斯优化)
模型超参数及其对模型性能的影响(例如,树模型中的树的数量、神经网络中的层数)
将在 SageMaker 外构建的模型集成到 SageMaker 中的方法

技能:

使用 SageMaker 内置算法和常用 ML 库开发 ML 模型
使用 SageMaker 支持的框架(例如,TensorFlow、PyTorch)中的 SageMaker 脚本模式训练模型
使用自定义数据集对预训练模型进行微调(例如,Amazon Bedrock、SageMaker JumpStart)
执行超参数调优(例如,使用 SageMaker 自动模型调优 [AMT])
集成自动超参数优化功能
防止模型过拟合、欠拟合和灾难性遗忘(例如,使用正则化技术、特征选择)
结合多个训练模型以提高性能(例如,集成、堆叠、提升)
通过改变数据类型、修剪、更新特征选择、压缩等方式减小模型大小
管理模型版本以实现可重复性和审核(例如,使用 SageMaker Model Registry)

任务陈述 2.3: 分析模型性能。

知识:

模型评估技术和指标(例如,混淆矩阵、热图、F1 分数、准确率、精确率、召回率、均方根误差 [RMSE]、接收器操作特性 [ROC]、ROC 曲线下面积 [AUC])
创建性能基线的方法
识别模型过拟合和欠拟合的方法
SageMaker Clarify 提供的度量指标,以获得 ML 训练数据和模型的见解
收敛问题

技能:

选择和解释评估指标,检测模型偏差
权衡模型性能、训练时间和成本之间的权衡
使用 AWS 服务进行可重复的实验
将影子变体的性能与生产变体的性能进行比较
使用 SageMaker Clarify 解释模型输出
使用 SageMaker Model Debugger 调试模型收敛

域 3: ML 工作流程的部署和编排

任务陈述 3.1: 根据现有架构和要求选择部署基础设施。

知识:

部署最佳实践(例如,版本控制、回滚策略)
AWS 部署服务(例如,SageMaker)
实时和批量服务 ML 模型的方法
如何在生产环境和测试环境中配置计算资源(例如,CPU、GPU)
部署端点的模型和端点要求(例如,无服务器端点、实时端点、异步端点、批量推断)
如何选择适当的容器(例如,提供的或自定义的)
在边缘设备上优化模型的方法(例如,SageMaker Neo)

技能:

评估性能、成本和延迟之间的权衡
根据要求选择训练和推理的合适计算环境(例如,GPU 或 CPU 规格、处理器系列、网络带宽)
选择合适的部署编排器(例如,Apache Airflow、SageMaker Pipelines)
选择多模型或多容器部署
选择正确的部署目标(例如,SageMaker 端点、Kubernetes、Amazon Elastic Container Service [Amazon ECS]、Amazon Elastic Kubernetes Service [Amazon EKS]、Lambda)
选择模型部署策略(例如,实时、批量)

任务陈述 3.2: 根据现有架构和要求创建和编写基础设施。

知识:

按需和预置资源的区别
如何比较扩展策略
基础设施即代码 (IaC) 选项(例如,AWS CloudFormation、AWS Cloud Development Kit [AWS CDK])的权衡和使用案例
容器化概念和 AWS 容器服务
如何使用 SageMaker 端点自动扩展策略满足可伸缩性要求(例如,基于需求、时间)

技能:

应用最佳实践,以实现可维护、可扩展且成本效益高的 ML 解决方案(例如,在 SageMaker 端点上自动扩展、动态添加 Spot 实例、使用 Amazon EC2 实例、使用 Lambda 作为端点)
自动配置计算资源,包括堆栈之间的通信(例如,使用 CloudFormation、AWS CDK)
构建和维护容器(例如,Amazon Elastic Container Registry [Amazon ECR]、Amazon EKS、Amazon ECS、使用 SageMaker 的自带容器 [BYOC])
在 VPC 网络中配置 SageMaker 端点
使用 SageMaker SDK 部署和托管模型
选择特定指标进行自动扩展(例如,模型延迟、CPU 使用率、每实例调用量)

任务陈述 3.3: 使用自动化编排工具设置持续集成和持续交付 (CI/CD) 管道。

知识:

AWS CodePipeline、AWS CodeBuild 和 AWS CodeDeploy 的功能和配额
与编排服务集成的数据摄取自动化
版本控制系统和基本用法(例如,Git)
CI/CD 原则以及它们如何适用于 ML 工作流程
部署策略和回滚操作(例如,蓝/绿、金丝雀、线性)
代码存储库和管道如何协作工作

技能:

配置和排除 CodeBuild、CodeDeploy 和 CodePipeline 的故障,包括阶段
应用连续部署流程结构以调用管道(例如,Gitflow、GitHub Flow)
使用 AWS 服务自动化编排(例如,部署 ML 模型、自动化模型构建)
配置训练和推理作业(例如,使用 Amazon EventBridge 规则、SageMaker Pipelines、CodePipeline)
在 CI/CD 管道中创建自动化测试(例如,集成测试、单元测试、端到端测试)
构建和集成重新训练模型的机制

域 4: ML 解决方案监控、维护和安全

任务陈述 4.1: 监控模型推理。

知识:

ML 模型漂移
监控数据质量和模型性能的技术
与监控相关的 ML 镜头设计原则

技能:

监控生产中的模型(例如,使用 SageMaker Model Monitor)
监控工作流程以检测数据处理或模型推理中的异常或错误
检测可能影响模型性能的数据分布变化(例如,使用 SageMaker Clarify)
使用 A/B 测试监控生产中的模型性能

任务陈述 4.2: 监控和优化基础设施和成本。

知识:

ML 基础设施的关键性能指标(例如,利用率、吞吐量、可用性、可扩展性、容错)
用于排查延迟和性能问题的监控和可观察性工具(例如,AWS X-Ray、Amazon CloudWatch Lambda Insights、Amazon CloudWatch Logs Insights)
如何使用 AWS CloudTrail 记录、监控和触发重新训练活动
实例类型之间的差异及其对性能的影响(例如,内存优化、计算优化、通用、推理优化)
成本分析工具的功能(例如,AWS Cost Explorer、AWS Billing and Cost Management、AWS Trusted Advisor)
成本跟踪和分配技术(例如,资源标记)

技能:

配置和使用工具进行故障排查和资源分析(例如,CloudWatch Logs、CloudWatch 警报)
创建 CloudTrail 跟踪
设置仪表板以监控性能指标(例如,使用 Amazon QuickSight、CloudWatch 仪表板)
监控基础设施(例如,使用 EventBridge 事件)
调整实例系列和大小(例如,使用 SageMaker Inference Recommender 和 AWS Compute Optimizer)
监控和解决延迟和扩展问题
为成本监控做好基础设施准备(例如,应用标记策略)
通过使用适当的成本管理工具(例如,AWS Cost Explorer、AWS Trusted Advisor、AWS Budgets)来排查涉及成本和性能的容量问题
通过选择采购选项(例如,Spot 实例、按需实例、预留实例、SageMaker Savings Plans)来优化基础设施成本

任务陈述 4.3: 保护 AWS 资源。

知识:

控制对 AWS 服务的访问的 IAM 角色、策略和组(例如,AWS Identity and Access Management [IAM]、存储桶策略、SageMaker Role Manager)
SageMaker 的安全和合规特性
访问 ML 资源的网络控制
CI/CD 管道的安全最佳实践

技能:

配置对 ML 工件的最小特权访问
为与 ML 系统交互的用户和应用程序配置 IAM 策略和角色
监控、审计和记录 ML 系统,以确保持续的安全性和合规性
排查和调试安全问题
构建 VPC、子网和安全组,以安全隔离 ML 系统

附录

考试范围内的 AWS 服务和功能

以下列表包含考试范围内的 AWS 服务和功能。此列表并非详尽无遗,并且可能会更改。AWS 产品按其主要功能划分为类别:

分析:

Amazon Athena
Amazon Data Firehose
Amazon EMR
AWS Glue
AWS Glue DataBrew
AWS Glue Data Quality
Amazon Kinesis
AWS Lake Formation
Amazon Managed Service for Apache Flink
Amazon OpenSearch Service
Amazon QuickSight
Amazon Redshift

应用程序集成:

Amazon EventBridge
Amazon Managed Workflows for Apache Airflow (Amazon MWAA)
Amazon Simple Notification Service (Amazon SNS)
Amazon Simple Queue Service (Amazon SQS)
AWS Step Functions

云财务管理:

AWS Billing and Cost Management
AWS Budgets
AWS Cost Explorer

计算:

AWS Batch
Amazon EC2
AWS Lambda
AWS Serverless Application Repository

容器:

Amazon Elastic Container Registry (Amazon ECR)
Amazon Elastic Container Service (Amazon ECS)
Amazon Elastic Kubernetes Service (Amazon EKS)

数据库:

Amazon DocumentDB (与 MongoDB 兼容)
Amazon DynamoDB
Amazon ElastiCache
Amazon Neptune
Amazon RDS

开发者工具:

AWS Cloud Development Kit (AWS CDK)
AWS CodeArtifact
AWS CodeBuild
AWS CodeDeploy
AWS CodePipeline
AWS X-Ray

机器学习:

Amazon Augmented AI (Amazon A2I)
Amazon Bedrock
Amazon CodeGuru
Amazon Comprehend
Amazon Comprehend Medical
Amazon DevOps Guru
Amazon Fraud Detector
AWS HealthLake
Amazon Kendra
Amazon Lex
Amazon Lookout for Equipment
Amazon Lookout for Metrics
Amazon Lookout for Vision
Amazon Mechanical Turk
Amazon Personalize
Amazon Polly
Amazon Q
Amazon Rekognition
Amazon SageMaker
Amazon Textract
Amazon Transcribe
Amazon Translate

管理和治理:

AWS Auto Scaling
AWS Chatbot
AWS CloudFormation
AWS CloudTrail
Amazon CloudWatch
Amazon CloudWatch Logs
AWS Compute Optimizer
AWS Config
AWS Organizations
AWS Service Catalog
AWS Systems Manager
AWS Trusted Advisor

媒体:

Amazon Kinesis Video Streams

迁移和传输:

AWS DataSync

网络和内容传递:

Amazon API Gateway
Amazon CloudFront
AWS Direct Connect
Amazon VPC

安全性、身份和合规性:

AWS Identity and Access Management (IAM)
AWS Key Management Service (AWS KMS)
Amazon Macie
AWS Secrets Manager

存储:

Amazon Elastic Block Store (Amazon EBS)
Amazon Elastic File System (Amazon EFS)
Amazon FSx
Amazon S3
Amazon S3 Glacier
AWS Storage Gateway

考试范围外的 AWS 服务和功能

以下列表包含考试范围外的 AWS 服务和功能。此列表并非详尽无遗,并且可能会更改。与目标工作角色无关的 AWS 产品被从该列表中排除:

分析:

AWS Clean Rooms
Amazon DataZone
Amazon FinSpace

应用程序集成:

Amazon AppFlow
Amazon MQ
Amazon Simple Workflow Service (Amazon SWF)

商业应用程序:

Amazon Chime
Amazon Connect
Amazon Honeycode
Amazon Pinpoint
Amazon Simple Email Service (Amazon SES)
AWS Supply Chain
AWS Wickr
Amazon WorkDocs
Amazon WorkMail

云财务管理:

AWS Application Cost Profiler

计算:

AWS App Runner
AWS Elastic Beanstalk
Amazon Lightsail
AWS Outposts

容器:

Red Hat OpenShift Service on AWS (ROSA)

客户启用:

AWS Activate for startups
AWS IQ
AWS re:Post Private

开发者工具:

AWS Application Composer
AWS CloudShell
Amazon CodeCatalyst
AWS Fault Injection Service

最终用户计算:

Amazon AppStream 2.0
Amazon WorkSpaces
Amazon WorkSpaces Secure Browser
Amazon WorkSpaces Thin Client

前端 Web 和移动:

AWS Amplify
AWS AppSync
AWS Device Farm
Amazon Location Service

物联网 (IoT):

FreeRTOS
AWS IoT 1-Click
AWS IoT Core
AWS IoT Device Defender
AWS IoT Device Management
AWS IoT Events
AWS IoT FleetWise
AWS IoT Greengrass
AWS IoT RoboRunner
AWS IoT SiteWise
AWS IoT TwinMaker

机器学习:

AWS DeepRacer
AWS HealthImaging
AWS HealthOmics
Amazon Monitron
AWS Panorama

管理和治理:

AWS AppConfig
AWS Control Tower
AWS Launch Wizard
AWS License Manager
Amazon Managed Grafana
AWS Proton
AWS Resilience Hub
AWS Resource Explorer
AWS Telco Network Builder
AWS User Notifications

媒体:

Amazon Elastic Transcoder
AWS Elemental Appliances and Software
AWS Elemental MediaConnect
AWS Elemental MediaConvert
AWS Elemental MediaLive
AWS Elemental MediaPackage
AWS Elemental MediaStore
AWS Elemental MediaTailor
Amazon Interactive Video Service (Amazon IVS)
Amazon Nimble Studio

迁移和传输:

AWS Application Discovery Service
AWS Application Migration Service
AWS Mainframe Modernization
AWS Migration Hub

网络和内容交付:

AWS App Mesh
AWS Cloud Map
AWS Global Accelerator
AWS Private 5G
Amazon Route 53

官方 MLA-C01 考试指南

AWS 认证机器学习工程师 - 助理 (MLA-C01) 考试指南

简介

目标考生描述

推荐的一般 IT 知识

推荐的 AWS 知识

目标考生不在考试范围内的工作任务

考试内容

题型

非评分内容

考试结果

内容大纲

域 1: 机器学习 (ML) 数据准备

任务陈述 1.1: 摄取和存储数据。

任务陈述 1.2: 转换数据并执行特征工程。

任务陈述 1.3: 确保数据完整性并准备数据进行建模。

域 2: ML 模型开发

任务陈述 2.1: 选择建模方法。

任务陈述 2.2: 训练和细化模型。

任务陈述 2.3: 分析模型性能。

域 3: ML 工作流程的部署和编排

任务陈述 3.1: 根据现有架构和要求选择部署基础设施。

任务陈述 3.2: 根据现有架构和要求创建和编写基础设施。

任务陈述 3.3: 使用自动化编排工具设置持续集成和持续交付 (CI/CD) 管道。

域 4: ML 解决方案监控、维护和安全

任务陈述 4.1: 监控模型推理。

任务陈述 4.2: 监控和优化基础设施和成本。

任务陈述 4.3: 保护 AWS 资源。

附录

考试范围内的 AWS 服务和功能

考试范围外的 AWS 服务和功能