دليل الامتحان - AWS Certified Machine Learning Engineer - Associate (MLA-C01)
المقدمة
يؤكد امتحان AWS Certified Machine Learning Engineer - Associate (MLA-C01) على قدرة المرشح على إنشاء وتشغيل وإنشار وصيانة حلول وتدفقات عمل تعلم الآلة باستخدام سحابة AWS.
كما يؤكد الامتحان على قدرة المرشح على إنجاز المهام التالية:
- استيراد البيانات وتحويلها والتحقق منها وإعدادها لنمذجة تعلم الآلة.
- اختيار نُهُج النمذجة العامة، وتدريب النماذج، وضبط أوزان النموذج، وتحليل أداء النموذج، وإدارة إصدارات النماذج.
- اختيار بنية النشر والنقاط الطرفية، وتوفير موارد الحوسبة، وتكوين التمديد التلقائي بناءً على المتطلبات.
- إعداد أنابيب التكامل المستمر والتوصيل المستمر (CI/CD) لأتمتة تنسيق سيناريوهات تعلم الآلة.
- مراقبة النماذج والبيانات والبنية التحتية للكشف عن المشكلات.
- تأمين أنظمة وموارد تعلم الآلة من خلال أدوات التحكم بالوصول والميزات الخاصة بالامتثال وأفضل الممارسات.
وصف المرشح المستهدف
ينبغي أن يكون المرشح المستهدف لديه ما لا يقل عن سنة واحدة من الخبرة باستخدام Amazon SageMaker وخدمات AWS الأخرى لهندسة تعلم الآلة. كما ينبغي أن يكون لدى المرشح المستهدف ما لا يقل عن سنة واحدة من الخبرة في دور ذي صلة مثل مطور برامج خلفية، ومطور DevOps، ومهندس بيانات، أو عالم بيانات.
المعرفة العامة بتكنولوجيا المعلومات الموصى بها
ينبغي أن يكون لدى المرشح المستهدف المعرفة التالية بتكنولوجيا المعلومات العامة:
- فهم أساسي للخوارزميات الشائعة لتعلم الآلة وحالات استخدامها
- أساسيات هندسة البيانات، بما في ذلك المعرفة بتنسيقات البيانات الشائعة والاستيراد والتحويل للعمل مع أنابيب بيانات تعلم الآلة
- معرفة باستعلام وتحويل البيانات
- معرفة بأفضل ممارسات هندسة البرامج لتطوير برامج قابلة للصيانة وقابلة لإعادة الاستخدام والنشر وإصلاح الأخطاء
- الدراية بتجهيز ومراقبة موارد تعلم الآلة في السحابة وفي المواقع المحلية
- الخبرة مع أنابيب التكامل المستمر والتوصيل المستمر (CI/CD) والبنية التحتية كرمز
المعرفة بـ AWS الموصى بها
ينبغي أن يكون لدى المرشح المستهدف المعرفة التالية بـ AWS:
- معرفة بإمكانات SageMaker والخوارزميات لبناء النماذج والنشر
- معرفة بخدمات تخزين وتجهيز البيانات في AWS لإعداد البيانات للنمذجة
- الدراية بنشر التطبيقات والبنية التحتية على AWS
- معرفة بأدوات المراقبة للتسجيل وإصلاح أخطاء أنظمة تعلم الآلة
- معرفة بخدمات AWS للأتمتة وتنسيق أنابيب التكامل المستمر والتوصيل المستمر (CI/CD)
- فهم أفضل ممارسات أمان AWS للهوية والوصول والتشفير وحماية البيانات
المهام الوظيفية التي تقع خارج نطاق المرشح المستهدف
تحتوي القائمة التالية على المهام الوظيفية التي لا يُتوقع أن يكون المرشح المستهدف قادرًا على القيام بها. هذه القائمة ليست شاملة. هذه المهام تقع خارج نطاق الامتحان:
- تصميم وهندسة حلول تعلم الآلة كاملة من البداية إلى النهاية
- إنشاء أفضل الممارسات والتوجيه الاستراتيجي لتعلم الآلة
- التعامل مع التكامل مع مجموعة واسعة من الخدمات أو الأدوات والتقنيات الجديدة
- العمل بشكل عميق في مجالي تعلم الآلة أو أكثر (على سبيل المثال، معالجة اللغة الطبيعية، الرؤية الحاسوبية)
- تقليل النماذج وتحليل التأثير على الدقة
راجع الملحق لقائمة بخدمات وميزات AWS المدرجة والخدمات وميزات AWS المستبعدة.
محتوى الامتحان
أنواع الأسئلة
يحتوي الامتحان على واحد أو أكثر من أنواع الأسئلة التالية:
- الاختيار من متعدد: له إجابة صحيحة واحدة وثلاث إجابات خاطئة (مشتتات).
- الاختيار المتعدد: له إجابتين صحيحتين أو أكثر من بين خمس خيارات أو أكثر. يجب عليك تحديد جميع الإجابات الصحيحة للحصول على الائتمان للسؤال.
- الترتيب: له قائمة من 3-5 إجابات لإكمال مهمة محددة. يجب عليك تحديد الإجابات الصحيحة ووضع الإجابات في الترتيب الصحيح للحصول على الائتمان للسؤال.
- المطابقة: له قائمة من الإجابات لمطابقتها مع قائمة من 3-7 منبهات. يجب عليك مطابقة جميع الأزواج بشكل صحيح للحصول على الائتمان للسؤال.
- دراسة الحالة: له سيناريو واحد مع سؤالين أو أكثر حول السيناريو. السيناريو هو نفسه لكل سؤال في دراسة الحالة. سيتم تقييم كل سؤال في دراسة الحالة بشكل منفصل. ستحصل على الائتمان لكل سؤال أجبت عليه بشكل صحيح في دراسة الحالة.
تُعامل الأسئلة التي لم يتم الإجابة عليها في الامتحان على أنها إجابات خاطئة. لا يوجد عقاب على التخمين. يتضمن الامتحان 50 سؤالاً تؤثر على درجتك.¹
المحتوى غير المقيّم
يتضمن الامتحان 15 سؤالًا غير مقيّم لا تؤثر على درجتك. تجمع AWS معلومات حول الأداء على هذه الأسئلة غير المقيّمة لتقييم هذه الأسئلة لاستخدامها في المستقبل كأسئلة مقيّمة. لا يتم تحديد هذه الأسئلة غير المقيّمة في الامتحان.
¹ لا ينطبق على النسخة التجريبية من الامتحان. يمكنك العثور على المزيد من المعلومات حول الامتحانات التجريبية بشكل عام على موقع الويب لشهادات AWS.
نتائج الامتحان
امتحان AWS Certified Machine Learning Engineer - Associate (MLA-C01) له تحديد اجتياز أو رسوب. يتم تقييم الامتحان مقابل الحد الأدنى من المعايير المحددة من قِبل مهنيي AWS الذين يتبعون أفضل الممارسات والمبادئ التوجيهية لصناعة الشهادات.
يتم الإبلاغ عن نتائجك في الامتحان كدرجة مقياسية من 100 إلى 1000. الحد الأدنى للنتيجة المارة هو 720. تُظهر درجتك كيف أديت في الامتحان ككل وما إذا كنت قد اجتزت. تساعد نماذج الدرجات المقياسية على معادلة الدرجات عبر عدة أشكال امتحانية قد تكون لها مستويات صعوبة مختلفة قليلاً.
قد يحتوي تقرير درجتك على جدول لتصنيفات أدائك على مستوى كل قسم. يستخدم الامتحان نموذج درجات تعويضي، مما يعني أنك لا تحتاج إلى تحقيق درجة مارة في كل قسم. يجب عليك اجتياز الامتحان ككل فقط.
لكل قسم من أقسام الامتحان وزن محدد، لذلك يكون لبعض الأقسام المزيد من الأسئلة من أقسام أخرى. يحتوي جدول التصنيفات على معلومات عامة تسلط الضوء على نقاط القوة والضعف لديك. توخ الحذر عند تفسير التغذية المرتدة على مستوى القسم.
خطة المحتوى
يتضمن هذا الدليل للامتحان أوزانًا ومجالات محتوى وبيانات مهام للامتحان. لا يوفر هذا الدليل قائمة شاملة بالمحتوى في الامتحان. ومع ذلك، هناك سياق إضافي لكل بيان مهمة متاح لمساعدتك في الاستعداد للامتحان.
يحتوي الامتحان على المجالات المحتوية والأوزان التالية:
- المجال 1: إعداد البيانات لتعلم الآلة (ML) (28% من المحتوى المقيّم)
- المجال 2: تطوير نموذج تعلم الآلة (26% من المحتوى المقيّم)
- المجال 3: نشر وتنسيق سيناريوهات تعلم الآلة (22% من المحتوى المقيّم)
- المجال 4: مراقبة وصيانة وأمان حلول تعلم الآلة (24% من المحتوى المقيّم)
المجال 1: إعداد البيانات لتعلم الآلة (ML)
بيان المهمة 1.1: استيراد وتخزين البيانات.
المعرفة بـ:
- تنسيقات البيانات وآليات الاستيراد (على سبيل المثال، التنسيقات المصادق عليها وغير المصادق عليها، Apache Parquet، JSON، CSV، Apache ORC، Apache Avro، RecordIO)
- كيفية استخدام مصادر البيانات الأساسية في AWS (على سبيل المثال، Amazon S3، Amazon Elastic File System [Amazon EFS]، Amazon FSx لـ NetApp ONTAP)
- كيفية استخدام مصادر بيانات البث الحي في AWS لاستيراد البيانات (على سبيل المثال، Amazon Kinesis، Apache Flink، Apache Kafka)
- خيارات تخزين AWS، بما في ذلك حالات الاستخدام والمقايضات
المهارات في:
- استخراج البيانات من التخزين (على سبيل المثال، Amazon S3، Amazon Elastic Block Store [Amazon EBS]، Amazon EFS، Amazon RDS، Amazon DynamoDB) باستخدام خيارات خدمة AWS ذات الصلة (على سبيل المثال، Amazon S3 Transfer Acceleration، Amazon EBS Provisioned IOPS)
- اختيار تنسيقات البيانات المناسبة (على سبيل المثال، Parquet، JSON، CSV، ORC) بناءً على أنماط الوصول إلى البيانات
- استيراد البيانات إلى Amazon SageMaker Data Wrangler و SageMaker Feature Store
- دمج البيانات من مصادر متعددة (على سبيل المثال، باستخدام تقنيات البرمجة، AWS Glue، Apache Spark)
- استكشاف أخطاء واستدراك مشكلات استيراد وتخزين البيانات التي تتعلق بالسعة والقابلية للتطوير
- اتخاذ قرارات أولية بشأن التخزين بناءً على التكلفة والأداء وبنية البيانات
بيان المهمة 1.2: تحويل البيانات وإجراء هندسة الميزات.
المعرفة بـ:
- تقنيات تنظيف البيانات والتحويل (على سبيل المثال، اكتشاف وعلاج القيم المتطرفة، استبدال البيانات المفقودة، الدمج، إزالة التكرارات)
- تقنيات هندسة الميزات (على سبيل المثال، مقياس البيانات والتوحيد القياسي، تجزئة الميزات، التجزئة، التحويل اللوغاريتمي، التقنين)
- تقنيات الترميز (على سبيل المثال، الترميز أحادي الاستخدام، الترميز الثنائي، ترميز التصنيف، الترميز)
- الأدوات لاستكشاف البيانات والميزات أو تحويلها (على سبيل المثال، SageMaker Data Wrangler، AWS Glue، AWS Glue DataBrew)
- الخدمات التي تحول البيانات المتدفقة (على سبيل المثال، AWS Lambda، Spark)
- خدمات تسمية وتوليد بيانات التعليم التي تنشئ مجموعات بيانات ملصقة عالية الجودة
المهارات في:
- تحويل البيانات باستخدام أدوات AWS (على سبيل المثال، AWS Glue، AWS Glue DataBrew، Spark الذي يعمل على Amazon EMR، SageMaker Data Wrangler)
- إنشاء وإدارة الميزات باستخدام أدوات AWS (على سبيل المثال، SageMaker Feature Store)
- التحقق من صحة وتوسيم البيانات باستخدام خدمات AWS (على سبيل المثال، SageMaker Ground Truth، Amazon Mechanical Turk)
بيان المهمة 1.3: ضمان سلامة البيانات وإعداد البيانات للنمذجة.
المعرفة بـ:
- مقاييس التحيز قبل التدريب للبيانات الرقمية والنصية والصورية (على سبيل المثال، عدم التوازن في الفئة [CI]، الفرق في نسب التصنيفات [DPL])
- الاستراتيجيات لمعالجة عدم التوازن في الفئة في مجموعات البيانات الرقمية والنصية والصورية (على سبيل المثال، إنشاء بيانات تخليقية، إعادة المعاينة)
- تقنيات لتشفير البيانات
- تصنيف البيانات وإخفاؤها وحجبها
- آثار متطلبات الامتثال (على سبيل المثال، معلومات التعريف الشخصية [PII]، معلومات الصحة المحمية [PHI]، إقامة البيانات)
المهارات في:
- التحقق من جودة البيانات (على سبيل المثال، باستخدام AWS Glue DataBrew وAWS Glue Data Quality)
- تحديد ومعالجة مصادر التحيز في البيانات (على سبيل المثال، التحيز في الاختيار، التحيز في القياس) باستخدام أدوات AWS (على سبيل المثال، SageMaker Clarify)
- إعداد البيانات لتقليل تحيز التنبؤ (على سبيل المثال، باستخدام تقسيم مجموعة البيانات، والمزج، والتضخيم)
- تهيئة البيانات لتحميلها في موارد تدريب النموذج (على سبيل المثال، Amazon EFS، Amazon FSx)
المجال 2: تطوير نموذج تعلم الآلة
بيان المهمة 2.1: اختيار نهج النمذجة.
المعرفة بـ:
- إمكانات واستخدامات مناسبة لخوارزميات تعلم الآلة لحل المشكلات التجارية
- كيفية استخدام خدمات الذكاء الاصطناعي (AI) في AWS (على سبيل المثال، Amazon Translate، Amazon Transcribe، Amazon Rekognition، Amazon Bedrock) لحل مشكلات تجارية محددة
- كيفية النظر في القابلية للتفسير أثناء اختيار النموذج أو اختيار الخوارزمية
- الخوارزميات المضمنة في SageMaker والوقت المناسب لتطبيقها
المهارات في:
- تقييم البيانات المتاحة وتعقيد المشكلة لتحديد جدوى حل تعلم الآلة
- مقارنة واختيار نماذج أو خوارزميات تعلم آلة مناسبة لحل مشكلات محددة
- اختيار الخوارزميات المضمنة، والنماذج الأساسية، وقوالب الحلول (على سبيل المثال، في SageMaker JumpStart وAmazon Bedrock)
- اختيار النماذج أو الخوارزميات بناءً على التكاليف
- اختيار خدمات الذكاء الاصطناعي لحل الاحتياجات التجارية الشائعة
بيان المهمة 2.2: تدريب وتحسين النماذج.
المعرفة بـ:
- العناصر في عملية التدريب (على سبيل المثال، الحقبة، الخطوات، حجم الدفعة)
- طرق لتقليل وقت تدريب النموذج (على سبيل المثال، التوقف المبكر، التدريب الموزع)
- العوامل التي تؤثر على حجم النموذج
- طرق لتحسين أداء النموذج
- فوائد تقنيات التنظيم (على سبيل المثال، التنقيص، التراجع في الوزن، L1 و L2)
- تقنيات ضبط تحسين الهايبرمعلمة (على سبيل المثال، البحث العشوائي، التحسين القائم على بايز)
- الهايبرمعلمات النموذجية وتأثيرها على أداء النموذج (على سبيل المثال، عدد الأشجار في نموذج مبني على الشجرة، عدد الطبقات في شبكة عصبية)
- طرق لدمج النماذج التي تم بناؤها خارج SageMaker في SageMaker
المهارات في:
- استخدام الخوارزميات المضمنة في SageMaker والمكتبات الشائعة لتعلم الآلة لتطوير نماذج تعلم الآلة
- استخدام وضع السكربت في SageMaker مع الأطر المدعومة من SageMaker لتدريب النماذج (على سبيل المثال، TensorFlow، PyTorch)
- استخدام مجموعات البيانات المخصصة لضبط النماذج المدربة مسبقًا (على سبيل المثال، Amazon Bedrock، SageMaker JumpStart)
- إجراء ضبط الهايبرمعلمة (على سبيل المثال، باستخدام التنظيم التلقائي للنماذج [AMT] من SageMaker)
- دمج قدرات ضبط الهايبرمعلمة التلقائية
- منع زيادة ملاءمة النموذج، والتناقص ، والنسيان الكارثي (على سبيل المثال، باستخدام تقنيات التنظيم، واختيار الميزات)
- دمج نماذج التدريب المتعددة لتحسين الأداء (على سبيل المثال، الهندسة، التراكب، التعزيز)
- تقليل حجم النموذج (على سبيل المثال، عن طريق تغيير أنواع البيانات، والتقليم، وتحديث اختيار الميزات، والضغط)
- إدارة إصدارات النموذج للقابلية للتكرار والتدقيق (على سبيل المثال، باستخدام SageMaker Model Registry)
بيان المهمة 2.3: تحليل أداء النموذج.
المعرفة بـ:
- تقنيات وقياسات تقييم النماذج (على سبيل المثال، مصفوفة الالتباس، خرائط الحرارة، درجة F1، الدقة، الدقة، الاستدعاء، الجذر التربيعي لمتوسط مربع الخطأ [RMSE]، منحنى التشغيل الخاطئ [ROC]، المساحة تحت منحنى ROC [AUC])
- طرق إنشاء خطوط أساس الأداء
- طرق لتحديد زيادة ملاءمة النموذج والتناقص
- المقاييس المتوفرة في SageMaker Clarify لاكتساب رؤى حول بيانات التدريب والنماذج لتعلم الآلة
- مشكلات التقارب
المهارات في:
- تحديد وتفسير مقاييس التقييم والكشف عن التحيز في النموذج
- تقييم المقايضات بين أداء النموذج ووقت التدريب والتكلفة
- إجراء تجارب قابلة للتكرار باستخدام خدمات AWS
- مقارنة أداء النسخة التظليلية بأداء النسخة الإنتاجية
- استخدام SageMaker Clarify لتفسير مخرجات النموذج
- استخدام SageMaker Model Debugger لإصلاح مشكلات تقارب النموذج
المجال 3: نشر وتنسيق سيناريوهات تعلم الآلة
بيان المهمة 3.1: اختيار بنية النشر بناءً على البنية المعمارية والمتطلبات الحالية.
المعرفة بـ:
- أفضل الممارسات للنشر (على سبيل المثال، إصدار الإصدارات، استراتيجيات الإعادة)
- خدمات نشر AWS (على سبيل المثال، SageMaker)
- طرق لتقديم نماذج تعلم الآلة في الوقت الفعلي وعلى دفعات
- كيفية توفير موارد الحوسبة في بيئات الإنتاج وبيئات الاختبار (على سبيل المثال، وحدة المعالجة المركزية، وحدة معالجة الرسومات)
- متطلبات النموذج والنقطة الطرفية للنشر (على سبيل المثال، نقاط نهاية خالية من الخوادم، نقاط النهاية في الوقت الفعلي، نقاط النهاية غير المتزامنة، استنتاج الدفعة)
- كيفية اختيار الحاويات المناسبة (على سبيل المثال، المقدمة أو المخصصة)
- طرق لتحسين النماذج على أجهزة الحافة (على سبيل المثال، SageMaker Neo)
المهارات في:
- تقييم الأداء والتكلفة والنطاق الترددي
- اختيار البيئة الحاسوبية المناسبة للتدريب والاستنتاج بناءً على المتطلبات (على سبيل المثال، مواصفات وحدة المعالجة المركزية أو وحدة معالجة الرسومات، عائلة المعالجات، عرض النطاق الترددي للشبكة)
- اختيار منسق النشر المناسب (على سبيل المثال، Apache Airflow، SageMaker Pipelines)
- اختيار نشر متعدد النماذج أو متعدد الحاويات
- اختيار الهدف المناسب للنشر (على سبيل المثال، نقاط نهاية SageMaker، Kubernetes، Amazon Elastic Container Service [Amazon ECS]، Amazon Elastic Kubernetes Service [Amazon EKS]، Lambda)
- اختيار استراتيجيات نشر النماذج (على سبيل المثال، الوقت الفعلي، الدفعة)
بيان المهمة 3.2: إنشاء وبرمجة البنية التحتية بناءً على البنية المعمارية والمتطلبات الحالية.
المعرفة بـ:
- الفرق بين الموارد المتوفرة عند الطلب والمخصصة مسبقًا
- كيفية مقارنة سياسات التمديد