작년 4월 AWS Certified Data Engineer – Associate (DEA-C01) 자격증을 취득한 후 10개월 만에, 이번에는 AWS Certified Machine Learning Engineer – Associate (MLA-C01) 자격증에 도전했습니다. 3년 전 데이터 사이언스 분야 공부 경험을 바탕으로 AWS의 머신러닝 관련 개념들을 정리하며 시험 준비를 진행할 수 있었던 점이 큰 도움이 되었습니다.
특히, 덤프 자료 없이 순수하게 공부로 접근할 경우, 기존에 ADSP 수준의 학습 경험이 없는 분들에게는 Associate 레벨 시험 중 가장 어려울 수 있다고 생각됩니다. 또한, 2025년 2월 15일까지 취득 시 얼리어댑터 배지를 받을 수 있었던 점이 아쉬웠습니다.
시험은 총 65문제로 구성되어 있으며, 덤프에 나온 문제를 제외하면 실제 평가에 반영되는 문제는 상대적으로 적은 편입니다. (덤프 문제 제외한 신규 문제 11문제, 채점되지 않는 문제 15문제) 이 점을 고려하면, 체계적인 학습과 준비를 한다면 자격증 취득 자체에는 큰 어려움이 없다고 판단됩니다.
마랙 강의도 추천할 만하지만, 우선 AWS Skill Builder에서 제공하는 아래의 무료 강의들을 먼저 수강해 보시길 권장드립니다.
- Exploring Artificial Intelligence Use Cases and Applications (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20321/exploring-artificial-intelligence-use-cases-and-applications-korean - Fundamentals of Machine Learning and Artificial Intelligence (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20271/fundamentals-of-machine-learning-and-artificial-intelligence-korean - Developing Machine Learning Solutions (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20443/developing-machine-learning-solutions-korean - Developing Generative Artificial Intelligence Solutions (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20345/developing-generative-artificial-intelligence-solutions-korean - Optimizing Foundation Models (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20483/optimizing-foundation-models-korean - Essentials of Prompt Engineering (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20516/essentials-of-prompt-engineering-korean - Responsible Artificial Intelligence Practices (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20294/responsible-artificial-intelligence-practices-korean - Security, Compliance, and Governance for AI Solutions (Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/20561/security-compliance-and-governance-for-ai-solutions-korean - Exam Prep Official Practice Question Set: AWS Certified AI Practitioner (AIF-C01 - Korean)
https://explore.skillbuilder.aws/learn/course/external/view/elearning/19792/exam-prep-official-practice-question-set-aws-certified-ai-practitioner-aif-c01-korean
MLA 시험은 주로 머신러닝과 관련된 AWS 서비스, 특히 SageMaker를 중심으로 출제됩니다. 다른 Associate 레벨 시험들이 AWS의 기능을 익히기 위한 학습 과정에 초점을 맞춘다면, 이 시험은 AI 업무 수행에 필요한 심도 있는 배경 지식이 요구됩니다. 시험 보기 전에 아래 기본 개념들 정도는 선행 하길 추천합니다.
1. 머신러닝 기본 개념
- 지도 학습(Supervised Learning): 레이블이 있는 데이터를 사용하여 모델을 학습시킵니다. 예측(Prediction)과 분류(Classification)가 대표적입니다.
- 예측(Regression): 연속적인 값을 예측 (예: 주가 예측, 부동산 가격 예측)
- 선형 회귀(Linear Regression)
- 다항 회귀(Polynomial Regression)
- 릿지(Ridge), 라쏘(Lasso) 회귀
- 분류(Classification): 카테고리 또는 클래스를 예측 (예: 스팸 메일 분류, 이미지 분류)
- 로지스틱 회귀(Logistic Regression)
- 서포트 벡터 머신(SVM)
- 의사결정 트리(Decision Tree), 랜덤 포레스트(Random Forest)
- k-최근접 이웃(k-Nearest Neighbors, k-NN)
- 예측(Regression): 연속적인 값을 예측 (예: 주가 예측, 부동산 가격 예측)
- 비지도 학습(Unsupervised Learning): 레이블이 없는 데이터를 사용하여 패턴이나 구조를 발견합니다.
- 클러스터링(Clustering): 비슷한 특성을 가진 데이터를 그룹화 (예: k-평균(K-Means), 계층적 클러스터링)
- 차원 축소(Dimensionality Reduction): 고차원 데이터를 저차원으로 변환 (예: PCA, t-SNE)
- 강화 학습(Reinforcement Learning): 에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습합니다.
2. 모델 평가 및 성능 측정
- 평가 지표:
- 분류 모델:
- 정확도(Accuracy)
- 정밀도(Precision), 재현율(Recall), F1-Score
- ROC 곡선과 AUC
- 회귀 모델:
- 평균 제곱 오차(MSE)
- 평균 절대 오차(MAE)
- R² (결정 계수)
- 분류 모델:
- 과적합(Overfitting)과 과소적합(Underfitting):
- 과적합: 모델이 학습 데이터에 너무 맞춰져 일반화 성능이 떨어지는 현상
- 과소적합: 모델이 데이터의 패턴을 충분히 학습하지 못한 현상
- 해결 방법: 교차 검증(Cross-Validation), 정규화(Regularization), 드롭아웃(Dropout) 등
3. 특성 공학(Feature Engineering)
- 데이터 전처리:
- 결측치 처리(Missing Value Handling)
- 범주형 데이터 인코딩 (One-Hot Encoding, Label Encoding)
- 데이터 스케일링 (정규화, 표준화)
- 특성 선택(Feature Selection):
- 상관관계 분석
- 주요 특성 추출 (PCA, LDA)
4. 머신러닝 알고리즘
- 선형 모델:
- 선형 회귀(Linear Regression)
- 로지스틱 회귀(Logistic Regression)
- 트리 기반 모델:
- 의사결정 트리(Decision Tree)
- 랜덤 포레스트(Random Forest)
- 그래디언트 부스팅(Gradient Boosting, XGBoost, LightGBM, CatBoost)
- 신경망(Neural Networks):
- 기본 구조 (입력층, 은닉층, 출력층)
- 활성화 함수 (ReLU, Sigmoid, Softmax)
- 역전파(Backpropagation)와 경사 하강법(Gradient Descent)
5. 딥러닝(Deep Learning)
- 기본 개념:
- 신경망의 구조와 동작 원리
- 손실 함수(Loss Function)와 최적화(Optimization)
- 합성곱 신경망(CNN):
- 이미지 처리에 특화된 신경망
- 합성곱(Convolution), 풀링(Pooling) 레이어
- 순환 신경망(RNN):
- 시계열 데이터 처리에 특화된 신경망
- LSTM, GRU
6. 모델 배포 및 모니터링
- 모델 배포:
- 배치 예측(Batch Prediction)과 실시간 예측(Real-time Prediction)
- A/B 테스트
- 모델 모니터링:
- 데이터 드리프트(Data Drift) 감지
- 모델 성능 저하 감지 및 재학습
7. AWS SageMaker 관련 개념
- SageMaker의 주요 기능:
- 데이터 전처리 및 특성 공학
- 모델 학습 및 튜닝
- 모델 배포 및 모니터링
- SageMaker 알고리즘:
- 내장 알고리즘 (예: XGBoost, k-Means, PCA)
- 사용자 정의 알고리즘
- 하이퍼파라미터 튜닝:
- 그리드 서치(Grid Search), 랜덤 서치(Random Search)
- 베이지안 최적화(Bayesian Optimization)
8. 기타 중요한 개념
- AutoML: 자동화된 머신러닝 모델 개발
- Explainable AI (XAI): 모델의 예측 결과를 설명 가능하게 만드는 기술
- Responsible AI: AI의 윤리적 사용 (편향 방지, 공정성, 투명성)
덤프에 없었던 신규 문제 중에 SageMaker 알고리즘을 묻는 문제도 있었으니 참고 바랍니다.
저의 경험이 머신러닝 및 AI 분야에 도전하고자 하는 분들께 도움이 되길 바랍니다.
'Cloud > AWS' 카테고리의 다른 글
[Book Review] IT엔지니어를 위한 AWS 운영의 기본과 노하우 (0) | 2024.12.05 |
---|---|
[이벤트] AWS 교과서 도서 이벤트 (0) | 2024.04.25 |
AWS Certified Data Engineer - Associate 합격 후기 (0) | 2024.04.23 |
AWS Certified Security - Specialty 합격후기 (0) | 2024.03.25 |
[Book Review] AWS 교과서 (116) | 2023.11.06 |