작년 4월 AWS Certified Data Engineer – Associate (DEA-C01) 자격증을 취득한 후 10개월 만에, 이번에는 AWS Certified Machine Learning Engineer – Associate (MLA-C01) 자격증에 도전했습니다. 3년 전 데이터 사이언스 분야 공부 경험을 바탕으로 AWS의 머신러닝 관련 개념들을 정리하며 시험 준비를 진행할 수 있었던 점이 큰 도움이 되었습니다.

특히, 덤프 자료 없이 순수하게 공부로 접근할 경우, 기존에 ADSP 수준의 학습 경험이 없는 분들에게는 Associate 레벨 시험 중 가장 어려울 수 있다고 생각됩니다. 또한, 2025년 2월 15일까지 취득 시 얼리어댑터 배지를 받을 수 있었던 점이 아쉬웠습니다.

시험은 총 65문제로 구성되어 있으며, 덤프에 나온 문제를 제외하면 실제 평가에 반영되는 문제는 상대적으로 적은 편입니다. (덤프 문제 제외한 신규 문제 11문제, 채점되지 않는 문제 15문제) 이 점을 고려하면, 체계적인 학습과 준비를 한다면 자격증 취득 자체에는 큰 어려움이 없다고 판단됩니다.

마랙 강의도 추천할 만하지만, 우선 AWS Skill Builder에서 제공하는 아래의 무료 강의들을 먼저 수강해 보시길 권장드립니다.

  1. Exploring Artificial Intelligence Use Cases and Applications (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20321/exploring-artificial-intelligence-use-cases-and-applications-korean
  2. Fundamentals of Machine Learning and Artificial Intelligence (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20271/fundamentals-of-machine-learning-and-artificial-intelligence-korean
  3. Developing Machine Learning Solutions (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20443/developing-machine-learning-solutions-korean
  4. Developing Generative Artificial Intelligence Solutions (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20345/developing-generative-artificial-intelligence-solutions-korean
  5. Optimizing Foundation Models (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20483/optimizing-foundation-models-korean
  6. Essentials of Prompt Engineering (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20516/essentials-of-prompt-engineering-korean
  7. Responsible Artificial Intelligence Practices (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20294/responsible-artificial-intelligence-practices-korean
  8. Security, Compliance, and Governance for AI Solutions (Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/20561/security-compliance-and-governance-for-ai-solutions-korean
  9. Exam Prep Official Practice Question Set: AWS Certified AI Practitioner (AIF-C01 - Korean)
    https://explore.skillbuilder.aws/learn/course/external/view/elearning/19792/exam-prep-official-practice-question-set-aws-certified-ai-practitioner-aif-c01-korean

MLA 시험은 주로 머신러닝과 관련된 AWS 서비스, 특히 SageMaker를 중심으로 출제됩니다. 다른 Associate 레벨 시험들이 AWS의 기능을 익히기 위한 학습 과정에 초점을 맞춘다면, 이 시험은 AI 업무 수행에 필요한 심도 있는 배경 지식이 요구됩니다. 시험 보기 전에 아래 기본 개념들 정도는 선행 하길 추천합니다.

 

1. 머신러닝 기본 개념

  • 지도 학습(Supervised Learning): 레이블이 있는 데이터를 사용하여 모델을 학습시킵니다. 예측(Prediction)과 분류(Classification)가 대표적입니다.
    • 예측(Regression): 연속적인 값을 예측 (예: 주가 예측, 부동산 가격 예측)
      • 선형 회귀(Linear Regression)
      • 다항 회귀(Polynomial Regression)
      • 릿지(Ridge), 라쏘(Lasso) 회귀
    • 분류(Classification): 카테고리 또는 클래스를 예측 (예: 스팸 메일 분류, 이미지 분류)
      • 로지스틱 회귀(Logistic Regression)
      • 서포트 벡터 머신(SVM)
      • 의사결정 트리(Decision Tree), 랜덤 포레스트(Random Forest)
      • k-최근접 이웃(k-Nearest Neighbors, k-NN)
  • 비지도 학습(Unsupervised Learning): 레이블이 없는 데이터를 사용하여 패턴이나 구조를 발견합니다.
    • 클러스터링(Clustering): 비슷한 특성을 가진 데이터를 그룹화 (예: k-평균(K-Means), 계층적 클러스터링)
    • 차원 축소(Dimensionality Reduction): 고차원 데이터를 저차원으로 변환 (예: PCA, t-SNE)
  • 강화 학습(Reinforcement Learning): 에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습합니다.

2. 모델 평가 및 성능 측정

  • 평가 지표:
    • 분류 모델:
      • 정확도(Accuracy)
      • 정밀도(Precision), 재현율(Recall), F1-Score
      • ROC 곡선과 AUC
    • 회귀 모델:
      • 평균 제곱 오차(MSE)
      • 평균 절대 오차(MAE)
      • R² (결정 계수)
  • 과적합(Overfitting)과 과소적합(Underfitting):
    • 과적합: 모델이 학습 데이터에 너무 맞춰져 일반화 성능이 떨어지는 현상
    • 과소적합: 모델이 데이터의 패턴을 충분히 학습하지 못한 현상
    • 해결 방법: 교차 검증(Cross-Validation), 정규화(Regularization), 드롭아웃(Dropout) 등

3. 특성 공학(Feature Engineering)

  • 데이터 전처리:
    • 결측치 처리(Missing Value Handling)
    • 범주형 데이터 인코딩 (One-Hot Encoding, Label Encoding)
    • 데이터 스케일링 (정규화, 표준화)
  • 특성 선택(Feature Selection):
    • 상관관계 분석
    • 주요 특성 추출 (PCA, LDA)

4. 머신러닝 알고리즘

  • 선형 모델:
    • 선형 회귀(Linear Regression)
    • 로지스틱 회귀(Logistic Regression)
  • 트리 기반 모델:
    • 의사결정 트리(Decision Tree)
    • 랜덤 포레스트(Random Forest)
    • 그래디언트 부스팅(Gradient Boosting, XGBoost, LightGBM, CatBoost)
  • 신경망(Neural Networks):
    • 기본 구조 (입력층, 은닉층, 출력층)
    • 활성화 함수 (ReLU, Sigmoid, Softmax)
    • 역전파(Backpropagation)와 경사 하강법(Gradient Descent)

5. 딥러닝(Deep Learning)

  • 기본 개념:
    • 신경망의 구조와 동작 원리
    • 손실 함수(Loss Function)와 최적화(Optimization)
  • 합성곱 신경망(CNN):
    • 이미지 처리에 특화된 신경망
    • 합성곱(Convolution), 풀링(Pooling) 레이어
  • 순환 신경망(RNN):
    • 시계열 데이터 처리에 특화된 신경망
    • LSTM, GRU

6. 모델 배포 및 모니터링

  • 모델 배포:
    • 배치 예측(Batch Prediction)과 실시간 예측(Real-time Prediction)
    • A/B 테스트
  • 모델 모니터링:
    • 데이터 드리프트(Data Drift) 감지
    • 모델 성능 저하 감지 및 재학습

7. AWS SageMaker 관련 개념

  • SageMaker의 주요 기능:
    • 데이터 전처리 및 특성 공학
    • 모델 학습 및 튜닝
    • 모델 배포 및 모니터링
  • SageMaker 알고리즘:
    • 내장 알고리즘 (예: XGBoost, k-Means, PCA)
    • 사용자 정의 알고리즘
  • 하이퍼파라미터 튜닝:
    • 그리드 서치(Grid Search), 랜덤 서치(Random Search)
    • 베이지안 최적화(Bayesian Optimization)

8. 기타 중요한 개념

  • AutoML: 자동화된 머신러닝 모델 개발
  • Explainable AI (XAI): 모델의 예측 결과를 설명 가능하게 만드는 기술
  • Responsible AI: AI의 윤리적 사용 (편향 방지, 공정성, 투명성)

 

덤프에 없었던 신규 문제 중에 SageMaker 알고리즘을 묻는 문제도 있었으니 참고 바랍니다.

 

저의 경험이 머신러닝 및 AI 분야에 도전하고자 하는 분들께 도움이 되길 바랍니다. 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기