반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 슬라이싱
- recommendation
- Machine Learning
- GAN
- EfficientNetV2
- PYTHON
- CNN
- neural architecture search
- 파이썬
- MnasNet
- training efficiency
- tf.data
- deep learning
- 3D Face
- Reconstruction
- model
- leetcode
- AI
- 3D 얼굴
- uncertainty
- ubuntu
- 팰린드롬
- adaptive regularization
- 추천시스템
- image classification
- progressive learning
- Adversarial Attack
- tf.image
- TensorFlow
Archives
- Today
- Total
굿
오토 스케일링 본문
반응형
Ⅰ. 탄력적인 클라우드 자원 활용 기술, 오토 스케일링의 정의 및 종류
가. 오토 스케일링 정의
- 클라우드 자원 CPU, 메모리, 디스크, 네트워크 트래픽의 Metric 값을 모니터링하여 필요에 따라 자원을 자동으로 조절하여 유연하게 활용하는 서비스
나. 오토 스케일링 종류
구분 | 설명 |
스케일 업 | 실제 CPU 또는 Memory을 좋은 성능이나 큰 용량으로 교체하는 방법 |
스케일 아웃 | 실제 자원의 규모를 늘려서 성능을 향상시키는 방법 |
스케일 인 | 스케일 아웃으로 늘린 자원을 다시 줄여서 필요한 만큼 사용하는 방법 |
Ⅱ. 오토 스케일링 동작 원리 및 단계별 동작
가. 오토 스케일링 동작 원리
- 실시간으로 자원 활용 모니터링하여 필요에 따라 자원을 추가하거나 제외하여 관리
나. 오토 스케일링 단계별 동작
단계 | 상세 설명 |
1 | 특정 주기로 로드밸런서의 서버 시스템 리소스 매트릭 정보들이 모니터링 서비스로 수집 |
2 | 모니터링 서비스에서 지정한 임계치를 벗어나는 것을 감지하면 오토스케일링 그룹으로 알람 |
3 | 서버 수를 늘리거나 줄이는 방식의 오토스케일링 정책을 확인 |
4 | 오토스케일링 정책에 따라 지정된 서버 수만큼 프로비저닝 작업 |
5 | 신규 서버의 서비스 상태 확인 및 추가 가능 여부 확인 |
6 | 상태 확인 완료 후 서버를 서비스 로드밸런서에 추가하여 추가 트래픽 처리 |
Ⅲ. 오토 스케일링 주요 정책
정책 | 설명 |
시간 예약 | 특정 시간대에 규칙적으로 트래픽이 몰릴 경우 시간 예약하여 대응 |
리소스 모니터링 | 미리 설정된 최근 시간동안의 평균 리소스 사용량에 따라 오토스케일링 적용 |
복합 예측 | 설정값 및 과거 트랜드 학습으로 리소스 사용량 변동에 빠르게 예측 및 대응 |
- 서비스 특성 및 환경에 맞는 정책 적용하여 효율적인 오토스케일링 활용 필요
반응형