IT/자격증

AWS SAA-C02 (1) 개념 정리 ; FAQ 내용 정리(EC2, S3, EBS)

개발자 두더지 2021. 5. 2. 00:14
728x90

Amazon EC2


Amazon CloudWatch

- 1분 간격으로 데이터를 수신하고 집계

- 모니터링을 시작한 시점부터 최대 2주 동안 모든 Amazon EC2 인스턴스의 메트릭 데이터를 가져올 수 있다. Amazon EC2 인스턴스 모니터링이 비활성화되고 2주가 경과하면 Amazon EC2 인스턴스의 메트릭 데이터를 사용할 수 없게 된다. 2주가 경과한 후에도 메트릭 데이터를 보관하려면 명령줄에 mon-get-stats 명령을 호출한 후 결과를 Amazon S3 또는 Amazon SimpleDB에 저장

Amazon EC2 Auto Scaling

- 용량 최적화 전략

용량 지표를 분석하여 가장 가용성이 높은 스팟 인스턴스 풀에서 스팟 인스턴스의 프로비저닝을 시도한다. 이러한 전략은 빅 데이터 및 분석, 이미지 및 미디어 렌더링, 기계 학습, 고성능 컴퓨팅과 같은 중단 비용이 비교적 높은 워크로드에 적합하다.

- 최저가 할당 전략

가장 낮은 가격의 풀 전반의 다양성을 기반으로 해서 스팟 인스턴스를 실행

하이버네이트

- 인스턴스를 하이버네이트하면 부트스크랩하는 데 시간이 걸리는 인스턴스와 어플리케이션을 빠르게 작동 및 실행할 수 있다.

- 인스턴스를 하이버네이터하면 EBS 루트 볼륨 및 연결된 모든 EBS 데이터 볼윰의 데이터가 유지된다. 또한 인스턴스 메모리(RAM)의 콘턴체는 EBS 루트 볼륨에 유지된다.

- 기존 인스턴스(실행 중/ 중지됨)에 대해서는 하이버네이션을 확설화할 수 없고, 인스턴스 시작시에 활성화해야한다.

- 하버네이트 상태 유지기간은 최대 60일

- 내 EBS 루트 볼륨의 크기가 하이버네이트를 위한 메모리 상태(RAM)를 저장하기에 충분하지 않으면 하아버네이션이 실패하고 인스턴스는 종료된다.

VM Import/Export

- VM을 Amazon EC2로 가져올 때 VMDK(; 단일 파일 내에 캡슐화된 가상 머신 하드 디스크를 지정하는 파일 형식) 또는 VHD(가상 하드 디스크; 단일 파일 내에 캡슐화된 가상 머신 하드 디스크를 지정하는 파일 형식)이미지를 만들어야하므로 가상 머신이 중지된 상태여야 한다. 

- 가상 머신을 Amazon EC2 인스턴스로 가져오려면 Amazon EC2 API 도구를 이용해야한다.

- Amazon EC2 인스턴스를 내 온프레미스 가상화 환경으로 다시 내보내려면 Amazon EC2 CLI 도구를 사용한다.

- 가져온 가상 머신을 Amazon VPC에서 실행할 수 있다.

Savings Plans

AWS 두 가지 유형의 Savings Plans를 제공한다.

① Compute Savings Plans

최대 66%까지 비용을 절감할 수 있는 가장 유연한 요금 모델이다. 이 플랜은 인스턴스 패밀리, 크기, AZ, 리전, OS 똔느 테넌시에 관계없이 EC2 인스턴스 사용량에 적용되며, AWS Fargate 및 Lambda 사용량에도 적용된다.

② EC2 Instance Savings Plans

리전의 개별 인스턴스 패밀리에 대한 사용량 약정(예: 버지니아 북부의 M5 사용량)을 조건으로 최대 72%의 할인 혜택을 제공하는 가장 저렴한 요금 모델이다. 따라서 AZ, 규모, OS 또는 테넌시에 관계없이 해당 리전에서 선택한 인스턴스 패밀리의 비용이 자동으로 절감된다.

컨버터블 예약 인스턴스

- 컨버터블 예약 인스턴스란 약정 기간 동안(1년이나 3년 단위) 속성을 변경할 수 있는 예약 인스턴스 유형이다.

- 컨버터블은 3년 동안 EC2인스턴스를 사용하기로 약정하고 사용 요금을 할인 받음과 동시에 향후 인스턴스 수요가 불확실하거나 가격 변동의 혜택을 받으려는 고객에게 유용하다.

EC2 플릿

- Amazon EC2 플릿이란 단일 API 호출로 다양한 인스턴스 유형 및 가용 영역에 걸쳐 그리고 온디맨드, 예약 인스턴스(RI) 및 스팟 인스턴스 구매 모델에 걸쳐 컴퓨팅 파워를 프로비저닝하여 규모, 성능 및 비용 최적화를 실현

- EC2 플릿에 대한 별도의 추가 비용은 없으며, EC2 플릿이 시작하는 해당 리소스에 대한 비용만 지불

- 사용 예를 살펴보자면, 빅 데이터 워크로드, 컨테이너식 어플리케이션, 그리드 처리 워크로드 등이 있다.

온디맨드 용량 예약

- 온디맨드 용량 예약은 Amazon EC2에서 예약 용량을 생성하고 관리할 수 있는 EC2 오퍼링이다. 가용 영역 및 수량(인스턴스 수)과 더불어 인스턴스 유형 및 테넌시와 같은 다른 인스턴스 사양을 선택하여 간단하게 용량 예약을 생성할 수 있다.

- AWS Resource Access Manager 서비스를 통해 다른 AWS 계정과 또는 해당 AWS Organization 내에서 용량 예약을 공유할 수 있으며 공유에 대한 추가 요금은 발생하지 않는다.

예약 인스턴스

- 예약 인스턴스(RI)는 1년 또는 3년 가긴으로 약정하는 경우 EC2 사용 요금을 대폭 할인해주는 EC2 상품

- 표준 RI 또는 컨버터블 RI가 특정 AZ에 한정되어 있는 경우, 해당 RI 구성에 정확하게 일치하는 인스턴스 용량이 예약된다(이를 "영역 RI"라고 한다). 영역 RI를 사용하면 필요할 때 인스턴스를 시작할 수 있다는 확신을 가질 수 있다. 

예약 인스턴스 마켓플레이스

- 예약 인스턴스 마켓 플레이스는 AWS 고객이 자신의 EC2 예약 인스턴스를 다른 비즈니스 및 조직에 판매할 수 있는 유연성을 제공하는 온라인 마켓플레이스이다. 

스팟 인스턴스

- 스팟 인스턴스는 온디맨드 가격 대비 최대 90%를 절약할 수 있는 여분의 EC2 용량으로서, AWS에서 2분 전에 공지하고 종료할 수 있다.

- 스팟 인스턴스와 온디맨드 인스턴스 또는 예약 인스턴스의 주요 차이점은 스팟 인스턴스가 온디맨드 가격 대비 상당한 할인을 제공받고, 용량 요구 사항에 따라 Amazon EC2에서 2분 전에 공지하고 인스터스를 종료할 수 있으며, 스팟 가격은 EC2 여분 용량의 장기 공급과 수요에 따라 점진적으로 조정된다는 점이다.

- 스팟 플릿이란 배치 처리 작업, 하둡 워크플로 또는 HPC 그리드 컴퓨팅 작업등과 같이 클러스터 또는 애플리케이션 용량에 대해 단위당 가장 낮은 교금을 제공하는 여러 스팟 인스턴스를 자동으로 요청하고 관리하는 서비스이다. 

Amazon Time Sync Service

- VPC 구성 및 업데이트 없이도 인스턴스에서 안전하게 액세스 할 수 있는 시간 참조를 제공하는 서비스. 

클러스터 인스턴스

- 클러스터 컴퓨팅 인스턴스와 클러스터 GPU 인스턴스 사용은 다른 Amazon EC2 인스턴스 유형과 두 가지 측면에서 다르다.

클러스터 컴퓨팅 인스턴스와 클러스터 GPU 인스턴스는 하드웨어 가상 머신(HVM) 기반 가상화를 사용하며 AMI 기반 HVM 가상화만을 실행한다. 다른 Amazon EC2 인스턴스 유형에 사용되는 Paravirtual Machine(PVM) 기반 AMI는 클러스터 컴퓨팅 또는 클러스터 GPU 인스턴스에 사용할 수 없다.

② 제공되는 짧은 지연 시간 및 인스턴스 간 양방향 대역폭을 최대한 활용하려면 EC2 API 또는 AWS Management Console을 통해 클러스터 컴퓨팅 인스턴스와 클러스터 GPU 인스턴스를 클러스터 배치 그룹으로 시작해야한다.

마이크로 인스턴스

- 소량의 CPU 리소스를 일정하게 제공하며 추가 주기를 사용할 수 있는 경우 CPU 용량을 최대 ECU 2개까지 확장할 수 있다. 따라서 정기적으로 상당한 컴퓨팅 주기를 소비하지만 그 외의 다른 경우에는 백그라운드 프로세스, 데몬 등을 실행하는 데에만 약간의 CPU를 사용하는, 처리 속도가 느린 애플리케이션과 웹 사이트에 적합하다.

Nitro 하이퍼바이저

- Nitro 하이퍼바이저는 모든 현재 세대 EC2 인스턴스 패밀리에 속하는 전용 하드웨어 구성 요소인 Nitro Cards 에서 VPC 네트워킹 및 EBS 스토리지 리소스를 구현한다. 또한 핵심 Linux KVM(커널 기반 가상머신) 기술을 기반으로 구축되었지만 범용 운영 체제 구성 요소는 포함하지 않는다.

- Nitro 하이퍼바이저는 호스트 시스템 소프트웨어 구성 요소를 제거하여 EC2 가상화 인스턴스에 일관된 성능과 향상된 컴퓨팅 및 메모리 리소스를 제공한다. 

 

 

Amazon EBS


볼륨 선택

- EBS에는 두 개의 큰 카테고리가 있다.

① 트랜잭션 워크로드를 위한 SSD 지원 스토리지 (주로 IOPS, 지연 시간 및 내구성이 성능을 좌우)

SSD 지원 볼륨은 트랜젹션, IOPS 집약적 데이터베이스 워크로드, 부트 볼륨 및 높은 IOPS가 필요한 워크로드를 위해 설계되어 있다. SSD 지원 볼륨은 프로비저닝된 IOPS SSD (io1 및 io2)와 범용 SSD (gp3 and gp2)를 포함한다. io2는 99.999%의 100배 내구성을 제공하도록 설계한 100XC 프로비저닝된 IOPS SSD 볼륨의 최신 세대로 보다 높은 업타임을 필요로 하는 비즈니스 크리티컬 애플리케이션에 이상적이다. gp3은 가장 높은 IOPS 성능 또는 99.999% 내구성을 요구하지 않는 대부분의 애플리케이션에 적합한 가격 및 성능 균형을 제공하는 범용 SSD의 최신 세대이다. 

② 처리량 워크로드를 위한 HDD 지원 스토리지 (주로 MB/초로 측정한 처리량이 성능을 좌우)

처리량 집약적 워크로드, 빅 데이터 워크로드, 큰 I/O 크기 및 순차적 I/O 패턴을 위해 설계되었다. HDD 지원 볼륨은 처리량 최족화 HDD(st1)와 콜드 HDD(sc1)를 포함한다.

- 탄력적 볼륨 기능을 사용하면 단일 CLI 호출, API 호출 또는 콘솔에서 클릭 몇 번으로 용량을 늘리고, 성능을 튜닝하거나 볼륨 유형을 변경할 수 있다.

- EBS Block Express

EBS Block Express는 밀리초 미만의 지연 시간으로 최고 수준의 성능ㄹ 제공하도록 특별히 구축된 클라우드 스케일의 블록 저장소용 차세대 Amazon EBS 스토리지 서버 아키텍처이다. EBS Block Express는 고성능 저대기시간 네트워크 프로토콜인 Scalable Reliable Datagrams(SRD)를 사용하여 이를 수행하고,Nitro System-based EC2인스턴스와 소통한다. 이는 고성능 컴퓨팅(HPC) 및 기계 학습(ML) 워크로드를 위한 Elastic Fabric Adapter(EFA)의 인스턴스 간 통신에 사용되는 것과 동일한 고성능 및 짧은 지연 시간 네트워크 인터페이스이다.

스냅샷

- 스냅샷은 Amazon EC2 API를 통해서만 사용할 수 있다.

- 특정 스냅샷을 찾기 위해 AWS Management Console을 사용할 수 있다.

암호화

- 인스터스를 시작할 때 AWS 관리형 또는 고객 관리형의 CMK(고객 마스터 키)를 사용하여 암호화된 데이터 볼륨을 생성할 수 있다.

다중 연결

- 다중 연결은 EBS 프로비저닝된 IOPS io1 볼륨에서 활성화할 수 있으며, 프로비저닝된 스토리지(GB-Mo) 및 IOPS(IOPS-Mo)에 대한 비용이 부과된다.

 

 

S3


일반 S3

- 단일 PUT 요청으로 업로드 가능한 객체의 최대 크기는 5GB이다. 객체의 크기가 100MB를 넘는 경우, 멀티파트 업로드 기능의 사용을 고려하는 것이 좋다.

결제

- S3 데이터 검색 요금은 S3 Standard-Infrequent Access(S3 Standard-IA)와 S3 One Zone-IA 스토리지 클래스에 적용된다.

이벤트 알림

- Amazon S3 이벤트 알림은 PUT, POST, COPY 또는 DELETE와 같은 Amazon S3의 작업에 대한 응답으로 전송될 수 있다. 알림 메시지는 SNS, SQS 를 통해 전송되거나 Lambda로 직접 전송될 수 있다.

Amazon S3 Transfer Acceleration

- Amazon S3 Transfer Acceleration는 거리가 먼 클라이언트와 S3 버킷 간에 파일을 빠르고, 쉽고, 안전하게 전송할 수 있게 해준다. Amazon S3 Transfer Acceleration는 전세계적으로 분산된 CloudFront의 AWS엣지 로케이션을 활용한다.데이터가 AWS 엣지 로케이션에 도착하면, 이 데이터는 최적화된 네트워크 경로를 통해 S3 버킷으로 라우팅된다.

보안

- HTTPS 프로토콜을 사용하는 SSL 엔드포인트를 통해 Amazon S3에 데이터를 안전하게 업로드/다운로드할 수 있다. 추가 보안이 필요한 경우 서버 측 암호화(SSE) 옵션을 사용하여 저장 데이터를 암호화할 수 있다. 수신되는 스토리지 요청에 암호화 정보가 없는 경우 객체를 저장하기 전에 자동으로 암호화하도록 Amazon S3 버킷을 구성할 수 있다. 또는 Amazon S3에 저장하기 전에 자체 암호화 라이브러리를 사용하여 데이터를 암호화할 수도 있다.

- Amazon S3에 저장된 데이터를 암호화하는 옵션

SSE-S3

SSE-S3는 Amazon이 다중 보안 계층을 사용하여 키 관리 및 키 보호를 처리하는 통합 솔루션을 제공한다. Amazon에서 키를 관리하도록 하려면 SSE-S3를 선택해야 한다.

SSE-C

SSE-C를 사용하면 Amazon S3를 활용하여 객체의 암호화 및 암호 해독을 수행하는 동시에 객체를 암호화하는 데 사용된 키에 대한 제어 권한을 유지할 수 있다. SSE-C를 사용하면 Amazon S3에 저장한 객체에 대한 암호화 및 암호 해독을 수행하기 위해 클라이언트 측 라이브러리를 구현하거나 사용하지 않아도 되지만, 객체를 암호화하거나 해독하기 위해 Amazon S3로 전송한 키는 관리해야 한다. 자체 암호화 키를 유지 관리하고 싶지만 클라이언트 측 암호화 라이브러리를 구현하거나 활용하고 싶지 않은 경우에는 SSE-C를 사용하자.

SSE-KMS

SSE-KMS를 사용하면 AWS Key Management Service(AWS KMS)를 이용해 암호화 키를 관리할 수 있다. AWS KMS를 사용해 키를 관리하면 다양한 이점을 얻을 수 있다. AWS KMS를 사용하면 마스터 키를 사용할 수 있는 별도의 권한이 있으므로 Amazon S3에 저장된 객체에 대한 무단 액세스를 차단하고 추가 제어 계층을 제공할 수 있다. AWS KMS는 감사 추적을 제공하므로 데이터 암호 해독 권한이 없는 사용자의 실패한 데이터 액세스 시도를 볼 수 있을 뿐 아니라 누가 키를 사용해 어떤 객체에 언제 액세스했는지도 확인할 수 있다. 또한, AWS KMS는 PCI-DSS, HIPAA/HITECH 및 FedRAMP 산업 요구 사항을 준수하기 위한 고객의 노력을 지원하기 위해 추가 보안 규제 항목을 제공한다.

④ Amazon S3 Encryption Client

암호화 클라이언트 라이브러리를 사용하면 키에 대한 제어 권한을 유지할 수 있으며 원하는 암호화 라이브러리를 사용하여 클라이언트 측 객체 암호화 및 암호 해독을 완료할 수 있다. 일부 고객은 객체의 암호화 및 암호 해독에 대한 전체적인 엔드 투 엔드 제어 권한을 선호한다. 이러한 방법을 사용하면 암호화된 객체만이 인터넷을 통해 Amazon S3로 전송된다. 암호화 키에 대한 제어 권한을 유지하고자 하며 클라이언트 측 암호화 라이브러리를 구현 또는 사용할 수 있으며 스토리지를 위해 Amazon S3로 객체를 전송하기 전에 암호화해야 하는 경우에는 클라이언트 측 라이브러리를 사용하는 것을 권장한다.

- Amazon S3용 AWS PrivateLink

Amazon S3용 AWS PrivateLink는 Amazon S3와 온프레미스 간의 프라이빗 연결을 제공한다. VPC에서 S3용 d인터페이스 VPC 엔드 포인트를 프로비저닝하여 AWS Direct Connect나 AWS VPN을 통해 S3에 온프레미스 어플리케이션을 직접 연결할 수 있다.

- Amazon Macie

Amazon Macie는 Amazon S3에 저장된 민감한 데이터를 자동으로 검색, 분류 및 보호하여 데이터 손실을 막아주는 AI 기반 보안 서비스이다. 

- Access Analyzer for S3

Access Analyzer for S3는 액세스 정책을 모니터링하는 기능으로 정책이 S3 리소스에 의도된 액세스만 제공하도록 보장한다. Access Analyzer for S3는 버킷 액세스 정책을 평가하여 무단 액세스 가능성이 있는 버킷을 검색하고 신속하게 교정할 수 있게 한다.

S3 액세스 포인트

- S3의 공유 데이터 세트를 사용하여 어플리케이션에 대한 대규모 데이터 액세스 관리를 간소화한다. S3 액세스 포인트를 사용하여 버킷당 수백 개의 액세스 포인트를 쉽게 생성할 수 있다. 즉, 공유 데이터 세트에 대한 액세스를 프로비저닝하는 새로운 방식을 나타낸다.

- 기본적으로 계정마다 리전당 1,000개의 액세스 포인트를 생성가능하다.

S3 Intelligent-Tiering

- S3 Intelligent-Tiering은 운영 오버헤드 없이 가장 비용 효과적인 액세스 계층으로 데이터를 자동으로 이동하여 스토리지 비용을 최적화하기 위해 설계된 S3 스토리지 클래스이다.

- 4개의 액세스 계층, 즉 빈번한 액세스와 간헐적인 액세스에 최적화된 2개의 대기 시간이 짧은 액세스 계층과 비동기 액세스용으로 설계되어 드문 액세스에 최적화된 2개의 선택적 Archive Access 계층에 객체를 저장하는 방식으로 작동한다.

S3 Standard-IA

- 액세스 빈도는 낮지만 필요할 때 빠르게 액세스해야 하는 데이터를 위한 S3 스토리지 클래스이다. 장기 스토리지, 백업 및 재해 복구용 데이터 스토어에 적합하다.  

S3 One Zone-IA

- 고객이 단일 가용 영역에 객체를 저장하도록 선택할 수 있는 S3 스토리지 클래스. 여러 AZ에 데이터를 중복 저장하는 지리적으로 중복된 S3 스탠다드-IA 스토리지보다 20% 저렴하게 스토리지를 제공한다.

- 백업 복사본, 재해 복구 복사본 또는, 손쉽게 재생성 가능한  기타 데이터 등 자주 액세스하지 않는 스토리지에 적합하다.

S3 on Outposts

- Amazon S3 on Outposts는 S3 API와 현재 AWS에서 사용하는 기능을 통해 온프레미스 환경에 객체 스토리지를 제공한다. AWS Outposts는 AWS 인프라, AWS 서비스, API 및 도구를 사실상 모든 데이터 센터, 코로케이션 공간, 온프레미스 시설로 확장하는 완전 관리형 서비스이다. S3 on Outposts를 사용하면 AWS 리전으로 옮기기 전에 온프레미스에서 생성된 고객 데이터를 안전하게 처리, 저장하거나, 로컬 위치에서 온프레미스에서 실행되는 어플리케이션의 데이터에 액세스하거나, 데이터 레지던시 요구 사항이 적용되는 위치나 규제받는 산업이 있는 지역의 기업이 Outpost에 데이터를 저장할 수 있다. 

Amazon S3 Glacier

- 데이터 보관을 위한 안전하고 내구성을 지원하는 저렴한 스토리지 클래스이다.

Amazon S3 Glacier Deep Archive

- S3에서 가장 저렴한 비용의 스토리지 클래스이며 1년에 한두 번 정도 액세스할 수 있는 데이터의 장기 보관 및 디지털 보존을 지원한다.

- S3 Glacier Deep Archive에 데이터를 저장하는 가장 쉬운 방법은 데이터를 직접 업로드하기 위하여 S3 API를 사용하는 것이다. 

- S3 Glacier Deep Archive에 저장된 데이터를 검색하려면 Amazon S3 API 또는 Amazon S3 Management Console을 사용하여 "복원"요청을 시작한다. 복원은 S3 One Zone-IA 스토리지 클래스에 데이터의 임시 사본을 생성하고 S3 Glacier Deep Archive에 아카이브된 데이터를 그대로 유지한다. S3에 임시 복사본을 저장할 기간(일수)을 지정할 수 있다. 그런 다음 아카이브된 객체에 대한 Amazon S3 GET 요청을 통해 S3의 임시 복사본에 액세스할 수 있다.

S3 객체 태그

- S3 객체 태그는 S3 객체에 적용되는 키 값 페어로, 객체의 수명 주기 동안 언제든 이를 생성, 업데이트 또는 삭제할 수 있다. S3 객체 태그를 사용하면 IAM 정책을 생성하고, S3 수명 주기 정책을 설정하며, 스토리지 지표를 사용자 지정할 수 있다. 이러한 객체 수준의 태그는 스토리지 클래스 간 전환을 관리하고 백그라운드에 있는 개체를 만료시킬 수 있다. 객체당 최대 10개의 태그를 추가할 수 있고 AWS 관리 콘솔, REST API, AWS CLI 또는 AWS SKD 를 사용하요 객체 태그를 추가할 수 있다.

S3 인벤토리

- S3 인벤토리 보고서는 Amazon S3의 동기식 List API에 대한 예약된 대안을 제공한다. 일 또는 주 단위로 S3 버킷이나 접두사에 대한 객체 및 해당 메타데이터를 CSV, ORC 또는 Parquet 파일 추력으로 제공하도록 S3 인벤토리를 구성할 수 있다. S3 인벤토리를 통해 비즈니스 워크 플로우와 빅 데이터 작업을 간소화 및 가속화할 수 있다.

S3 배치 작업

- 많은 객체에서 단일 작업의 실행(객체 복사 또는 Lambda 함수 실행 등)을 자동화하려는 경우 사용할 수 있는 기능이다. S3 배치 작업을 사용하면 사용자 지정 애플리케이션 코드를 작성하거나 스토리지 관리 애플리케이션을 위해 컴퓨팅 클러스터를 실행할 필요 없이 S3 콘솔 또는 단일 API 요청에서 몇 번의 클릭으로 수십억 개의 객체를 변경할 수 있다. S3 배치 작업 관리자는 많은 객체에서 스토리지 작업을 관리할 뿐 아니라, S3 배치 작업에서는 재시도 관리, 진행 상황 표시, 알림 전달, 완료 보고서 제공, 대상 객체에서 수행되는 모든 작업에 대해 AWS CloudTrail에 이벤트 전송 등도 수행한다.

S3 객체 잠금

- S3 객체 잠금은 데이터 보호를 위한 가 계층으로 또는 규제 규정 준수를 위해 보존 정책을 적용할 수 있도록 일정 기간 또는 무기한으로 객체 버전 삭제 또는 덮어쓰기는 차단하는 기능이다. 워크로드를 기존 Write-Once-Read-Many(WORM) 시스템에서 Amazon S3로 마이그레이션하고 객체 및 버킷 수준에서 S3 객체 잠금을 구성하여 사전 정의된 보존 만료 날짜 또는 무기한(법적 보존 날짜)전에 객체 버전이 삭제되지 않도록 할 수 있다.

S3 CloudWatch 지표

- AWS Management Console을 사용하여 S3 버킷에 대한 1분 간격 CloudWatch 요청 지표의 생성을 활성화하거나 접두사 또는 객체 태그를 사용하여 지표에 대한 필터를 구성할 수 있다. 또는 S3 PUT Bucket Metrics API를 호출하여 S3 스토리지 지표 게시를 활성화하고 구성할 수 있다.  

S3 스토리지 렌즈

- S3 스토리지 렌즈는 객체 스토리지 사용 및 활동 추세에 대한 조직 전체의 가시성을 제공하고 실행 가능한 권장 사항을 제공하여 비용 효율성을 개선하고 데이터 보호 모범 사례를 적용한다. 스토리지 렌즈는 조직 내 수십 또는 수백개 계정의 객체 스토리지 사용 및 활동에 대한 단일 보기가 포함된 대화형 대시보드를 제공하며, 드릴다운하여 계정, 버킷 또는 접두사 수준에서 인사이트를 생성하는 기능도 있다.

- S3 스토리지 렌즈에는 사용량 지표(계정에 있는 객체의 일일 스냅샷 결과) 및 활동 지표(검색된 요청 및 바이트 추척)에 딸 그룹화된 30개 이상으 지표가 포함되어 있다. 이 지표는 요약, 비용 효율성, 데이터 보호라는 세 가지 주요 범주로 구성된다.

- S3인벤토리는 스토리지의 객체 수준 분석을 수용하는 데 사용할 수 있는 S3 버킷 또는 공유 접두사에 대한 객체 및 해당 메타데이터 목록을 제공한다. 한편 S3 스토리지 렌즈는 조직, 계정, 리전, 스토리지 클래스, 버킷 및 접두사 수준에 따라 집계 된 지표를 제공하여, 스토리지에 대한 조직 전체의 가시성을 높인다.

- S3 스토리지 클래스 분석은 이전 30~90일간의 개별 버킷/접두사/태그 내에서 객체 수준 액세스 패턴을 기반을 ㅗ객체 연령 그룹을 생성하여 최적의 스토리지 클래스에 대한 권장 사항을 제공한다. S3 스토리지 렌즈는 비효율성을 개선하고 데이터 보호 모범 사례를 적용하는 방법에 대한 조직 수준의 권장 사항, 그리고 계정, 리전, 스토리지 클래스, 버킷 또는 접두사에 따른 추가 세부 권장 사항을 매일 제공한다.

스토리지 클래스 분석(SCA) 

- 스토리지 클래스 분석을 사용하면 스토리지 액세스 패턴을 분석하여 스토리지에 대한 최적의 스토리지 클래스로 결정할 수 있다. 이 S3 기능은 빈도가 낮은 액세스 패턴이 있으면 이를 자동으로 파악하여 스토리지를 S3 Standard-IA로 전환하도록 지원한다. 전체 버킷, 접두사 또는 객체 태그를 모니터링하도록 스토리지 클래스 분석 정책을 구성할 수 있다. 빈도가 낮은 액세스 패턴이 관찰되면 해당 결과를 바탕으로 손쉽게 새로운 S3 수명 주기 기간 정책을 생성할 수 있다. 스토리지 클래스 분석은 AWS 관리 콘솔에서 스토리지 사용에 대한 일별 시각화를 제공하며, S3 버킷으로 보고서를 내보내 원하는 비즈니스 인텔리전스 도구(예:Amazon QuickSight)를 사용하여 분석할 수 있다.

S3 Select

- 전체 객체를 검색하지 않아도 간단한 SQL 표현식을 사용하여 객체 콘텐츠에서 특정 데이터를 쉽게 검색할 수 있는 Amazon S3 기능이다. 

S3 Select 기능을 사용하면 CSV, JSON 또는 Apache Parquet 형식으로 저장된 객체의 데이터 하위 세트를 SELECT 및 WHERE와 같은 SQL 절로 검색할 수 있다. 

Amazon Athena

- Amazon Athena는 표준 SQL을 사용해 S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스이다. Athena는 서버리스 서비스이므로 설정하거나 관리할 인프라가 없으면 데이터 분석을 즉시 시작할 수 있다. 

Amazon Redshift Spectrum

- Amazon Redshift Spectrum은 로딩이나 ETL없이도 S3에 있는 엑사바이트 규모의 비정형 데이터에 대해 쿼리를 실행할 수 있는 Amazon Redshift의기능이다.쿼리를 발행하면, Amazon Redshift SQL엔드포인트로 전달되고 여기에서 쿼리 플랜을 생성하고 최적화한다. Amazon Redshift는 로컬에 있는 데이터와 S3에 있는 데이터가 무엇인지 파악하고, 읽어와야 하는 S3 데이터 양을 최소화하기 위한 플랜을 생성하고, 공유 리소스 풀의 Amazon Redshift Spectrum작업자에게 S3에서 데이터를 읽고 처리하도록 요청한다.

Amazon S3 복제

- S3 버킷 전체에 걸쳐 객체를 비동기식으로 자동 복사할 수 있다. 서로 다른 AWS 리전 간(S3 교차 리전 복제) 또는 동일한 AWS 리전 내(S3 동일 리전 복제)에서 하나 이상의 대상 버킷에 객체를 복사할 수 있다.

Amazon S3 교차 리전 복제(CRR)

- CRR은 다른 AWS 리전에 걸쳐 버킷 간에 데이터를 자동으로 복제하는 S3 기능이다. CRR의 경우 버킷 수준 또는 공유 접두사 수준에서 복제를 설정하거나 S3 객체 태그를 사용하여 객체 수준에서 복제를 설정할 수 있다. CRR을 통해 여러 지역의 리전에서 지연 시전이 더 낮은 데이터 액세스를 제공할 수 있다. 

Amazon S3 동일 리전 복제(SRR)

- SRR은 동일한 AWS 리전 내의 버킷 간에 데이터를 자동으로 복제하는 S3 기능이다. SRR의 경우 버킷 수준 또는 공유 접두사 수준에서 복제를 설정하거나 S3 객체 태그를 사용하여 객체 수준에서 복제를 설정할 수 있다. SRR을 사용하여 동일한 AWS 리전에 데이터의 하나 이상의 복사본을 만들 수 있다. SRR을 통해 데이터의 사본을 원본과 동일한 AWS 리전의 별도 AWS 계정에 보관하여 데이터 주권 및 규정 준수 요구 사항을 충족하도록 할 수 있다.

Amazon S3 복제 시간 제어

- Amazon S3 복제 시간 제어는 예측 가능한 복제 성능을 제공하고 규정 준수 또는 비즈니스 요구 사항을 충족하도록 도와준다. Amazon S3 복제 시간 제어는 대부분의 객체는 몇 초 만에, 99%의 객체는 5분이내, 99.99%의 객체는 15분 이내에 복제 하도록 설계되었다.

Amazon S3 복제 지표 및 이벤트

- Amazon S3 복제 지표 및 이벤트는 Amazon S3 복제에 대한 가시성을 제공한다. S3 복제 지표를 사용하면 복제 보류 중인 객체 크기와 총 작업 수 및 S3 복제 규칙의 원본과 대상 간 복제 지연 시간을 모니터링할 수 있다. 복제 지표는 Amazon S3 Management Console 과 Amazon CloudWatch를 통해 사용할 수 있다.   

S3 객체 Lambda

- S3 객체 Lambda를 통해 사용자 코드를 S3 GET 요청에 추가하여 어플리케이션으로 데이터가 반환될 때 데이터를 수정 및 처리할 수 있다. 처음으로, 사용자 지정 코드를 사용하여 행을 필터링하여 동적으로 이미지 크기를 조정하며 기밀 데이터를 교정하는 등을 작업을 할 수 있다.

- AWS 관리 콘솔에서 몇 번의 클릭만으로 Lambda함수를 구성하고 S3 객체 Lambda 서비스 엔드포인트에 연결할 수 있다. 이후로는 S3에사 Lambda 함수를 자동으로 호출하여 S3객체 Lambda 엔드포인트를 통해 검색된 데이터를 처리하고 애플리케이션에 변환된 결과를 다시 반환할 수 있다.


참고자료

aws.amazon.com/ko/ebs/faqs/

aws.amazon.com/ko/s3/faqs/

aws.amazon.com/ko/ebs/faqs/

728x90