AWS Glue

AWS Glue

AWS Glue

중급

한 마디로

여러 곳에 흩어진 데이터를 정리해서 한곳에 모아주는 정리 도우미

#ETL#데이터변환#데이터카탈로그#분석#서버리스
관련 서비스

비유로 이해하기

AWS Glue는 데이터 정리 도우미예요. 여러 곳(데이터베이스, 파일, 엑셀 등)에 흩어져 있는 데이터를 깔끔하게 정리해서 한곳에 모아줘요. 마치 여러 장부를 하나의 엑셀 파일로 합치는 것과 비슷해요.

언제 쓰나요?

📊

데이터 분석 파이프라인

매일 밤 RDS의 주문 데이터를 Parquet 형태로 변환해서 S3에 저장하면, Athena로 빠르게 분석할 수 있어요.

🗂️

데이터 카탈로그 구축

여러 데이터소스의 스키마를 자동으로 감지하고 카탈로그로 관리해서, '어떤 데이터가 어디에 있는지' 쉽게 파악할 수 있어요.

🔄

데이터 포맷 변환

CSV를 Parquet로, JSON을 테이블 형태로 변환하는 등 대용량 데이터의 포맷 변환을 서버 없이 처리할 수 있어요.