비유로 이해하기
AWS Glue는 데이터 정리 도우미예요. 여러 곳(데이터베이스, 파일, 엑셀 등)에 흩어져 있는 데이터를 깔끔하게 정리해서 한곳에 모아줘요. 마치 여러 장부를 하나의 엑셀 파일로 합치는 것과 비슷해요.
언제 쓰나요?
📊
데이터 분석 파이프라인
매일 밤 RDS의 주문 데이터를 Parquet 형태로 변환해서 S3에 저장하면, Athena로 빠르게 분석할 수 있어요.
🗂️
데이터 카탈로그 구축
여러 데이터소스의 스키마를 자동으로 감지하고 카탈로그로 관리해서, '어떤 데이터가 어디에 있는지' 쉽게 파악할 수 있어요.
🔄
데이터 포맷 변환
CSV를 Parquet로, JSON을 테이블 형태로 변환하는 등 대용량 데이터의 포맷 변환을 서버 없이 처리할 수 있어요.