비유로 이해하기
Lake Formation은 거대한 데이터 창고를 만들고 관리하는 서비스예요. 여기저기 흩어진 데이터를 한곳(데이터 레이크)에 모으고, 누가 어떤 데이터를 볼 수 있는지 규칙을 정해줘요.
동작 원리
애니메이션 준비 중입니다
언제 쓰나요?
🏗️
데이터 레이크 구축
여러 소스(RDS, DynamoDB, 온프레미스 DB)의 데이터를 S3 기반 데이터 레이크로 중앙화할 때 수집부터 보안까지 한 번에 관리할 수 있어요.
🔐
세밀한 데이터 접근 제어
마케팅 팀은 고객 행동 데이터만, 재무 팀은 매출 데이터만 접근하도록 테이블, 컬럼, 행 수준의 접근 권한을 설정할 수 있어요.
🤝
팀 간 데이터 공유
데이터 레이크의 데이터를 다른 AWS 계정이나 팀에 안전하게 공유할 수 있어요. 데이터 복사 없이 접근 권한만 부여하면 됩니다.
요금 예시
Lake Formation 자체는 무료예요! 데이터를 저장하는 S3와 처리하는 Glue 등의 비용만 내면 됩니다.
자주 묻는 질문
❓
데이터 레이크와 데이터 웨어하우스의 차이는?
데이터 레이크는 원시 데이터를 그대로 저장(S3), 데이터 웨어하우스는 구조화된 데이터를 분석용으로 저장(Redshift)해요. 보통 둘 다 함께 사용합니다.
❓
Glue만으로도 데이터 레이크를 만들 수 있지 않나요?
가능하지만, Lake Formation은 세밀한 접근 제어, 데이터 공유, 블루프린트 등 데이터 레이크 관리에 필요한 추가 기능을 제공해요. 규모가 크다면 Lake Formation을 권장합니다.
❓
소규모 데이터에도 Lake Formation이 필요한가요?
데이터가 소규모이고 팀이 작다면 S3 + Athena만으로 충분할 수 있어요. 여러 팀이 데이터를 공유하거나 접근 제어가 필요해질 때 도입을 고려하세요.