AWS Lake Formation

AWS Lake Formation

AWS Lake Formation

고급

한 마디로

데이터를 한곳에 모아 정리하는 거대한 창고

#데이터레이크#데이터거버넌스#접근제어#데이터카탈로그
관련 서비스

비유로 이해하기

Lake Formation은 거대한 데이터 창고를 만들고 관리하는 서비스예요. 여기저기 흩어진 데이터를 한곳(데이터 레이크)에 모으고, 누가 어떤 데이터를 볼 수 있는지 규칙을 정해줘요.

동작 원리

애니메이션 준비 중입니다

언제 쓰나요?

🏗️

데이터 레이크 구축

여러 소스(RDS, DynamoDB, 온프레미스 DB)의 데이터를 S3 기반 데이터 레이크로 중앙화할 때 수집부터 보안까지 한 번에 관리할 수 있어요.

🔐

세밀한 데이터 접근 제어

마케팅 팀은 고객 행동 데이터만, 재무 팀은 매출 데이터만 접근하도록 테이블, 컬럼, 행 수준의 접근 권한을 설정할 수 있어요.

🤝

팀 간 데이터 공유

데이터 레이크의 데이터를 다른 AWS 계정이나 팀에 안전하게 공유할 수 있어요. 데이터 복사 없이 접근 권한만 부여하면 됩니다.

요금 예시

Lake Formation 자체는 무료예요! 데이터를 저장하는 S3와 처리하는 Glue 등의 비용만 내면 됩니다.

자주 묻는 질문

데이터 레이크와 데이터 웨어하우스의 차이는?

데이터 레이크는 원시 데이터를 그대로 저장(S3), 데이터 웨어하우스는 구조화된 데이터를 분석용으로 저장(Redshift)해요. 보통 둘 다 함께 사용합니다.

Glue만으로도 데이터 레이크를 만들 수 있지 않나요?

가능하지만, Lake Formation은 세밀한 접근 제어, 데이터 공유, 블루프린트 등 데이터 레이크 관리에 필요한 추가 기능을 제공해요. 규모가 크다면 Lake Formation을 권장합니다.

소규모 데이터에도 Lake Formation이 필요한가요?

데이터가 소규모이고 팀이 작다면 S3 + Athena만으로 충분할 수 있어요. 여러 팀이 데이터를 공유하거나 접근 제어가 필요해질 때 도입을 고려하세요.