설명
이탈 분석은 종종 “언제”보다 “직전 패턴”이 중요합니다. 윈도 함수 마이크로코스는 시간 순서가 있는 로그를 전제로 하며, 쿼리브릿지 진단 리포트에서 사용하는 것과 유사한 지표명을 연습합니다.
포함 요소
- PARTITION 기준을 선택하는 의사결정 트리
- LAG/LEAD 비교 시 NULL 처리
- 세션 경계를 정의하는 ROW_NUMBER 패턴
- 이탈 코호트 표현용 프레임 절 제한 버전
- 운영 알림용 임계값 SQL
기대 결과
- 이탈 직전 이벤트 시퀀스를 SQL로 요약합니다.
- 중복 세션을 제거한 코호트를 정의합니다.
- 알림용 임계값 쿼리를 작성합니다.
FAQ
Spark SQL도 다루나요?
문법은 표준 SQL에 가깝게 유지하며 Spark 전용 함수는 포함하지 않습니다.
실시간 스트림은?
배치 로그 전제입니다. 스트림 처리는 범위 밖입니다.
선수 지식은?
조인과 집계 모듈을 이수한 상태를 권장합니다.
경험 후기
LAG 비교에서 NULL을 어떻게 둘지 팀마다 논쟁이 있었는데, “윈도 함수로 읽는 이탈 신호” 모듈의 PARTITION 트리 덕분에 규칙이 문서화됐습니다.