1. 데이터 결과 검증의 정의
:SQL쿼리 후 얻은 결과가 예상과 일치하는지 확인하는 과정으로 분석 결과의 정확성과, 신뢰성을 확보하기 위함
검증 방법
1) 내가 기대하는 예상 결과를 정의
2) 쿼리 작성
3) 두개가 일치하는지 비교
중요한 POINT!
- 문제를 잘 정의하고 미리 작성해보기
- 도메인 특수성 잘 파악하기
- SQL쿼리 템플릿과 맥락이 유사하다
2. 데이터 결과를 검증하는 흐름
1) 문제 정의 확인 (제일 중요!!)
: 구체적인 문제 정의. 요청 사항도 구체적으로 확인(조건이 있는지, 질문을 해서 정의를 다시 확인)
2) 사용할 테이블(INPUT)과 결과(OUTPUT)
- 데이터의 INPUT과 원하는 형태의 OUTPUT 작성하기
- INPUT -> 중간 결과 -> OUTPUT 순으로 중간 결과를 확인하는 것도 좋다.
이런 과정을 거친다음 쿼리를 작성하고 결과를 비교합니다.
예상과 실제 쿼리 결과의 차이가 있는지 확인을 하고 오류가 있으면 다시 쿼리를 수정하는거죠.
3. 결과 검증 시 자주 활용하는 SQL쿼리
대표적으로 활용하는 SQL문법
1) COUNT(*)
: 행 수를 확인. 의도한 데이터의 행 개수가 맞는가?
2) NOT NULL
: 특정 컬럼에 NULL이 존재하는가? 필수 필드가 비어있지 않는가?
3) DISTINCT
: 데이터의 고유값을 확인해 중복 여부 확인
COUNT(DISTINCT 컬럼) =COUNT(컬럼) 이게 동일한지 확인해야합니다.
4) IF문, CASE WHEN
:의도와 같다면 TRUE, 아니면 FALSE
'데이터 분석 > 01. BigQuery' 카테고리의 다른 글
| 가독성있는 SQL쿼리 작성 방법! (3) | 2025.07.30 |
|---|---|
| 쿼리 작성시 알아야하는 것 (1) | 2025.07.29 |
| JOIN에서 헷갈리는 부분들! (2) | 2025.07.28 |
| SQL 쿼리 잘 작성하고 싶다면?? (3) | 2025.07.24 |
| 쿼리를 작성하기 전에 생각해야할 것! (7) | 2025.07.23 |