JOIN에서 헷갈리는 부분들!

2025. 7. 28. 18:37·데이터 분석/01. BigQuery

1. JOIN의 종류 선택

: 작업의 목적에 따라

  • 교집합: INNER
  • 모두 다 조합: CROSS
  • 그 외 LEFT 또는 RIGHT : LEFT를 추천
    : 쿼리 작성 템플릿에 예상하는 결과를 작성하고, 중간 결과도 생각하면서 찾기

2. 어떤 테이블을 먼저 둬야할까

  • 기준이 되는 Table을 왼쪽에 두기
  • 기준이 될 테이블에는 기준 값이 존재하고, 우측에 데이터를 계속 추가

3. 여러 Table을 연결할 수 있는 걸까

  • JOIN의 개수에 한계는 없음
  • 너무 많이 하는건 문제가 될 수 있다. 3~5개 정도가 적당
  • 중간 테이블을 만들어서 나중에 관리하기 편하게 만들기

4. 컬럼은 모두 다 선택해야할까

  • 어떤 데이터를 추출해서 무엇을 하고자하나를 고민해야함
  • 사용하지 않을 컬럼을 선택하지 않는것이 BigQuery 비용을 줄일 수 있다.
  • id 같은 값은 고유값인지 확인하기 위해 자주 사용되므로 포함는 편
  • EXCEPT(컬럼)을 사용하거나 제일 첫번째 JOIN에서 필요한 컬럼만 명시

5. NULL이 뭐야

  • NULL은 값이 없음,알 수 없음을 의미
  • 0과 공백은 아님 
  • JOIN에선 연결할 값이 없는 경우 나타남

 

'데이터 분석 > 01. BigQuery' 카테고리의 다른 글

가독성있는 SQL쿼리 작성 방법!  (3) 2025.07.30
쿼리 작성시 알아야하는 것  (1) 2025.07.29
SQL 쿼리 잘 작성하고 싶다면??  (3) 2025.07.24
쿼리를 작성하기 전에 생각해야할 것!  (7) 2025.07.23
SQL을 어느 단계에서 사용하는 걸까?  (0) 2025.07.23
'데이터 분석/01. BigQuery' 카테고리의 다른 글
  • 가독성있는 SQL쿼리 작성 방법!
  • 쿼리 작성시 알아야하는 것
  • SQL 쿼리 잘 작성하고 싶다면??
  • 쿼리를 작성하기 전에 생각해야할 것!
Growth DA Log
Growth DA Log
Growth DA Log 님의 블로그 입니다.
  • Growth DA Log
    Growth DA Log님의 블로그
    Growth DA Log
  • 전체
    오늘
    어제
    • 분류 전체보기 (125)
      • TIS_COMPANY (6)
      • 코딩 테스트 (61)
        • 01. Python (3)
        • 02. SQL (58)
      • 데이터 분석 (53)
        • 01. BigQuery (9)
        • 02. GA4 (1)
        • 02-1. GA4를 더 잘 다루기 위한 마케팅 개.. (5)
        • 03. streamlit (5)
        • 04. Git (12)
        • 05. 데이터 엔지니어링 (3)
        • 06. 데이터 모델링 (11)
        • 07. Excel (0)
        • 08. Tableau (4)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    SQL
    이행성
    tableaubootcamp
    solvesql
    DENSE_RANK
    Reset
    코딩테스트
    ROW_NUMBER
    rank
    쿼리테스트
    AARRR
    코드잇스프린트후기
    revert
    윈도우함수
    tableau
    streamlit
    git
    cross_join
    코테
    프로그래머스
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
Growth DA Log
JOIN에서 헷갈리는 부분들!
상단으로

티스토리툴바