반응형

SQL의 JOIN에서 ON과 WHERE의 차이점은 JOIN하는 범위가 다르다. 아래 두 SQL문을 보자. 두 SQL문 모두 LEFT JOIN을 수행하는 OUTER JOIN이다.

 

1) 
SELECT * 
FROM test1 a LEFT JOIN test2 b 
ON (a.aa = b.aa) 
WHERE b.cc = 7; 

2) 
SELECT * 
FROM test1 a LEFT JOIN test2 b 
ON (a.aa = b.aa AND b.cc = 7);

1)의 경우는 a와 b 테이블의 OUTER JOIN을 수행한 후에 b.cc = 7인 데이터들을 추출하지만 2)의 경우는 (a 테이블)과 (b 테이블 중 b.cc = 7인 경우)를 OUTER JOIN 한 결과가 나온다.

 

따라서 1)의 결과는 b.dd = 7인 데이터만 존재하지만 2)의 결과는 b.cc = 7이 아닌 데이터도 존재한다. 아래와 같은 test1, test2 테이블이 있을 때,

 

test1 test2 
aa|bb aa|cc 
----- ----- 
1 | 4 1 | 7 
2 | 5 2 | 8 
3 | 6

그 SQL의 결과는 다음과 같다.

 

1) 
1 | 4 | 1 | 7 

2) 1 | 4 | 1 | 7 
2 | 5 | null | null 
3 | 6 | null | null

한마디로 ON과 WHERE의 경우는 JOIN을 할 대상(범위)이 달라진다는 것이다.

 

이 점을 이용해서 LEFT OUTER JOIN으로 차집합을 구현할 수 있다. 오라클이나 MSSQL과 같은 경우는 EXCEPT 혹은 MINUS 등을 사용하면 되겠지만, MySQL은 버전에 따라 지원하는 경우도 있고 아닌 경우도 있다.

test1 테이블의 데이터 중 test2 테이블에 있는 데이터를 제외하고 가져오고 싶다. 위의 테이블에서 JOIN하는 column을 기준으로 1, 2는 test2 테이블에도 있으니 제외하고, 3 | 6만을 가져오고 싶은 경우이다.

 

SELECT * 
FROM test1 a LEFT JOIN test2 b 
ON (a.aa = b.aa) 
WHERE b.aa IS NULL;
3 | 6 | null | null

 

test2.aa에 있는 1, 2의 데이터를 제외한 데이터를 test1.aa에서 가져왔다. LEFT OUTER JOIN이기 때문에 WHERE절 이전까지 실행했을 때 아래와 같은 결과가 나온다.

 

SELECT * 
FROM test1 a LEFT JOIN test2 b 
ON (a.aa = b.aa); 

1 | 4 | 1    | 7 
2 | 5 | 2    | 8 
3 | 6 | null | null

여기에서 test2 테이블에 존재하지 않아서 test2 테이블의 column이 null인 부분만을 가지고 오게 WHERE절을 달아주면!! 차집합이 된다는 것이다.

 

 

출처 : https://blog.leocat.kr/notes/2017/07/28/sql-join-on-vs-where

반응형

'DB > SQL' 카테고리의 다른 글

SQL의 종류 DDL, DML, DCL 이란?  (0) 2022.02.25
sql Join & Where개요  (0) 2020.05.06
Foreign Key 제약 설정 Delete Rule  (0) 2020.04.21
WHERE 절의 조합(AND / OR / NOT / IN)  (0) 2020.04.21

+ Recent posts