Light

Dark

MySQL : Nested JOIN

Nov 19, 2020 About 2 mins

서론

최근 프로젝트로 인해 복잡한 쿼리를 짜다보니 subquery 가 2개,3개 생기는 경우가 발생하였고 그에 따른 성능에 관해서 고민하게 되었다. 그래서 일단 오늘은 Nested Join 방식에 대해 알아보도록 하겠다.

JOIN

두 릴레이션으로부터 관련된 투플을 결합하여 하나의 투플로 만드는 데이터 연결 방법
다른 조인 방법을 사용할 지라도 결과는 동일할 수 있으나, 두 집합의 데이터의 상황에 따라 조인 방향, 방법에 따른 수행 속도가 다를 수 있다.

Nested Loop Join

2개 이상의 테이블에서 하나의 집합을 기준으로 순차적으로 상대방 로우를 결합하여 결과를 조합하는 방식
먼저 선행 테이블의 처리 범위를 하나씩 액세스하면서 추출된 값으로 테이블을 조인한다.

쉽게 생각하면 흔히 보는 이중 for문이라고 보면 된다.

for(i=0; i<100; i++) { -- outer loop 
	for(j=0; j<100; j++) { -- inner loop 
   		// 처리... 
	} 
}

특징
- 좁은 범위에서 유리한 성능을 보인다.
- 순차적으로 처리고, Random Access 위주로 처리한다.
- 후행 테이블(Driven)에는 조인을 위한 인덱스 생성이 필요하다.
- 실행 속도 = 선행 테이블 사이즈 * 후행 테이블 접근 횟수
단점
- 데이터를 Random Access 하기 때문에 결과 집합이 많으면 성능이 느리다.
- Join Index가 없거나, 조인 집합을 구성하는 검색 조건이 조인 범위를 줄여주지 못할 경우에 비효율적이다.
- 테이블 중 Row수가 적은 쪽을 후행(Driven) 테이블로 설정해야 한다.

예제

SELECT /*+ ordered use_nl(e)*/
FROM dept d, emp e 
WHERE d.deptno = e.deptno;

Sort Merge Join

조인의 대상 범위가 넓을 경우 발생하는 Random Access를 줄이기 위한 경우에 사용한다.
연결 고리에 마땅한 인덱스가 존재하지 않을 경우에 사용되기도 한다.
양쪽 테이블의 처리 범위를 각자 Access하여 정렬한 결과를 차례로 scan하면서 연결고리의 조건으로 Merge하는 방식이다.
특징
- 연결을 위해 Random Access 하지 않고 스캔을 하면서 수행한다.
- 선행 집합의 개념이 없다.
- 정렬을 위한 영역에 따라 효율에 큰 차이가 발생한다.
- 조인 연산자가 ’=’ 가 아닌 경우 Nested Loop Join 보다 유리한 경우가 많다.
단점
- 두 결과의 집합 크기의 차이가 많이 나는 경우에는 비효율적이다.
- Sorting 에 해당하는 대상이 Join Key 뿐만 아니라 Select List 도 포함되므로 불필요한 Select 항목을 제거할 필요가 있다.

예제

SELECT /*+ ordered full(d) use_merge(e)*/
FROM   dept d, emp e
WHERE  d.deptno = e.deptno;