[MSSQL] Pivot

Pivot이란?

Pivot은 행을 열로 변환하여 데이터를 요약하는데 사용되는 기능

PIVOT을 사용하는 일반적인 절차

1. PIVOT을 적용할 쿼리를 작성합니다. PIVOT을 사용하여 데이터를 요약하려는 경우, 먼저 요약된 결과를 얻을 수 있는 쿼리를 작성해야 합니다.

2. PIVOT 절을 사용하여 데이터를 변환합니다. PIVOT 절은 쿼리의 SELECT 문에서 사용되며, 어떤 열을 행으로 변환할 것인지를 지정합니다. PIVOT 절은 다음과 같은 구문을 가집니다:

SELECT 열1, 열2, ...,
    [피벗된 열1], [피벗된 열2], ...
FROM (
    원본 쿼리
) AS 원본테이블
PIVOT (
    집계 함수(집계할 열)
    FOR 피벗 열 IN ([피벗 값1], [피벗 값2], ...)
) AS 피벗테이블

여기서 "피벗된 열1", "피벗된 열2" 등은 변환된 열을 나타내며, "피벗 값1", "피벗 값2" 등은 변환할 열의 값들을 나타냅니다. 집계 함수는 변환된 열에 적용할 집계 함수를 지정합니다.

3. 필요에 따라 추가적인 작업을 수행합니다. PIVOT을 사용하여 데이터를 변환한 후에는 필요에 따라 결과를 정렬하거나 필터링할 수 있습니다. 이는 기존의 SELECT 문을 사용하여 수행할 수 있습니다.

데이터 분석에서의 Pivot 역할 및 사용 예시

데이터 분석에서 PIVOT은 행과 열을 변환하여 데이터를 요약하고 분석하기 위해 사용됩니다. PIVOT을 사용하면 특정 열의 값을 열로 변환하여 데이터를 집계하고, 보다 직관적으로 데이터를 비교하고 분석할 수 있습니다.

예를 들어, 다음과 같은 Sales 데이터가 있다고 가정해보겠습니다:

Product | Region | Year | Sales
------------------------------
A       | East   | 2019 | 100
A       | West   | 2019 | 200
B       | East   | 2019 | 150
B       | West   | 2019 | 250
A       | East   | 2020 | 120
A       | West   | 2020 | 180
B       | East   | 2020 | 160
B       | West   | 2020 | 220

위의 데이터를 PIVOT을 사용하여 "Year"를 열로 변환하고, "Region"을 행으로 변환 후 PIVOT을 적용한 결과

Region | 2019_Sales | 2020_Sales
-------------------------------
East   | 250        | 280
West   | 450        | 400

위의 결과에서는 "Region"을 행으로, "Year"을 열로 변환하여 각 지역별로 연도별 매출을 비교할 수 있습니다. 이를 통해 각 지역의 매출 흐름을 파악하고, 연도별 매출의 변화를 확인할 수 있습니다.

이처럼 PIVOT을 사용하면 보다 직관적이고 요약된 데이터를 얻을 수 있으며, 데이터 분석에 유용한 정보를 도출할 수 있습니다. PIVOT은 많은 데이터 분석 작업에서 사용되며, 데이터의 구조와 분석 목적에 따라 다양한 방식으로 활용될 수 있습니다.

Pivot 사용시 주의해야할 점

PIVOT을 사용할 때 주의해야 할 몇 가지 요소가 있습니다. 다음은 PIVOT을 사용할 때 주의해야 할 부분입니다:

데이터의 일관성
- PIVOT을 사용하기 전에 데이터의 일관성을 확인해야 합니다. 즉, PIVOT을 적용하려는 열과 값의 조합이 유일하게 식별 가능해야 합니다. 만약 중복된 조합이 있다면, PIVOT 결과가 예상과 다를 수 있습니다.
집계 함수 선택
- PIVOT을 사용할 때는 집계 함수를 선택해야 합니다. 집계 함수는 PIVOT 결과에서 각 셀의 값을 계산하는 데 사용됩니다. SUM, AVG, COUNT 등의 집계 함수를 선택할 수 있으며, 데이터에 맞는 적절한 집계 함수를 선택해야 합니다.
NULL 값 처리
-PIVOT을 사용할 때는 NULL 값 처리에 주의해야 합니다. PIVOT 결과에서 NULL 값이 있는 경우, 이를 어떻게 처리할지 결정해야 합니다. NULL 값을 0으로 대체하거나 다른 값을 할당하는 등의 처리 방법을 선택해야 합니다.
PIVOT의 성능
- 대용량 데이터셋에서 PIVOT을 사용할 때 성능에 영향을 줄 수 있습니다. PIVOT 연산은 데이터를 재구성하는 작업이므로, 데이터의 크기와 구조에 따라 성능이 감소할 수 있습니다. 따라서 PIVOT을 사용하기 전에 데이터의 크기와 구조를 고려하여 성능을 평가해야 합니다.
다른 방법과의 비교
- PIVOT은 데이터를 재구성하는 방법 중 하나입니다. PIVOT을 사용하기 전에 다른 방법(예: GROUP BY, CASE문 등)과의 비교를 고려해야 합니다. 때에 따라서는 다른 방법이 더 효율적일 수 있으므로, 데이터의 특성과 분석 목적에 맞는 방법을 선택해야 합니다.

PIVOT을 사용할 때는 데이터의 일관성과 집계 함수 선택, NULL 값 처리, 성능 평가, 다른 방법과의 비교 등을 고려하여 적절하게 적용해야 합니다.

'Database > MSSQL' 카테고리의 다른 글

[MSSQL] 날짜(date) 관련 함수 (26)	2024.02.15
[MSSQL] Union (32)	2024.02.13
[MSSQL] With 문 (39)	2024.02.08
MSSQL - SSMS 활용하여 데이터 메일로 받기 (0)	2023.12.30
[MSSQL] TOP, TOP으로 중간 행부터 데이터 가져오기 (1)	2023.12.29

범비의 지식쌓기

[MSSQL] Pivot

Pivot이란?

'Database > MSSQL' 카테고리의 다른 글

티스토리툴바

[MSSQL] Pivot

Pivot이란?

'Database > MSSQL' 카테고리의 다른 글

관련글

티스토리툴바