1. 필터링
필터링이란?
필터링은 특정 조건에 맞는 데이터만 선택하는 작업입니다. Power Query에서 필터링을 사용하면 대량의 데이터에서 필요한 데이터만 추출할 수 있습니다.
사용 방법
- Power Query 편집기에서 필터링할 열의 오른쪽 드롭다운 화살표를 클릭합니다.
- 원하는 조건(예: 값 선택, 텍스트 필터, 숫자 필터)을 선택합니다.
예제: 특정 매출 이상인 데이터 필터링
제품명 | 카테고리 | 매출 |
---|
노트북 | 전자제품 | 1,000,000 |
스마트폰 | 전자제품 | 800,000 |
키보드 | 컴퓨터용품 | 300,000 |
태블릿 | 전자제품 | 500,000 |
모니터 | 컴퓨터용품 | 600,000 |
필터링 조건:
작업 단계:
- 매출 열의 드롭다운 화살표 클릭.
- 숫자 필터 > 500,000 이상 선택.
결과:
제품명 | 카테고리 | 매출 |
---|
노트북 | 전자제품 | 1,000,000 |
스마트폰 | 전자제품 | 800,000 |
모니터 | 컴퓨터용품 | 600,000 |
2. 열 제거
열 제거란?
열 제거는 분석에 필요하지 않은 데이터를 삭제하여 테이블을 간결하고 읽기 쉽게 만드는 작업입니다.
사용 방법
- Power Query 편집기에서 삭제할 열을 선택합니다.
- 마우스 오른쪽 클릭 > 열 제거를 선택하거나 상단 메뉴에서 열 제거를 클릭합니다.
예제: 필요 없는 열 제거
제품명 | 카테고리 | 매출 | 제조사 | 재고 수량 |
---|
노트북 | 전자제품 | 1,000,000 | ABC | 50 |
스마트폰 | 전자제품 | 800,000 | DEF | 30 |
키보드 | 컴퓨터용품 | 300,000 | GHI | 100 |
태블릿 | 전자제품 | 500,000 | JKL | 20 |
작업 목표:
작업 단계:
- “제조사” 열 클릭 후 마우스 오른쪽 클릭 > 열 제거 선택.
- “재고 수량” 열에서도 동일 작업 수행.
결과:
제품명 | 카테고리 | 매출 |
---|
노트북 | 전자제품 | 1,000,000 |
스마트폰 | 전자제품 | 800,000 |
키보드 | 컴퓨터용품 | 300,000 |
태블릿 | 전자제품 | 500,000 |
3. 데이터 형식 변경
데이터 형식 변경이란?
데이터 형식 변경은 각 열의 데이터를 숫자, 텍스트, 날짜 등 특정 유형으로 변환하여 정확히 처리할 수 있도록 만드는 작업입니다.
사용 방법
- Power Query 편집기에서 열 머리글의 데이터 형식 아이콘(123, ABC 등)을 클릭.
- 원하는 데이터 형식(숫자, 텍스트, 날짜 등)을 선택.
예제: 매출 열을 숫자 형식으로 변경
제품명 | 카테고리 | 매출 |
---|
노트북 | 전자제품 | 1,000,000 |
스마트폰 | 전자제품 | 800,000 |
키보드 | 컴퓨터용품 | 300,000 |
태블릿 | 전자제품 | 500,000 |
작업 목표:
작업 단계:
- “매출” 열의 데이터 형식 아이콘 클릭.
- 정수 또는 소수를 선택하여 숫자 형식으로 변환.
결과:
- 데이터가 숫자 형식으로 변경되며 합계, 평균 등 계산이 가능해짐.
4. 종합 예제: 데이터 정리 프로세스
문제:
- 고객 주문 데이터에서 전자제품만 필터링.
- 불필요한 열(주문 ID, 배송 상태) 제거.
- 주문 금액을 숫자 형식으로 변환.
주문 ID | 제품명 | 카테고리 | 주문 금액 | 배송 상태 |
---|
O001 | 노트북 | 전자제품 | 1,000,000 | 배송 완료 |
O002 | 키보드 | 컴퓨터용품 | 300,000 | 배송 중 |
O003 | 스마트폰 | 전자제품 | 800,000 | 배송 완료 |
O004 | 태블릿 | 전자제품 | 500,000 | 배송 중 |
작업 단계:
- 필터링: “카테고리” 열에서 “전자제품”만 필터링.
- 열 제거: “주문 ID”와 “배송 상태” 열 제거.
- 데이터 형식 변경: “주문 금액” 열을 숫자 형식으로 변환.
결과:
제품명 | 카테고리 | 주문 금액 |
---|
노트북 | 전자제품 | 1,000,000 |
스마트폰 | 전자제품 | 800,000 |
태블릿 | 전자제품 | 500,000 |
Power Query의 데이터 정리 이점
- 복잡한 데이터도 직관적으로 정리 가능.
- 대량 데이터에서 필요한 정보만 효율적으로 필터링.
- 변환 과정을 저장하여 반복 작업 자동화.