데이터 분석을 시작할 때 가장 중요한 단계는 데이터를 가져오고 정리하는 것입니다. Power Query는 Excel과 Power BI에서 제공되는 강력한 도구로, 다양한 소스에서 데이터를 불러와 쉽게 정리할 수 있도록 도와줍니다. 이번 글에서는 Power Query의 개념과 주요 기능을 소개하고, CSV 파일을 활용한 데이터 가져오기 예제를 통해 실무에서 활용할 수 있는 방법을 설명하겠습니다.
Power Query란?
정의:
Power Query는 데이터를 가져오고 변환하여 분석 가능한 형태로 만드는 도구입니다. Excel과 Power BI에서 기본 제공되며, 다양한 데이터 소스와 연결할 수 있습니다.
주요 특징:
- 데이터 가져오기: Excel 파일, CSV, 웹, 데이터베이스 등 다양한 소스에서 데이터를 가져올 수 있음.
- 데이터 정리: 필터링, 열 제거, 데이터 형식 변경 등을 통해 데이터를 클린하게 변환.
- 데이터 병합 및 추가: 여러 테이블을 결합하여 하나의 테이블로 통합.
- 자동화: 반복 작업을 저장하고 재사용 가능.
데이터 가져오기
지원되는 데이터 소스:
- Excel 파일, CSV 파일, 텍스트 파일.
- 데이터베이스(SQL Server, MySQL 등).
- 웹 데이터를 크롤링하여 테이블 형태로 불러오기.
예제: CSV 파일 가져오기
- 문제: 월별 매출 데이터를 하나의 테이블로 불러오기.
단계:
- 데이터 탭 > 데이터 가져오기 > 파일에서 > CSV를 선택.
- CSV 파일 선택 후 Power Query 편집기 열기.
- 데이터가 올바른지 확인 후 “데이터 변환” 클릭.
결과:
월 | 제품명 | 매출 |
---|---|---|
1월 | 노트북 | 1,000,000 |
2월 | 스마트폰 | 800,000 |
3월 | 태블릿 | 500,000 |