바닥코딩
csv 파일 데이터 셋 받아오기 및 시각화 본문
csv?
csv 는 몇가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이며 확장자는 .csv입니다 쉼표로 필드를 구분하기 때문에 데이터베이서 칼럼을 구별하는 식별자로 사용할 수 있어 데이터베이스에서 많이 사용됩니다. 데이터 공공포털 같은 사이트에서 데이터셋을 csv파일로 가져와 확인 할 수 있습니다.
Dataset 가져오기
해당 사이트에 접속을 해 필요한 데이터셋을 검색하면 아래와 같이 csv 파일을 제공하는 것을 볼 수 있습니다.
csv 파일 시각화 하기
csv 파일은 파이썬의 pandas 모듈을 사용하여 시각화 할 수 있으며 matplotlib 라이브러리를 사용하면 이를 차트화 해 표한 할 수 있는데 아래는 해당 csv파일을 시각화해주는 소스코드 전문입니다.
1
2
3
4
5
|
import pandas as pd
import numpy as np
%matplotlib inline
data_frame = pd.read_csv("C:\\Users\\VETEC\\python\\한국전력 사업소별 전력 계약 및 사용 정보
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter
|
해당 소스 코드 입력후 head, tail 함수등을 통해 데이터를 원하는 행 만큼 출력이 가능하다
'파이썬 데이터 크롤링' 카테고리의 다른 글
pandas를 이용한 데이터 시각화 (0) | 2020.01.03 |
---|---|
selenium(셀레늄) (0) | 2020.01.03 |
JSON (1) | 2020.01.03 |
Beautifulsoup를 통해 HTML 파싱하기 (0) | 2020.01.03 |
데이터 크롤링 (0) | 2020.01.03 |