바닥코딩

pandas를 이용한 데이터 시각화 본문

파이썬 데이터 크롤링

pandas를 이용한 데이터 시각화

개발공부개발공부 2020. 1. 3. 16:17

pandas?

 

pandas 파이썬에서 사용하는 데이터분석 라이브러리로 행과 열로 이루어진 데이터 객체를 만들어 다를 수 있고  안정적으로 데이터를 처리하는데 편리한 모듈입니다. 우리가 크롤링을 통해 데이터를 얻었다면 이것을 눈으로 시각화 할 수 있는 것도 중요합니다. 이에는 많은 방법이 있을 수 있겠지만 해당 포스트에서는 pandas를 통한 시각화를 알아보겠습니다. 

pandas는 해당 명령어를 통해 설치가 가능합니다. 

pip install pandas

pandas 모듈의 여러 내장함수를 사용 하면 data 프레임을 정의할 때 또는 데이터를 시각화 하여 나타낼 떄 효울적으로 사용할 수 있습니다.                                                                                                                                 ex)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import pandas as pd 
import numpy as np #numpy도 같이 import
data = {"names": ["Kilho""Kilho""Kilho""Charles""Charles"],
           "year": [20142015201620152016],
           "points": [1.51.73.62.42.9]}
df = pd.DataFrame(data, columns=["year""names""points""penalty"],
                          index=["one""two""three""four""five"])
print(df)
 
 
 
 
 
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter

위와 같은 코드를 통해 데이터프레임을 작성하면 pandas는 이를 이와 같이 시각화 하여 표현한다 

그 외에도 pandas를 통해 챠트를 생성하거나 히스토그램과 같은 차트를 만드는 것도 가능합니다

 

'파이썬 데이터 크롤링' 카테고리의 다른 글

csv 파일 데이터 셋 받아오기 및 시각화  (0) 2020.01.04
selenium(셀레늄)  (0) 2020.01.03
JSON  (1) 2020.01.03
Beautifulsoup를 통해 HTML 파싱하기  (0) 2020.01.03
데이터 크롤링  (0) 2020.01.03