플그래밍/파이써언

[파이썬] Pandas 기초

훗티v 2023. 2. 10. 20:10
반응형

🐼 Pandas Library

Pandas는 데이터 분석 및 조작을 위한 Python 라이브러리입니다. 대규모 데이터 세트를 효율적으로 저장하기 위한 데이터 구조와 데이터 작업을 위한 도구를 제공합니다.

🧰 용도

판다를 사용하면 다음과 같은 다양한 작업을 수행할 수 있습니다:

◽ 데이터 정리 및 전처리
◽ 데이터 선택 및 필터링
◽ 데이터 그룹화 및 집계
◽ 여러 소스의 데이터 병합 및 조인
◽ 데이터 재구성 및 피벗
◽ 내장된 플로팅 도구로 데이터 시각화

 

Pandas는 데이터 과학 커뮤니티에서 널리 사용되며 Python에서 데이터를 분석하고 조작하기 위해 반드시 알아야 할 라이브러리입니다.

 

📖 예제

CSV 파일을 판다 데이터프레임으로 가져오기

import pandas as pd

df = pd.read_csv(f"amountvolumes.csv", encoding="cp949")

📛 한글 csv 파일의 경우 encoding="cp949"를 추가해주세요.

 

 

데이터 프레임의 첫 5행 표시

print(df.head())

 

 

데이터프레임에 대한 기본 정보

print(df.info())

 

 

데이터 프레임에서 열 선택

col = df["순위"]

 

 

데이터 프레임에서 여러 열 선택

cols = df[["종목명", "종목코드"]]

 

 

조건에 따른 행 필터링 (1위 ~ 10위)

filtered_df = df[df["순위"] <= 10]

 

 

 

 

 

 

 

반응형