Python

[pandas] Python - Pandas Intro (판다스 소개)

704
목차
  1. Pandas 소개
  2. Pandas 사용 이유
  3. Pandas 가능 작업
  4. Pandas 코드 위치

 

Pandas 소개

 

'데이터 셋을 (분석, 정리, 탐색, 조작)' 위한 Python 라이브러리로, 표 형식의 데이터를 다루는 데 중점을 두며, 데이터프레임(DataFrame)이라는 자료구조를 제공함.

 

(Since 2008年.)

 

 

Pandas 사용 이유

 

빅 데이터 분석 후, 통계 이론 기반해 결론 도출 가능.

  • 난잡한 데이터도 깔끔하게 정리 가능.
  • 데이터 (저장, 사용, 분석, 정보 도출)에 유용.

 

 

Pandas 가능 작업

※ 데이터 분석, 데이터 정제, 통계 분석 등의 작업에 사용.


1. 데이터 관련 답변 제공.

(예) 2개 이상 컬럼 간 상관관계. / 평균값 /최대값 / 최소값 등.

 

2. 데이터 청소/정리 (= Cleaning data) 가능.

(예) 관련 없거나, 잘못되었거나, 비었거나, null인 데이터 삭제 가능.

 

3. 데이터 필터링, 정렬, 그룹화, 병합, 피벗 등 다양한 데이터 조작 기능을 제공하며, 시계열 데이터 처리에도 강력한 기능 가짐.

 

 

Pandas 코드 위치

 

https://github.com/pandas-dev/pandas

 

PS.

github : 많은 사람들이 동일한 코드베이스에서 작업 가능.



분류 제목
numpy PY - NumPy Random : Uniform Distribution (균등 분포)
numpy PY - NumPy Random : Logistic Distribution (로지스틱 분포)
numpy PY - NumPy Random : Multinomial Distribution (다항 분포)
numpy PY - NumPy Random : Exponential Distribution (지수 분포)
numpy PY - NumPy Random : Chi Square Distribution (카이제곱 분포)
numpy PY - NumPy Random : Rayleigh Distribution (레일리 분포)
numpy PY - NumPy Random : Pareto Distribution (파레토 분포)
numpy PY - NumPy Random : Zipf Distribution (지프 분포)
numpy Python - NumPy ufuncs : Intro (일반함수 소개)
numpy PY - NumPy ufuncs : Create Function (일반함수 생성)
numpy PY - NumPy ufuncs : Simple Arithmetic (간단 산수)
numpy PY - NumPy ufuncs : Rounding Decimals (반올림 소수점)
numpy PY - NumPy ufuncs : Logs (로그)
numpy PY - NumPy ufuncs : Summations (합계=합산)
numpy PY - NumPy ufuncs : Products (요소 곱셈)
23/32
목록
 홈  PC버전 로그인 일본어
그누앞단언어
그누뒷단언어
그외코딩언어
그누보드
제작의뢰
Q&A
커뮤니티 3
웹유틸
회원센터
홈짱닷컴 PC버전 로그인