• 회원가입
  • 로그인
  • 구글아이디로 로그인

[pandas] Python - Pandas DataFrames (데이터프레임)

701  
목차
  1. DataFrame 정의
  2. 행 찾기 (Locate Row)
  3. 명명된 인덱스 (Named Indexes)
  4. 명명된 인덱스 찾기
  5. 파일 안 데이터를 DataFrame으로 로드

 

DataFrame 정의

 

1.

행 (row)과 열(column) 구조로 된 2차원 데이터 구조.

※ 행 (row) : 가로선 기준.

※ 열 (column) : 세로선 기준. (각 열을 Series라고 함.)

 

2.

Series (= 1개 열에 해당하는 데이터)가 2개 이상 모여 구성된

다차원 배열에 해당.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df= pd.DataFrame(data)

print(df)

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

2    JS  30000

 

행 찾기 (Locate Row)

 

DataFrame의 n행 데이터

df.loc[n-1]

 

df : 데이터프레임.

n : 행(row) 색인. (0부터 시작. 첫 행:0, 두 번재 행:1, ...)

 


[예제1] 첫 행의 데이터를 series 형태로 반환.


import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[0])

 

결과값:

codes     HTML

costs    10000

Name: 0, dtype: object


[예제2] 첫 행과 두 번째 행의 데이터를 dataframe 형태로 반환.

주의: 대괄호 중첩돼야 함. 즉, 핑크색 코드 빼먹지 않도록 주의.

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[[0,1]])

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

 

 

명명된 인덱스 (Named Indexes)

 

index 매개변수 이용해, 행(row)에 대해서도 색인 지정 가능.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df) 

 

결과값:

    codes  costs

Lv1  HTML  10000

Lv2   CSS  20000

Lv3    JS  30000

 

명명된 인덱스 찾기

※ 행(row)에 지정된 색인 이용해 특정 행에 접근 가능.

df.loc[index]

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df.loc["Lv2"])

 

결과값:

codes      CSS

costs    20000

Name: Lv2, dtype: object

 

파일 안 데이터를 DataFrame으로 로드

 

특정 파일 안의 데이터셋 불러오기도 가능. 자세히 보기

 


[예제] 쉼표로 구분된 파일 (= CSV 파일)을 DataFrame에 로드.

 

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

 



분류 제목
pandas Python - Pandas Intro (판다스 소개)
pandas Python - Pandas Start (설치/시작/버전확인)
pandas Python - Pandas Series (시리즈)
pandas Python - Pandas DataFrames (데이터프레임)
pandas Python - Pandas Read CSV (CSV 읽기)
pandas Python - Pandas Read JSON (JSON 읽기)
pandas Python - Pandas Analyzing DataFrames (데이터프레임 분석)
pandas Python - Pandas Cleaning Data (데이터 청소/정리)
pandas Python - Pandas Data Correlations (데이터 상관관계)
pandas Python - Pandas Plotting (플로팅) - 다이어그램 그리기
목록
찾아주셔서 감사합니다. Since 2012