• 회원가입
  • 로그인
  • 구글아이디로 로그인

[pandas] Python - Pandas DataFrames (데이터프레임)

599  
목차
  1. DataFrame 정의
  2. 행 찾기 (Locate Row)
  3. 명명된 인덱스 (Named Indexes)
  4. 명명된 인덱스 찾기
  5. 파일 안 데이터를 DataFrame으로 로드

 

DataFrame 정의

 

1.

행 (row)과 열(column) 구조로 된 2차원 데이터 구조.

※ 행 (row) : 가로선 기준.

※ 열 (column) : 세로선 기준. (각 열을 Series라고 함.)

 

2.

Series (= 1개 열에 해당하는 데이터)가 2개 이상 모여 구성된

다차원 배열에 해당.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df= pd.DataFrame(data)

print(df)

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

2    JS  30000

 

행 찾기 (Locate Row)

 

DataFrame의 n행 데이터

df.loc[n-1]

 

df : 데이터프레임.

n : 행(row) 색인. (0부터 시작. 첫 행:0, 두 번재 행:1, ...)

 


[예제1] 첫 행의 데이터를 series 형태로 반환.


import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[0])

 

결과값:

codes     HTML

costs    10000

Name: 0, dtype: object


[예제2] 첫 행과 두 번째 행의 데이터를 dataframe 형태로 반환.

주의: 대괄호 중첩돼야 함. 즉, 핑크색 코드 빼먹지 않도록 주의.

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[[0,1]])

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

 

 

명명된 인덱스 (Named Indexes)

 

index 매개변수 이용해, 행(row)에 대해서도 색인 지정 가능.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df) 

 

결과값:

    codes  costs

Lv1  HTML  10000

Lv2   CSS  20000

Lv3    JS  30000

 

명명된 인덱스 찾기

※ 행(row)에 지정된 색인 이용해 특정 행에 접근 가능.

df.loc[index]

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df.loc["Lv2"])

 

결과값:

codes      CSS

costs    20000

Name: Lv2, dtype: object

 

파일 안 데이터를 DataFrame으로 로드

 

특정 파일 안의 데이터셋 불러오기도 가능. 자세히 보기

 


[예제] 쉼표로 구분된 파일 (= CSV 파일)을 DataFrame에 로드.

 

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

 



분류 제목
basic Python - Home (입문) - 이념 / 추천 링크
basic Python - Intro (소개) - 용도・특징
basic Python - Start (시작) - 파이썬 설치/실행/버전확인
basic Python - Syntax (구문) - 들여쓰기・변수・주석
basic Python - Comment (주석)
basic Python - Variable (변수)
basic Python - DataType (데이터타입) - 자료형
basic Python - Number (숫자)
basic Python - Casting (데이터 타입 변경) - 자료형 변환
basic Python - String (문자열) ★ ※ 색인번호 (= 인덱스) 개념.
basic Python - Boolean (참거짓)
basic Python - Operator (연산자)
basic Python - List (리스트) ★ - 변경 가능한 모음
basic Python - Tuple (투플/튜플) - 변경 불가 모음
basic Python - Set (셋/세트) - '순서(=색인)' 없고, 중복 허용 않는 데이터 모음.
basic Python - Dictionary (딕셔너리) - Key:value 쌍으로 구성된 모음
basic Python - if...elif...else - (이프조건문) ※ 3항연산자 = 삼항연산자
basic Python - While (와일반복문) - 와일문
basic Python - For (포반복문) ★★★★★
basic Python - Function (함수)
1/24
목록
찾아주셔서 감사합니다. Since 2012