• 회원가입
  • 로그인
  • 구글아이디로 로그인

[pandas] Python - Pandas DataFrames (데이터프레임)

722  
목차
  1. DataFrame 정의
  2. 행 찾기 (Locate Row)
  3. 명명된 인덱스 (Named Indexes)
  4. 명명된 인덱스 찾기
  5. 파일 안 데이터를 DataFrame으로 로드

 

DataFrame 정의

 

1.

행 (row)과 열(column) 구조로 된 2차원 데이터 구조.

※ 행 (row) : 가로선 기준.

※ 열 (column) : 세로선 기준. (각 열을 Series라고 함.)

 

2.

Series (= 1개 열에 해당하는 데이터)가 2개 이상 모여 구성된

다차원 배열에 해당.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df= pd.DataFrame(data)

print(df)

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

2    JS  30000

 

행 찾기 (Locate Row)

 

DataFrame의 n행 데이터

df.loc[n-1]

 

df : 데이터프레임.

n : 행(row) 색인. (0부터 시작. 첫 행:0, 두 번재 행:1, ...)

 


[예제1] 첫 행의 데이터를 series 형태로 반환.


import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[0])

 

결과값:

codes     HTML

costs    10000

Name: 0, dtype: object


[예제2] 첫 행과 두 번째 행의 데이터를 dataframe 형태로 반환.

주의: 대괄호 중첩돼야 함. 즉, 핑크색 코드 빼먹지 않도록 주의.

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data)

print(df.loc[[0,1]])

 

결과값:

  codes  costs

0  HTML  10000

1   CSS  20000

 

 

명명된 인덱스 (Named Indexes)

 

index 매개변수 이용해, 행(row)에 대해서도 색인 지정 가능.

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df) 

 

결과값:

    codes  costs

Lv1  HTML  10000

Lv2   CSS  20000

Lv3    JS  30000

 

명명된 인덱스 찾기

※ 행(row)에 지정된 색인 이용해 특정 행에 접근 가능.

df.loc[index]

 


[예제]

 

import pandas as pd

data = {

  "codes": ["HTML", "CSS", "JS"],

  "costs": [10000, 20000, 30000]

}

df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"])

print(df.loc["Lv2"])

 

결과값:

codes      CSS

costs    20000

Name: Lv2, dtype: object

 

파일 안 데이터를 DataFrame으로 로드

 

특정 파일 안의 데이터셋 불러오기도 가능. 자세히 보기

 


[예제] 쉼표로 구분된 파일 (= CSV 파일)을 DataFrame에 로드.

 

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

 



분류 제목
module Python - math.log() 메서드 -
module Python - math.log10() 메서드 -
module Python - math.log1p() 메서드 -
module Python - math.log2() 메서드 -
module Python - math.perm() 메서드 -
module Python - math.pow() 메서드 ★ - 승수값 (= 누승값 = pow메서드 = 포오 = 파워)
module Python - math.prod() 메서드 -
module Python - math.radians() 메서드 -
module Python - math.remainder() 메서드 ★ - 나머지 반환. (= remainder메서드 = …
module Python - math.sin() 메서드 -
module Python - math.sinh() 메서드 -
module Python - math.sqrt() 메서드 -
module Python - math.tan() 메서드 -
module Python - math.tanh() 메서드 -
module Python - math.trunc() 메서드 ★ - 정수 부분 반환. (= trunc메서드 = 트렁크)
module Python - math.e 상수 - 오일러 상수 (2.71...)
module Python - math.inf 상수 - float 자료형의 무한대 상수 (= inf) 반환.
module Python - math.nan 상수 - float 자료형의 NaN 상수 (= nan) 반환.
module Python - math.pi 상수 - 원주율 (= 3.14...) 반환. (= 파이 상수)
module Python - math.tau 상수 - 원주율 2배 (= 6.28...) 반환. (= 타우 상수)
21/24
목록
찾아주셔서 감사합니다. Since 2012