목차
DataFrame 정의
행 찾기 (Locate Row)
명명된 인덱스 (Named Indexes)
명명된 인덱스 찾기
파일 안 데이터를 DataFrame으로 로드
DataFrame 정의
1.
행 (row)과 열(column) 구조로 된 2차원 데이터 구조.
※ 행 (row) : 가로선 기준.
※ 열 (column) : 세로선 기준. (각 열을 Series라고 함.)
2.
Series (= 1개 열에 해당하는 데이터)가 2개 이상 모여 구성된
다차원 배열에 해당.
[예제]
import pandas as pd
data = {
"codes": ["HTML", "CSS", "JS"],
"costs": [10000, 20000, 30000]
}
df= pd.DataFrame(data)
print(df)
결과값:
codes costs
0 HTML 10000
1 CSS 20000
2 JS 30000
행 찾기 (Locate Row)
DataFrame의 n행 데이터
df .loc[ n -1]
※ df : 데이터프레임.
※ n : 행(row) 색인. (0부터 시작. 첫 행:0, 두 번재 행:1, ...)
[예제1] 첫 행의 데이터를 series 형태로 반환.
import pandas as pd
data = {
"codes": ["HTML ", "CSS", "JS"],
"costs": [10000 , 20000, 30000]
}
df = pd.DataFrame(data)
print(df.loc[0] )
결과값:
codes HTML
costs 10000
Name: 0, dtype: object
[예제2] 첫 행과 두 번째 행의 데이터를 dataframe 형태로 반환.
주의: 대괄호 중첩돼야 함. 즉, 핑크색 코드 빼먹지 않도록 주의.
import pandas as pd
data = {
"codes": ["HTML", "CSS" , "JS"],
"costs": [10000, 20000 , 30000]
}
df = pd.DataFrame(data)
print(df.loc[[ 0,1] ] )
결과값:
codes costs
0 HTML 10000
1 CSS 20000
명명된 인덱스 (Named Indexes)
index 매개변수 이용해, 행(row)에 대해서도 색인 지정 가능.
[예제]
import pandas as pd
data = {
"codes": ["HTML", "CSS", "JS"],
"costs": [10000, 20000, 30000]
}
df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"] )
print(df)
결과값:
codes costs
Lv1 HTML 10000
Lv2 CSS 20000
Lv3 JS 30000
명명된 인덱스 찾기
※ 행(row)에 지정된 색인 이용해 특정 행에 접근 가능.
df .loc[index ]
[예제]
import pandas as pd
data = {
"codes": ["HTML", "CSS", "JS"],
"costs": [10000, 20000, 30000]
}
df = pd.DataFrame(data, index = ["Lv1", "Lv2", "Lv3"] )
print(df.loc["Lv2"] )
결과값:
codes CSS
costs 20000
Name: Lv2, dtype: object
파일 안 데이터를 DataFrame으로 로드
특정 파일 안의 데이터셋 불러오기도 가능. 자세히 보기
[예제] 쉼표로 구분된 파일 (= CSV 파일)을 DataFrame에 로드.
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
주소 복사
랜덤 이동
최신댓글