Python/Pandas
[Pandas] 데이터 조회
yeonny_do
2023. 11. 10. 18:10
■ 데이터 준비
○ numpy의 random 패키지를 이용하여 값을 만들어줌
import pandas as pd
import numpy as np
data = np.random.randint(100, size=(10,10))
df = pd.DataFrame(data,index=list('abcdefghij'), columns=list('ABCDEFGHIJ'))
display(df)
■ 열 값 읽기
: df[열명] or df.열명
print(df.A)
print(df['A'])
○ 결과는 Series객체로 반환
○ type : Series => 복수개 인자 전달 불가능
print(df[['A','B']])
print(type(df[['A']]))
○ 컬럼 이름을 리스트로 전달하면 결과는 dataframe 형태로 반환됨
■ 행 값 읽기
: df.loc[행명]
df.loc['a']
○ 여러 개의 행 값 읽기 : 행이름을 리스트로 전달
df.loc[['a','c','e']]
■ df.head() , df.tail()
○ 상위(하위) n개의 행을 선택
○ 매개변수로 숫자를 전달하지 않으면 디폴트가 5임
df.head()
df.head(2)
df.tail()
■ df.sample()
: n개의 랜덤데이터 추출
df.sample(2)
-> 임의의 2개의 행 반환