Python/Pandas

[Pandas] 데이터 조회

yeonny_do 2023. 11. 10. 18:10

 

■ 데이터 준비 

  ○ numpy의 random 패키지를 이용하여 값을 만들어줌

 

 
import pandas as pd
import numpy as np

data = np.random.randint(100, size=(10,10))
df = pd.DataFrame(data,index=list('abcdefghij'), columns=list('ABCDEFGHIJ'))
display(df)
 

 

 

 

 


■ 열 값 읽기

  : df[열명] or df.열명

 

 
print(df.A)
print(df['A'])
 

 

 

○ 결과는 Series객체로 반환

○ type : Series => 복수개 인자 전달 불가능

 

 

 

 

 
print(df[['A','B']])
print(type(df[['A']]))
 

 

 

○ 컬럼 이름을 리스트로 전달하면 결과는 dataframe 형태로 반환됨

 


■ 행 값 읽기

  : df.loc[행명]

 

 
df.loc['a']
 

 

 

  ○ 여러 개의 행 값 읽기 : 행이름을 리스트로 전달

 

 
df.loc[['a','c','e']]
 

 

 

 


■ df.head() , df.tail()

 

  ○ 상위(하위) n개의 행을 선택

  ○ 매개변수로 숫자를 전달하지 않으면 디폴트가 5임

 

 
df.head()
 

 

 

 

 

 
df.head(2)
 

 

 

 

 

 
df.tail()
 

 

 

 


■ df.sample()

  : n개의 랜덤데이터 추출

 

 
df.sample(2)
 

 

 

  -> 임의의 2개의 행 반환