'Python/Pandas' 카테고리의 글 목록 (2 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Python/Pandas (14)

Yeonnnnny

[Pandas] 데이터 프레임 조작

1. 새로운 행 또는 열 추가 - DataFrame 에 새로운 열 추가 - df[새로운 컬럼명] = 데이터 목록(value) - 기존에 존재하는 컬럼명이면 안됨 - 데이터 목록은 데이터 프레임의 다른 컬럼들의 원소와 같은 개수여야 함 - 데이터 목록 타입 : list, Series, ndarray - DataFrame 에 새로운 행 추가 - df.loc[새로운 행이름] = 데이터 목록(value) - 데이터 목록은 기존 DataFrame의 컬럼의 개수와 컬럼 별 타입이 같아야 함 ※ 데이터 준비 import pandas as pd import numpy as np df= pd.DataFrame([[1,2,3],[7,8,9],[13,14,15]],index=list('ABC'),columns=list('a..

Python/Pandas 2023. 11. 12. 19:11

[Pandas] 데이터 수정 및 정렬

※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ 데이터 수정 □ 컬럼 수정 df['E'] = 0 df □ .at ['행이름','열이름] 함수로 배열의 원소를 접근해서 원소의 값을 변경 df.at['e','E'] =1 df □ .loc함수로 행의 값들을 슬라이싱해서 값 변경 df.loc['d':'f']=0 df ※ 데이터 준비 np.random.seed(0) df = pd.DataFrame(np.random.randint(100,s..

Python/Pandas 2023. 11. 11. 15:30

[Pandas] 인덱싱, 슬라이싱

※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ 인덱싱 vs. 슬라이싱 인덱싱 (Indexing) : '가리킨다'는 의미 슬라이싱 (slicing) : '잘라낸다'는 의미 예를 들어, a = 'Life is too short, you need to pay attention ' 이라는 문자열이 존재한다고 가정해보자. 문자열 인덱싱은, >>> a = 'Life is too short, you need to pay attention '..

Python/Pandas 2023. 11. 10. 19:54

[Pandas] 데이터 프레임 정보 조회

※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ df.dtypes :컬럼별 데이터 타입 조회 print(df.dtypes) ■ df.shape : 데이터 프레임의 모양 print(df.shape) ■ df.count() : 열마다 non-NA 레코드의 개수를 시리즈 형태로 반환 df.count() ■ df.describe() : 데이터 프레임의 기술통계 정보 요약 print(df.describe()) ■ df.info() : 데이..

Python/Pandas 2023. 11. 10. 18:10

[Pandas] 데이터 조회

■ 데이터 준비 ○ numpy의 random 패키지를 이용하여 값을 만들어줌 import pandas as pd import numpy as np data = np.random.randint(100, size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns=list('ABCDEFGHIJ')) display(df) ■ 열 값 읽기 : df[열명] or df.열명 print(df.A) print(df['A']) ○ 결과는 Series객체로 반환 ○ type : Series => 복수개 인자 전달 불가능 print(df[['A','B']]) print(type(df[['A']])) ○ 컬럼 이름을 리스트로 전달하면 결과는 dataframe ..

Python/Pandas 2023. 11. 10. 18:10

[Pandas] 개요

- 판다스는 데이터 조작 및 분석을 위해 파이썬 프로그래밍 언어로 작성된 소프트웨어 라이브러리임 - 일명 파이썬의 엑셀이라 불림 - 데이터 전처리에 주로 사용됨 - 시각화 연동되어지는 데이터 셋으로도 활용이 많이됨 - 참고 사이트 : https://pandas.pydata.org ■ pandas 불러오기 - pandas 모듈 미설치 시 (anaconda jupyter 환경) !pip install pandas - pandas 모듈 불러오기 import pandas as pd ■ pandas 에서 사용하는 자료 구조 □ Series - DataFrame 중에서 하나의 column(열 즉, 특성값) 에 해당하는 데이터 - 1차원 데이터 (index, value 2가지 요소로 구성) □ Dataframe - ..

Python/Pandas 2023. 11. 10. 18:09

이전 Prev 1 2 Next 다음

목록Python/Pandas (14)

Yeonnnnny

티스토리툴바