| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- docker
- 파이썬기본문법 #파이썬 #python
- aw3
- redis
- 파이썬 #python #os #os.path #glob
- 파이썬 #python #전역변수 #지역변수 #eval
- 파이썬 #python #가변매개변수 #키워드가변매개변수 #args #kwargs
- 연산자메서드
- 민감 정보 관리
- Git
- PostgreSQL
- 파이썬 #python #docstring
- 파이썬 #python #enumerate
- 배포
- 프로그래머스
- 파이썬 #python #lambda #람다
- aws
- spring boot
- 파이썬 #python #Comprehension
- 파이썬 #python #class #클래스 #상속
- 파이썬 #python #지역함수
- jsonb
- 파이썬 #python #예외처리 #exception
- EC2
- 사용자정의예외
- 파이썬 #python #file #i/o #input #output
- 파이썬 #python #filter #map #reduce
- 약수 수하기
- 파이썬 #python #모듈 #module #import #random #time #calendar #sys
- 파이썬 #python #함수 #function
- Today
- Total
목록Python/Pandas (14)
Yeonnnnny
1. 새로운 행 또는 열 추가 - DataFrame 에 새로운 열 추가 - df[새로운 컬럼명] = 데이터 목록(value) - 기존에 존재하는 컬럼명이면 안됨 - 데이터 목록은 데이터 프레임의 다른 컬럼들의 원소와 같은 개수여야 함 - 데이터 목록 타입 : list, Series, ndarray - DataFrame 에 새로운 행 추가 - df.loc[새로운 행이름] = 데이터 목록(value) - 데이터 목록은 기존 DataFrame의 컬럼의 개수와 컬럼 별 타입이 같아야 함 ※ 데이터 준비 import pandas as pd import numpy as np df= pd.DataFrame([[1,2,3],[7,8,9],[13,14,15]],index=list('ABC'),columns=list('a..
※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ 데이터 수정 □ 컬럼 수정 df['E'] = 0 df □ .at ['행이름','열이름] 함수로 배열의 원소를 접근해서 원소의 값을 변경 df.at['e','E'] =1 df □ .loc함수로 행의 값들을 슬라이싱해서 값 변경 df.loc['d':'f']=0 df ※ 데이터 준비 np.random.seed(0) df = pd.DataFrame(np.random.randint(100,s..
※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ 인덱싱 vs. 슬라이싱 인덱싱 (Indexing) : '가리킨다'는 의미 슬라이싱 (slicing) : '잘라낸다'는 의미 예를 들어, a = 'Life is too short, you need to pay attention ' 이라는 문자열이 존재한다고 가정해보자. 문자열 인덱싱은, >>> a = 'Life is too short, you need to pay attention '..
※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ df.dtypes :컬럼별 데이터 타입 조회 print(df.dtypes) ■ df.shape : 데이터 프레임의 모양 print(df.shape) ■ df.count() : 열마다 non-NA 레코드의 개수를 시리즈 형태로 반환 df.count() ■ df.describe() : 데이터 프레임의 기술통계 정보 요약 print(df.describe()) ■ df.info() : 데이..
■ 데이터 준비 ○ numpy의 random 패키지를 이용하여 값을 만들어줌 import pandas as pd import numpy as np data = np.random.randint(100, size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns=list('ABCDEFGHIJ')) display(df) ■ 열 값 읽기 : df[열명] or df.열명 print(df.A) print(df['A']) ○ 결과는 Series객체로 반환 ○ type : Series => 복수개 인자 전달 불가능 print(df[['A','B']]) print(type(df[['A']])) ○ 컬럼 이름을 리스트로 전달하면 결과는 dataframe ..
- 판다스는 데이터 조작 및 분석을 위해 파이썬 프로그래밍 언어로 작성된 소프트웨어 라이브러리임 - 일명 파이썬의 엑셀이라 불림 - 데이터 전처리에 주로 사용됨 - 시각화 연동되어지는 데이터 셋으로도 활용이 많이됨 - 참고 사이트 : https://pandas.pydata.org ■ pandas 불러오기 - pandas 모듈 미설치 시 (anaconda jupyter 환경) !pip install pandas - pandas 모듈 불러오기 import pandas as pd ■ pandas 에서 사용하는 자료 구조 □ Series - DataFrame 중에서 하나의 column(열 즉, 특성값) 에 해당하는 데이터 - 1차원 데이터 (index, value 2가지 요소로 구성) □ Dataframe - ..