'Python' 카테고리의 글 목록 (3 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Python (47)

Yeonnnnny

[Pandas] 데이터 프레임 정보 조회

※ 데이터 준비 import numpy as np import pandas as pd data = np.random.randint(100,size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns =list('ABCDEFGHIJ')) display(df) ■ df.dtypes :컬럼별 데이터 타입 조회 print(df.dtypes) ■ df.shape : 데이터 프레임의 모양 print(df.shape) ■ df.count() : 열마다 non-NA 레코드의 개수를 시리즈 형태로 반환 df.count() ■ df.describe() : 데이터 프레임의 기술통계 정보 요약 print(df.describe()) ■ df.info() : 데이..

Python/Pandas 2023. 11. 10. 18:10

[Pandas] 데이터 조회

■ 데이터 준비 ○ numpy의 random 패키지를 이용하여 값을 만들어줌 import pandas as pd import numpy as np data = np.random.randint(100, size=(10,10)) df = pd.DataFrame(data,index=list('abcdefghij'), columns=list('ABCDEFGHIJ')) display(df) ■ 열 값 읽기 : df[열명] or df.열명 print(df.A) print(df['A']) ○ 결과는 Series객체로 반환 ○ type : Series => 복수개 인자 전달 불가능 print(df[['A','B']]) print(type(df[['A']])) ○ 컬럼 이름을 리스트로 전달하면 결과는 dataframe ..

Python/Pandas 2023. 11. 10. 18:10

[Pandas] 개요

- 판다스는 데이터 조작 및 분석을 위해 파이썬 프로그래밍 언어로 작성된 소프트웨어 라이브러리임 - 일명 파이썬의 엑셀이라 불림 - 데이터 전처리에 주로 사용됨 - 시각화 연동되어지는 데이터 셋으로도 활용이 많이됨 - 참고 사이트 : https://pandas.pydata.org ■ pandas 불러오기 - pandas 모듈 미설치 시 (anaconda jupyter 환경) !pip install pandas - pandas 모듈 불러오기 import pandas as pd ■ pandas 에서 사용하는 자료 구조 □ Series - DataFrame 중에서 하나의 column(열 즉, 특성값) 에 해당하는 데이터 - 1차원 데이터 (index, value 2가지 요소로 구성) □ Dataframe - ..

Python/Pandas 2023. 11. 10. 18:09

[Numpy] 배열 생성 - 3

□ np.linspace() : start부터 stop의 범위에서 num개를 균일한 간격으로 데이터를 생성해 배열을 만듦 import numpy as np print(np.linspace(0,2,9)) # 0이상 2이하의 버위에서 9만큼 등분하여 요소들을 설정 ※ matplotlib를 사용해 그래프를 그릴 때 np.linspace() 함수로 값을 줄 수 있음 x = np.linspace(0,np.pi*2, 100) y= np.sin(x) import matplotlib.pyplot as plt plt.plot(x,y) plt.show() □ np.identity() - 지정한 크기의 정방 단위 행렬을 생성 - 정방단위 행렬은 주대각 선의 원소가 모드 1이며 나머지 원소는 모두 0인 정사각형 행렬을 뜻함 ..

Python/Numpy 2023. 11. 10. 18:09

[Numpy] 배열 생성 - 2

■ 배열 생성 - 2 □ np.zeros() - 모든 요소가 0으로 이루어진 지정한 크기의 새로운 배열을 생성 - 2차원 이상의 배열을 만드는 경우에 함수의 매개 값으로 튜플 형태를 입력해야 함 a=np.zeros(4, dtype=int) # dtype = np.int32 (default : float) print(a) # [0 0 0 0] print() b=np.zeros((3,3)) print(b) # [[0. 0. 0.] # [0. 0. 0.] # [0. 0. 0.]] print() #np.zeros_like(ndarray) : 지정된 배열과 같은 형태의 새로운 배열 생성 □ np.zeros_like(ndarray) - 매개변수로 입력된 다차원 배열과 같은 형태이며, 0의 값으로 채워진 새로운 배열..

Python/Numpy 2023. 11. 10. 18:09

[Numpy] 배열 생성 - 1

■ Numpy 특징 1. python의 list가 느린 이유 - 파이썬 리스트는 포인터의 배열임 - 따라서 각각의 객체가 메모리 여기저기에 흩어져 있음 - 그러므로 캐시 활용이 어려움 2. Numpy의 ndarray가 빠른 이유 - 타입을 명시하여 원소의 배열로 데이터 유지 - 다차원 데이터도 연속된 메모리 공간에 할당됨 ■ 배열 생성 - 1 □ array()를 이용한 생성 - python의list나 tuple을 이용해서 numpy의 ndarray를 생성함 - 다차원 배열의 모든 원소는 동일한 데이터 타입을 가져야 함 ○ 정수형 - int64,int32, int16, int8, uint64형이 있음 - int 64 : -2^63 ~ 2^63-1 까지의 정수 표현 - uint64 : 0~2^64-1 까지의..

Python/Numpy 2023. 11. 10. 18:08

[Numpy] 기본 축의 개념 vs 행렬 연산 시 축의 개념

■ '축' numpy에서는 다차원 배열의 계산을 간편하게 한다는 큰 장점이 있다. 그런데 행렬을 연산할 때 축의 개념이 본래 알던 축의 개념과는 조금 달라 혼란이 생길 수 있다. 기본적인 행렬의 축의 개념은 아래와 같다. 행은 행렬에서 → 방향이므로 행의 축은 0이다. 열은 ↓ 방향이므로 열의 축은 1이다. 하지만, 다차원 행열 계산에 적합한 numpy에서는 모듈 내 함수에서 축을 가리키는 axis라는 옵션이 존재한다. 그런데 axis는 2차원 행렬 연산( 결합이나 변형) 시에, 행 별 계산을 하고자 할 때는 axis=1, 열별 계산을 할 때는 axis=0이라는 옵션을 걸어줘야 한다. 3차원 행렬에서는 깊이의 계산 시에는 axis=0, 열별 계산 시에는 axis=1, 행별 계산 시에는 axis=2라는 옵..

Python/Numpy 2023. 11. 10. 18:08

[python] 클래스(Class) - 2

■ 은닉(Encapsulation) - class의 내부구조를 숨긴다는 뜻 - property를 이용한 setter, getter ▶ 필드에 접근할 때 getter/setter 메서드를 이용하지 않고 직접 필드를 호출하여 사용 가능 ▶ 하지만 내부적으로는 getter/setter 메서드를 통해 값을 읽고 쓰게 됨 class Mydate: def __init__(self,month): self.__inner_month = month def getMonth(self): print('getMonth() call') return self.__inner_month def setMonth(self): if 1

Python 2023. 10. 29. 18:11

이전 Prev 1 2 3 4 5 6 Next 다음

목록Python (47)

Yeonnnnny

티스토리툴바