import numpy as npimport pandas as pd np.random.seed(1)df = pd.DataFrame({ 'pop': np.random.randint(1, 10, 4), # 1~ 10 범위의 난수 4개 'income': np.random.randint(1, 10, 4), # 1~10 범위의 난수 4개 }, index=['a', 'b', 'c', 'd'])print(df) pop incomea 6 1b 9 2c 6 8d 1 7 # agg(aggregate): DataFrame의 축(axis)을 기준으로 통계량을 집계(aggregate)하기 위한 함수# 통계량(statistics): 합계(sum), 평균(mean), 분산(var), 표준편차(std),# 최솟값(min), 최댓값(..
pandas
import numpy as npimport pandas as pd # 데이터 프레임 생성np.random.seed(1)df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b', 'a'],'key2': ['one', 'two', 'one', 'two', 'one'],'data1': np.random.randint(0, 10, 5),'data2': np.random.randint(0, 10, 5)})print(df) key1 key2 data1 data20 a one 5 01 a two 8 12 b one 9 73 b two 5 64 a one 0 9 grouped1 = df.groupby(by='key1')print(grouped1) # DataFrameGroupBy 객체 - ..
-- 사용자 계정이 소유한 테이블에 대한 정보를 갖고 있는 테이블: user_tablesdesc user_tables;select * from user_tables;select table_name from user_tables;-- 사용자 계정이 소유한 테이블의 컬럼들에 대한 정보를 갖고 있는 테이블: user_tab_columnsdesc user_tab_columns;select * from user_tab_columns;-- emp 테이블이 가지고 있는 컬럼이름들을 검색select column_name from user_tab_columnswhere table_name = 'EMP'order by column_id; import cx_Oracleimport pandas as pd if __name__..
pandas 데이터 타입Series: 1차원 리스트. 인덱스가 무조건 한 개.DataFrame: 2차원 리스트. 인덱스가 행과 열 두 개를 갖음. import numpy as npimport pandas as pda = pd.Series([1, 3, 5, np.nan, 6, 8])print(type(a)) # Seriesprint(a) # Series에서 특정 인덱스의 아이템을 선택: Series(연산자).[index] 0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64 # Series에서 특정 인덱스의 아이템 선택: Series[index]print(a[0]) # a[0]의 데이터 타입: float64# 인덱스 연산자([]) 안에서 범위 연산자(:)를 사용할 수도 있음pri..