import pandas as pd if __name__ == '__main__': # csv 파일에서 데이터 프레임을 생성 emp_df = pd.read_csv('emp.csv') print(emp_df.iloc[0:5]) # 부서별, 직책별 직원 수를 출력 grouped = emp_df.groupby(['DEPTNO', 'JOB']) emp_by_dept = grouped['EMPNO'] result_df = emp_by_dept.agg('count') print(result_df) EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO0 7369 SMITH CLERK 7902.0 1980-12-17 800.0 NaN 201 7499 ALLEN SALESMAN 7698.0 1..
Python/Python기초
import numpy as npimport pandas as pd # 데이터 프레임 생성np.random.seed(1)df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b', 'a'],'key2': ['one', 'two', 'one', 'two', 'one'],'data1': np.random.randint(0, 10, 5),'data2': np.random.randint(0, 10, 5)})print(df) key1 key2 data1 data20 a one 5 01 a two 8 12 b one 9 73 b two 5 64 a one 0 9 grouped1 = df.groupby(by='key1')print(grouped1) # DataFrameGroupBy 객체 - ..
-- 사용자 계정이 소유한 테이블에 대한 정보를 갖고 있는 테이블: user_tablesdesc user_tables;select * from user_tables;select table_name from user_tables;-- 사용자 계정이 소유한 테이블의 컬럼들에 대한 정보를 갖고 있는 테이블: user_tab_columnsdesc user_tab_columns;select * from user_tab_columns;-- emp 테이블이 가지고 있는 컬럼이름들을 검색select column_name from user_tab_columnswhere table_name = 'EMP'order by column_id; import cx_Oracleimport pandas as pd if __name__..
pandas 데이터 타입Series: 1차원 리스트. 인덱스가 무조건 한 개.DataFrame: 2차원 리스트. 인덱스가 행과 열 두 개를 갖음. import numpy as npimport pandas as pda = pd.Series([1, 3, 5, np.nan, 6, 8])print(type(a)) # Seriesprint(a) # Series에서 특정 인덱스의 아이템을 선택: Series(연산자).[index] 0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64 # Series에서 특정 인덱스의 아이템 선택: Series[index]print(a[0]) # a[0]의 데이터 타입: float64# 인덱스 연산자([]) 안에서 범위 연산자(:)를 사용할 수도 있음pri..