# gapminder.tsv 파일을 읽어서 데이터 프레임 생성import pandas as pd df = pd.read_csv('gapminder.tsv', sep= '\t', encoding='UTF-8')print(df.iloc[0:5]) country continent year lifeExp pop gdpPercap0 Afghanistan Asia 1952 28.801 8425333 779.4453141 Afghanistan Asia 1957 30.332 9240934 820.8530302 Afghanistan Asia 1962 31.997 10267083 853.1007103 Afghanistan Asia 1967 34.020 11537966 836.1971384 Afghanistan Asia 1..
Python/Python기초
import osimport pandas as pdfile_path = os.path.join('..', 'scratch08', 'mpg.csv')df = pd.read_csv(file_path)print(df) manufacturer model displ year cyl ... drv cty hwy fl class0 audi a4 1.8 1999 4 ... f 18 29 p compact1 audi a4 1.8 1999 4 ... f 21 29 p compact2 audi a4 2.0 2008 4 ... f 20 31 p compact3 audi a4 2.0 2008 4 ... f 21 30 p compact4 audi a4 2.8 1999 6 ... f 16 26 p compact.. ... ... ..
import csv# 문자열(string)을 아이템으로 갖는 리스트 # 문자열(string)을 아이템으로 갖는 리스트row1 = ['test1', 'success', 'Mon']row2 = ['test2', 'failure, kind of', 'Tue']row3 = ['test3', 'success, kind of', 'Wed']result = [row1, row2, row3]print(result) [['test1', 'success', 'Mon'], ['test2', 'failure, kind of', 'Tue'], ['test3', 'success, kind of', 'Wed']] # 파일을 쓰기 모드로 열기# csv 파일을 쓸(write) 때는 불필요한 라인이 써지지 않도록 하기 위해서# 파일을 ..
선형 회귀(Linear Regression)모델 y = ax + b에서, 기울기(slope) a와 y절편 b를 찾는 문제. (a, b)를 특정 값으로 가정했을 때의 예상값과 실제값 사이의 오차들의제곱의 합을 최소로 하는 파라미터 a와 b를 찾는 문제임. 실제값: (x, y)예상값: y_hat = theta1 * x + theta2오차: e = y_hat - y = theta1 * x + theta2 - y오차 제곱: f = e**2 = (theta1 * x + theta2 - y)**2기울기 theta1에 대한 편미분: df/dt1 ~ e * xy절편 theta2에 대한 편미분: df/dt2 ~ e 1) 확률적 경사 하강법(Stochastic Gradient Descent)2) 배치 경사 하강법(Batc..