import requestsfrom bs4 import BeautifulSoup # 접속할 사이트(웹 서버) 주소url = 'https://search.daum.net/search?w=news&q=%EB%A8%B8%EC%8B%A0%20%EB%9F%AC%EB%8B%9D&DA=YZR&spacing=0' # 사이트(웹 서버)로 요청(request)를 보냄html = requests.get(url).text.strip() # 요청의 결과(응답, response - HTML)를 저장# print(html[0:100]) # 전체 문자열에서 100자만 확인 # BeautifulSoup 객체를 생성soup = BeautifulSoup(html, 'html5lib') # HTML 문서의 모든 링크에 걸려 있는 주소들을 ..
Python/Python기초
파이썬으로 HTML 문서 분석:설치해야할 패키지(pip install package-name)1) beautifulsoup4: HTML 요소들을 분석하는 패키지2) html5lib: HTML 문서를 parsing(분석)3) requests: HTTP 요청(request)을 보내고, 서버로부터 응답(response)을 받는 기능을 담당. web01.html----------------------------------------------------------------------------------------------------------------- 처음 작성하는 HTML HTML: HyperText Markup Language 여기는 paragraph입니다. 여기는 division입니다. 다음 카카..
import numpy as npimport pandas as pd np.random.seed(1)df = pd.DataFrame({ 'pop': np.random.randint(1, 10, 4), # 1~ 10 범위의 난수 4개 'income': np.random.randint(1, 10, 4), # 1~10 범위의 난수 4개 }, index=['a', 'b', 'c', 'd'])print(df) pop incomea 6 1b 9 2c 6 8d 1 7 # agg(aggregate): DataFrame의 축(axis)을 기준으로 통계량을 집계(aggregate)하기 위한 함수# 통계량(statistics): 합계(sum), 평균(mean), 분산(var), 표준편차(std),# 최솟값(min), 최댓값(..
import numpy as npimport pandas as pd def squares(x): return x ** 2 def doubles(x): return x * 2 result1, result2 = squares(3), doubles(3)print(result1, result2)9 6 array = np.array([1, 2, 3])result1 = squares(array) # np.array ** 2result2 = doubles(array) # np.array * 2print(result1, result2)[1 4 9] [2 4 6] df = pd.DataFrame({'a': [1, 2, 3],'b': [4, 5, 6]})print(df)print(squares(df)) a b0 1 41 ..