"""icrawler 패키지를 이용해서, Google 이미지 검색 결과의 이미지들을 다운로드> pip install icrawler"""from icrawler.builtin import GoogleImageCrawlerimport os# 이미지 저장 폴더 경로save_dir = os.path.join('..', '..', 'images')# GoogleImageCrawler 객체 생성google_crawler = GoogleImageCrawler(storage={'root_dir': save_dir})google_crawler.crawl(keyword='펭수', max_num=50)결과>> 위의 결과는 images.google.com에서 '펭수' 검색 결과를 가져온 것이다.그 밖에 여러 검색 조건을 파라미터를 통하여 설정할 수 있다. # 검색 필터링(filter) 조건들filters = { 'size': 'large', 'license': 'noncommercial,modify', # 비상업용도, 수정 가능 'color': 'blackandwhite' }# GoogleImageCrawler 객체 생성google_crawler = GoogleImageCrawler(storage={'root_dir': save_dir})google_crawler.crawl(keyword='cat', max_num=50, filters=filters)추천 웹크롤링 패키지+ Scrapy
'Python > Python기초' 카테고리의 다른 글
Python 67_ 파이썬으로 kNN 직접 구현하기 (2) | 2020.02.21 |
---|---|
Python 66_ scikit-learn 패키지를 이용한 kNN(k Nearest Neighbor: 최근접 이웃) (0) | 2020.02.20 |
Python 64_ 파이썬 웹 크롤링2_ 다음 뉴스 기사 크롤링 (5) | 2020.02.18 |
Python 63_ web crawlilng 파이썬 웹 크롤링하기 (0) | 2020.02.17 |
Python 62_ pandas_ agg vs apply (0) | 2020.02.14 |