티스토리 뷰
구글 검색창에 키워드를 입력하여 크롤링 정보를 얻기 위해서 셀레니움을 이용하는 파이썬 웹 크롤링 연습 예제입니다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 | from bs4 import BeautifulSoup from urllib.parse import quote_plus from selenium import webdriver import csv def get_soup(target_url, plus_url): driver = webdriver.Chrome() driver.get(target_url) html = driver.page_source soup = BeautifulSoup(html, 'html.parser') r = soup.select('.r') searchList = [] for i in r: temp = [] temp.append(i.select_one('.LC20lb.DKV0Md').text) temp.append(i.a.attrs['href']) searchList.append(temp) f = open(f'{plus_url}.csv', 'w', encoding='utf-8', newline='') csvWriter = csv.writer(f) for i in searchList: csvWriter.writerow(i) f.close() driver.close() base_url = 'https://www.google.com/search?q=' plus_url = input('검색어를 입력해주세요:') target_url = base_url + quote_plus(plus_url) get_soup(target_url, plus_url) | cs |
'개발 > Python 웹 크롤링' 카테고리의 다른 글
| 파이썬 웹 크롤링 연습 예제 #5 (0) | 2020.03.02 |
|---|---|
| 파이썬 웹 크롤링 연습 예제 #4 (0) | 2020.03.02 |
| 파이썬 웹 크롤링 연습 예제 #3 (0) | 2020.03.02 |
| 파이썬 웹 크롤링 연습 예제 #2 (0) | 2020.03.02 |
| 웹 크롤링을 위한 파이썬 설치 및 환경 설정 (0) | 2020.03.02 |
댓글
