반응형
파이썬 셀레니움(selenium)과 뷰티풀수프(beautifulsoup)를 사용하여 네이버 크롤링 하는 예제 강의입니다.
원하는 키워드로 네이버 view 탭에 접속한 다음 스크롤 하여 원하는 만큼의 검색 결과를 스크래핑합니다.
이 강의에서 사용하는 파이썬은 3.10.6 버전이며 편집기는 vscode입니다.
사용하는 패키지는 beautifulsoup, selenium입니다.
from bs4 import BeautifulSoup
from selenium import webdriver
import time
base_url = "https://search.naver.com/search.naver?where=view&sm=tab_jum&query="
keyword = input("검색어를 입력하세요 : ")
search_url = base_url + keyword
driver = webdriver.Chrome()
driver.get(search_url)
time.sleep(3)
for i in range(5):
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(2)
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")
# items = soup.select(".api_txt_lines.total_tit")
# for e, item in enumerate(items, 1):
# print(f"{e} : {item.text}")
items = soup.select(".total_wrap.api_ani_send")
for rank_num, item in enumerate(items, 1):
print(f"<<{rank_num}>>")
ad = item.select_one(".link_ad")
if ad:
print("광고입니다.")
continue
blog_title = item.select_one(".sub_txt.sub_name").text
print(f"{blog_title}")
post_title = item.select_one(".api_txt_lines.total_tit._cross_trigger")
print(f"{post_title.text}")
print(f"{post_title.get('href')}")
print(f"{post_title['href']}")
print()
driver.quit()
자세한 사용법은 아래 영상을 참고 바랍니다.
https://youtu.be/FVA_lqbqWiM
반응형
'프로그래밍 > 2022' 카테고리의 다른 글
파이썬 독학 웹 크롤링 멜론 TOP100 실시간 차트 순위 검색 결과 가져오기 - beautifulsoup, requests 기초 사용법 (0) | 2023.04.24 |
---|---|
파이썬 selenium 4(셀레니움4) 최신 버전 find_element 사용법 마스터 (0) | 2023.02.07 |
파이썬 beautifulsoup, requests 사용법 - 네이버 웹 크롤링 코드 20줄로 view 탭 검색 결과 자세히 가져오기 (0) | 2023.02.07 |
파이썬(python) 셀레니움(selenium) 크롬 웹 드라이버 웹페이지 모바일 버전으로 접속하는 방법 (0) | 2023.02.07 |
파이썬(python) 셀레니움(selenium) 크롬 기타 프로필 사용 방법 (0) | 2023.02.07 |