반응형
파이썬 인스타그램 크롤링 이미지 다운로드 beautifulsoup, selenium 사용법
파이썬으로 인스타그램(instagram)을 크롤링하여 이미지를 한번에 다운받는 프로그램을 만드는 강의입니다. beautifulsoup와 selenium을 사용하여 자바스크립트(javascript)로 만들어진 웹사이트를 크롤링 하는 방법을 배웁니다.
-파이썬 웹 크롤링 예제-
파이썬 beautifulsoup 크롤링 예제 네이버 블로그 검색결과 크롤러 만들기 https://youtu.be/hKApZHK_fOQ
파이썬 크롤링 예제 네이버 이미지 검색결과 한번에 다운로드 프로그램 https://youtu.be/_wRTyQYjHcg
유튜브 김플 스튜디오에 방문하시면 더 많은 파이썬 강의를 보실수 있습니다.
프로그래머 김플 스튜디오 유튜브 Go!
# 소스코드 - 자세한 사용법은 유튜브 영상을 참조하세요.
from urllib.request import urlopen
from urllib.parse import quote_plus
from bs4 import BeautifulSoup
from selenium import webdriver
import time
baseUrl = 'https://www.instagram.com/explore/tags/'
plusUrl = input('검색할 태그를 입력하세요 : ')
url = baseUrl + quote_plus(plusUrl)
driver = webdriver.Chrome()
driver.get(url)
time.sleep(3)
html = driver.page_source
soup = BeautifulSoup(html)
insta = soup.select('.v1Nh3.kIKUG._bz0w')
n = 1
for i in insta:
print('https://www.instagram.com'+ i.a['href'])
imgUrl = i.select_one('.KL4Bh').img['src']
with urlopen(imgUrl) as f:
with open('./img/' + plusUrl + str(n) + '.jpg', 'wb') as h:
img = f.read()
h.write(img)
n += 1
print(imgUrl)
print()
driver.close()
반응형
'프로그래밍 > before' 카테고리의 다른 글
파이썬 크롤링 csv 파일저장 방법 네이버 모바일 검색결과 웹스크래핑 (0) | 2020.03.08 |
---|---|
파이썬 여러페이지 크롤링 네이버 블로그 검색결과 웹스크래핑 (1) | 2020.03.08 |
파이썬 강의 람다(lambda) 함수로 딕셔너리 정렬 방법 (0) | 2019.12.12 |
파이썬 강의 딕셔너리 정렬방법 내장함수 sorted 사용법 (0) | 2019.12.12 |
파이썬 강의 람다 lambda 함수 사용법 (0) | 2019.12.12 |