프로그래밍/before

파이썬 인스타그램 크롤링 이미지 다운로드 beautifulsoup, selenium 사용법

김플 2020. 3. 8. 21:45
반응형

파이썬 인스타그램 크롤링 이미지 다운로드 beautifulsoup, selenium 사용법

파이썬으로 인스타그램(instagram)을 크롤링하여 이미지를 한번에 다운받는 프로그램을 만드는 강의입니다. beautifulsoup와 selenium을 사용하여 자바스크립트(javascript)로 만들어진 웹사이트를 크롤링 하는 방법을 배웁니다.


-파이썬 웹 크롤링 예제-

파이썬 beautifulsoup 크롤링 예제 네이버 블로그 검색결과 크롤러 만들기 https://youtu.be/hKApZHK_fOQ

파이썬 크롤링 예제 네이버 이미지 검색결과 한번에 다운로드 프로그램 https://youtu.be/_wRTyQYjHcg


유튜브 김플 스튜디오에 방문하시면 더 많은 파이썬 강의를 보실수 있습니다.

프로그래머 김플 스튜디오 유튜브 Go!


# 소스코드 - 자세한 사용법은 유튜브 영상을 참조하세요.
from urllib.request import urlopen
from urllib.parse import quote_plus
from bs4 import BeautifulSoup
from selenium import webdriver
import time

baseUrl = 'https://www.instagram.com/explore/tags/'
plusUrl = input('검색할 태그를 입력하세요 : ')
url = baseUrl + quote_plus(plusUrl)

driver = webdriver.Chrome()
driver.get(url)

time.sleep(3)

html = driver.page_source
soup = BeautifulSoup(html)

insta = soup.select('.v1Nh3.kIKUG._bz0w')

n = 1
for i in insta:
    print('https://www.instagram.com'+ i.a['href'])
    imgUrl = i.select_one('.KL4Bh').img['src']
    with urlopen(imgUrl) as f:
        with open('./img/' + plusUrl + str(n) + '.jpg', 'wb') as h:
            img = f.read()
            h.write(img)
    n += 1
    print(imgUrl)
    print()

driver.close()


반응형

▼웹크롤링&자동화를 제대로 배워보고 싶다면?▼

 

실습으로 끝장내는 파이썬 웹 크롤링과 웹 페이지 자동화 - 인프런 | 강의

쉬운 설명과 다양한 실습으로 어떠한 사이트라도 원하는 대로 파이썬(Python) 웹 크롤링을 할 수 있게 됩니다., - 강의 소개 | 인프런...

www.inflearn.com