반응형
파이썬 beautifulsoup와 requests를 사용하여 멜론 TOP100에 올라와 있는 차트 순위 곡이름, 가수명, 앨범명을 1위부터 100위까지 전부 가져오는 웹크롤링 독학 실습 영상입니다.
이 강의에서는 자손 태그와 자식 태그를 선택하는 방법, beautifulsoup에서 text와 string의 사용법과 차이점을 배울 수 있습니다.
from bs4 import BeautifulSoup
import requests
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36"
}
url = "https://www.melon.com/chart/index.htm"
r = requests.get(url, headers=headers)
print(r.raise_for_status)
html = r.text
soup = BeautifulSoup(html, "html.parser")
lst50 = soup.select(".lst50")
lst100 = soup.select(".lst100")
lst = lst50 + lst100
print(len(lst))
for e, i in enumerate(lst, 1):
print(f"<<{e}위>>")
title = i.select_one(".ellipsis.rank01 a")
print(title.text)
singers = i.select(".ellipsis.rank02 > a")
for singer in singers:
print(singer.text)
album = i.select_one(".ellipsis.rank03 > a")
print(album.text)
print()
강의에서 사용하는 파이썬은 3.10.6 버전이며 편집기는 vscode입니다.
사용하는 패키지는 beautifulsoup, requests입니다.
자세한 사용법은 아래 강의 영상을 참고 바랍니다.
https://youtu.be/-oS3ItSbTcc
반응형
'프로그래밍 > 2022' 카테고리의 다른 글
vscode 단축키, 사용법 / 비주얼 스튜디오 코드(Visual Studio Code) / 프로그래밍 초보자 코딩 속도 올리기 (0) | 2023.04.24 |
---|---|
파이썬 독학 네이버 OpenAPI 사용 me2.do 단축 url 만들기 (0) | 2023.04.24 |
파이썬 selenium 4(셀레니움4) 최신 버전 find_element 사용법 마스터 (0) | 2023.02.07 |
파이썬 독학 selenium, beautifulsoup 사용법 기초 - 셀레니움 네이버 크롤링 (0) | 2023.02.07 |
파이썬 beautifulsoup, requests 사용법 - 네이버 웹 크롤링 코드 20줄로 view 탭 검색 결과 자세히 가져오기 (0) | 2023.02.07 |