반응형
BeautifulSoup 을 이용하여 HTML의 id요소 정보를 통해 스크래핑 하는 예제
ㅁ 필수 설치 패키지
1) BeautifulSoup 설치
- 명령어 : pip3 install BeautifulSoup
ㅁ 소스코드
- 복사해서 실행 가능합니다.
# 라이브러리 읽기
from bs4 import BeautifulSoup
# 분석하고 싶은 HTML
html = """
<html><body>
<h1><웹페이지분석></h1>
<p>웹 페이지를 분석하는것</p>
<p>웹 페이지를 추하는것</p>
</body></html>
"""
#html 분석하기
soup = BeautifulSoup(html, 'html.parser')
#find() 메서드로 원하는 부분 추출하기
title = soup.find("h1")
body = soup.find("body")
#출력
print(title)
print(body)
ㅁ 실행결과
- 실행방법 : CMD 창에 들어가서 .py로 저장한 소스를 실행 시켜 주시면 됩니다.
◈ 참조
출처 : 파이썬을 이용한 머신러닝, 딥러닝 실전개발 입문 책 참조
저자 : 쿠지라 히코우즈쿠에 지음
옮김 : 윤인성 옮김
반응형
'IT > 파이썬' 카테고리의 다른 글
파이썬[python] - 엑셀 읽고 쓰기 : openpyxl (19) | 2020.03.05 |
---|---|
파이썬(python) - koNLPy(코엔엘파이) 설치하기 (3) | 2020.02.28 |
[파이썬][기초][크롤링]BeautifulSoup 을 이용하여 기상청 스크래핑 (0) | 2018.10.26 |
[파이썬][기초][크롤링]HTML 구조-"find_all()"를 이용한 데이터 스크래핑 (0) | 2018.10.26 |
[파이썬][기초][크롤링]HTML 구조-"태그"를 이용한 데이터 스크래핑 (0) | 2018.10.26 |
댓글