[파이썬][기초][크롤링]HTML 구조-"find_all()"를 이용한 데이터 스크래핑

[파이썬][기초][크롤링]HTML 구조-"find_all()"를 이용한 데이터 스크래핑 예제

ㅁ 필수 설치 패키지

1) BeautifulSoup 설치

- 명령어 : pip3 install BeautifulSoup

ㅁ 소스코드

- 복사해서 실행 가능합니다.

# 라이브러리 읽기

from bs4 import BeautifulSoup

# 분석하고 싶은 HTML

html = """

<ul>

<li><a href="http://www.naver.com">naver</a><li>

</body></html>

"""

#html 분석하기

soup = BeautifulSoup(html, 'html.parser')

#find_all() 메서드로 원하는 부분 추출하기

links = soup.find_all("a")

#출력

for a in links:

href = a.attrs['href']

text = a.string

print(text , ">", href)

#find_all() 메서드로 모든 <a>태그를 추출합니다

#href 속성은 attrs[]와 같은 형식으로 속성추출합니다.

#내부의 설명텍스트는 string속성으로 추출합니다.

ㅁ 실행결과

- 실행방법 : CMD 창에 들어가서 .py로 저장한 소스를 실행 시켜 주시면 됩니다.

◈ 참조

출처 : 파이썬을 이용한 머신러닝, 딥러닝 실전개발 입문 책 참조

저자 : 쿠지라 히코우즈쿠에 지음

옮김 : 윤인성 옮김

[파이썬][기초][크롤링]HTML 구조-"id요소"를 이용한 데이터 스크래핑

BeautifulSoup 을 이용하여 HTML의 id요소 정보를 통해 스크래핑 하는 예제 ㅁ 필수 설치 패키지 1) BeautifulSoup 설치 - 명령어 : pip3 install BeautifulSoup ㅁ 소스코드 - 복사해서 실행 가능합니다. # 라이..

itforest.tistory.com

파이썬[python] - 엑셀 읽고 쓰기 : openpyxl (19)	2020.03.05
파이썬(python) - koNLPy(코엔엘파이) 설치하기 (3)	2020.02.28
[파이썬][기초][크롤링]BeautifulSoup 을 이용하여 기상청 스크래핑 (0)	2018.10.26
[파이썬][기초][크롤링]HTML 구조-"id요소"를 이용한 데이터 스크래핑 (0)	2018.10.26
[파이썬][기초][크롤링]HTML 구조-"태그"를 이용한 데이터 스크래핑 (0)	2018.10.26