본문 바로가기
반응형

빅데이터4

파이썬(python) - koNLPy(코엔엘파이) 설치하기 1. KoNLPy 설치 방법 한글 형태소 분석을 하기 위해서는 koNLPy(코엔엘파이)가 필요하더군요. 아래 사이트에 접속하여 설치를 진행하려고 하니 설치전 체크사항이 있었습니다. https://konlpy-ko.readthedocs.io/ko/v0.4.3/install/ 설치하기 — KoNLPy 0.4.3 documentation 주석 설치 및 사용 도중 문제가 발생하는 경우 다음 페이지들을 참고해주세요: 리눅스. 맥 OS. 윈도우. 발생한 문제가 어디에도 없는 경우 “New Issue” 버튼을 눌러 새로운 이슈를 생성해주시기 바랍니다. 각 머신 별 테스팅 로그는 이 곳 에서 보실 수 있습니다. konlpy-ko.readthedocs.io 1) KoNLPy 설치전 체크사항 Java 1.7+이 설치되어 .. 2020. 2. 28.
[파이썬][기초][크롤링]HTML 구조-"find_all()"를 이용한 데이터 스크래핑 [파이썬][기초][크롤링]HTML 구조-"find_all()"를 이용한 데이터 스크래핑 예제 ㅁ 필수 설치 패키지 1) BeautifulSoup 설치 - 명령어 : pip3 install BeautifulSoup ㅁ 소스코드 - 복사해서 실행 가능합니다. # 라이브러리 읽기 from bs4 import BeautifulSoup # 분석하고 싶은 HTML html = """ naver daum """ #html 분석하기 soup = BeautifulSoup(html, 'html.parser') #find_all() 메서드로 원하는 부분 추출하기 links = soup.find_all("a") #출력 for a in links: href = a.attrs['href'] text = a.string print.. 2018. 10. 26.
[파이썬][기초][크롤링]HTML 구조-"id요소"를 이용한 데이터 스크래핑 BeautifulSoup 을 이용하여 HTML의 id요소 정보를 통해 스크래핑 하는 예제 ㅁ 필수 설치 패키지 1) BeautifulSoup 설치 - 명령어 : pip3 install BeautifulSoup ㅁ 소스코드 - 복사해서 실행 가능합니다.# 라이브러리 읽기from bs4 import BeautifulSoup # 분석하고 싶은 HTMLhtml = """웹 페이지를 분석하는것웹 페이지를 추하는것""" #html 분석하기soup = BeautifulSoup(html, 'html.parser') #find() 메서드로 원하는 부분 추출하기title = soup.find("h1")body = soup.find("body") #출력print(title)print(body) ㅁ 실행결과 - 실행방법 : .. 2018. 10. 26.
[파이썬][기초][크롤링]HTML 구조-"태그"를 이용한 데이터 스크래핑 BeautifulSoup 을 이용하여 HTML의 태그정보를 통해 스크래핑 하는 예제 ㅁ 필수 설치 패키지 1) BeautifulSoup 설치 - 명령어 : pip3 install BeautifulSoup ㅁ 소스코드 - 복사해서 실행 가능합니다.# 라이브러리 읽기from bs4 import BeautifulSoup # 분석하고 싶은 HTMLhtml = """웹 페이지를 분석하는것웹 페이지를 추하는것""" #html 분석하기soup = BeautifulSoup(html, 'html.parser') #원하는 부분 추출h1 = soup.html.body.h1p1 = soup.html.body.pp2 = p1.next_sibling.next_sibling# 위 소스의 next_sibling_next 는 HTML.. 2018. 10. 26.