Python-이론/python-인공지능2(38)
-
python으로 데이터 다운받기 - BeautifulSoup로 스크레이핑하기
BeautifulSoap 이용하기 BeautigulSoup는 Html과 xml을 분석해주는 라이브러리입니다. 우선은 설치부터 해보겠습니다. pip를 이용해서 다운 받을 수 있다. 가장 간단한 방법으로 사용해보자!!! from bs4 import BeautifulSoup soup = BeautifulSoup(html,'html.parser') h1 = soup.html.body.h1 p1 = soup.html.body.p p2 = p1.next_sibling.next_sibling print("h1: ",h1.string) print("p1: ",p1.string) print("p2: ",p2.string) 가장 주의해야할 부분들은 BeautifulSoap를 통해 객체를 만들엊 줄 때 인자를 처음은 htm..
2018.03.08 -
python으로 데이터 다운로드 하기 - urllib 모듈 이용하기
urllib을 이용하여 웹의 데이터 다운받기 urllib은 url을 다루는 메소드를 모아 놓은 라이브러리입니다. 그중에서도 request라는 메소드를을 통해서 웹사이트의 데이터를 다운받을 수 있습니다. 예제 1 이미지 다운받기 from urllib import request url = "http://cfs4.tistory.com/upload_control/download.blog?fhandle=YmxvZzEyNDM3NEBmczQudGlzdG9yeS5jb206L2F0dGFjaC8wLzA5MDAwMDAwMDAwMC5qcGc%3D" savename = "test.png" request.urlretrieve(url,savename) print("저장되었습니다.") 다운받을 이미지 url을 통해 이미지를 다운받는..
2018.03.07