본문 바로가기
반응형

분류 전체보기462

[파이썬3] lxml 설치하기 Beautiful Soup 파싱도구를 더 잘 활용하기 위한 lxml 설치하기 1. (cmd)탐색기에서 C:\파이썬 설치폴더\Scripts의 디렉토리로 이동 2. 명령어 pip install lxml 입력 2017. 1. 6.
[디시인사이드] 김소혜 게시판 댓글 웹 크롤링 from bs4 import BeautifulSoupimport urllib.request if __name__ == "__main__": req = urllib.request.Request("http://gall.dcinside.com/board/lists/?id=kimsohye");data = urllib.request.urlopen(req).read()bs = BeautifulSoup(data, 'html.parser')l = bs.find_all('a')idx = 0 for s in l : try : prop = s.get('class')# get class propertyif prop != None and prop[0] == "icon_pic_n": a = "%s : %s" % (s.get('h.. 2017. 1. 6.
[디시인사이드] 김소혜 게시판 크롤링 from bs4 import BeautifulSoupimport urllib.request if __name__ == "__main__": req = urllib.request.Request("http://gall.dcinside.com/board/lists/?id=kimsohye");data = urllib.request.urlopen(req).read()bs = BeautifulSoup(data, 'html.parser') l = bs.find_all('a')idx = 0 for s in l : try : prop = s.get('class')# get class propertyif prop != None and prop[0] == "icon_pic_n": print("%s : %s" % (s.get.. 2017. 1. 6.
[파이썬3] 파이썬 인터프리터에서 테스트 파이썬버전: 3.6.xxxx뷰티풀수프 버전: 4.5.3.xxxxx툴: Sublime text3 #파이썬 인터프리터에서 웹크롤링 테스트 import urllib.requestfrom bs4 import BeautifulSoup html = urllib.request.urlopen('http://naver.com')soup = BeautifulSoup(html)print (soup.prettify()) 2017. 1. 6.
반응형