반응형 Python193 [디시인사이드] 김소혜 게시판 크롤링 from bs4 import BeautifulSoupimport urllib.request if __name__ == "__main__": req = urllib.request.Request("http://gall.dcinside.com/board/lists/?id=kimsohye");data = urllib.request.urlopen(req).read()bs = BeautifulSoup(data, 'html.parser') l = bs.find_all('a')idx = 0 for s in l : try : prop = s.get('class')# get class propertyif prop != None and prop[0] == "icon_pic_n": print("%s : %s" % (s.get.. 2017. 1. 6. [파이썬3] 파이썬 인터프리터에서 테스트 파이썬버전: 3.6.xxxx뷰티풀수프 버전: 4.5.3.xxxxx툴: Sublime text3 #파이썬 인터프리터에서 웹크롤링 테스트 import urllib.requestfrom bs4 import BeautifulSoup html = urllib.request.urlopen('http://naver.com')soup = BeautifulSoup(html)print (soup.prettify()) 2017. 1. 6. [파이썬3] 파이썬 Beautiful Soup 4 설치하기 http://deadfile.tistory.com/entry/%EC%9C%88%EB%8F%84%EC%9A%B0%EC%97%90%EC%84%9C-BeautifulSoup4-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0 2017. 1. 6. [네이버] 웹툰 스크래핑 #파이썬에서 바로 네이버 웹툰 목록 스크래핑 파이썬 버전 : 3.6.xxxxBeautiful Soup 버전: 4.xxxxsublime text3 툴 사용 import urllib.requestfrom bs4 import BeautifulSoup html = urllib.request.urlopen('http://comic.naver.com/webtoon/weekday.nhn')soup = BeautifulSoup(html)titles = soup.find_all('a','title')for title in titles:print('title:{0:10s} link:{1:20s}\n'.format(title['title'], title['href'])) #스크래핑 내용을 메모장에 저장 import urll.. 2017. 1. 6. 이전 1 ··· 45 46 47 48 49 다음 반응형