반응형
import urllib.request
from bs4 import BeautifulSoup
plaync_URL = 'http://rk.plaync.com/board/free/view?articleId='
plaync_URL_behind = '&viewMode=list'
result1 = []
for num in range(145472, 145798) :
num +=1
result1.append(num)
for page in result1 :
url = plaync_URL+str(page)+plaync_URL_behind
f = urllib.request.urlopen(url)
html = f.read()
bs = BeautifulSoup(html, 'html.parser')
post_title = bs.find_all("meta", property="og:title")
post_description = bs.find("meta", name_="twitter:description")
print(post_title)
print(post_description)
#수정: 수정해야될 부분은 http 접속시 error 500 뜰시 해결방법 모색해야됨.
반응형
'Python' 카테고리의 다른 글
[네이버] 검색어를 통한 섹션 크롤링2 (0) | 2017.01.17 |
---|---|
[파이썬3] 크롤링할 메모장 파일 읽기 (0) | 2017.01.16 |
[네이버] 카페글 크롤링 (0) | 2017.01.12 |
[네이버] 사이트영역 크롤링2 (0) | 2017.01.11 |
[네이버]사이트 URL 크롤링 (0) | 2017.01.11 |
댓글