본문 바로가기
반응형

분류 전체보기462

[네이버] 검색어를 통한 섹션 크롤링2 from bs4 import BeautifulSoupimport urllib.parseimport urllib.request f = open("C:/Users/eyeden-FF14/Desktop/keywords.txt", 'r' )f1 = open("C:/Users/eyeden-FF14/Desktop/Naver_URL_List1.txt", 'w' , encoding='utf-8' ) keyword = f.readlines()f.close() Naver_first_URL = 'https://search.naver.com/search.naver?where=nexearch&query='Naver_behind_URL = '&sm=top_hty&fbm=0&ie=utf8' #네이버 검색할 URL 만들기 for i .. 2017. 1. 17.
[파이썬3] 크롤링할 메모장 파일 읽기 #메모장 파일읽기 f = open("C:/Users/eyeden-FF14/Desktop/keywords.txt", 'r') #읽을 메모장 파일 경로 찾아 열기data = f.readlines() #파일의 모든 라인을 읽어 리스트 형태로 returnf.close() # 파일 객체 닫기 print(data) #파일의 모든 라인이 리스트 형태로 리턴되는지 확인 2017. 1. 16.
[레드나이츠] 게시판 글 크롤링 import urllib.request from bs4 import BeautifulSoup plaync_URL = 'http://rk.plaync.com/board/free/view?articleId='plaync_URL_behind = '&viewMode=list' result1 = [] for num in range(145472, 145798) : num +=1 result1.append(num) for page in result1 : url = plaync_URL+str(page)+plaync_URL_behind f = urllib.request.urlopen(url) html = f.read() bs = BeautifulSoup(html, 'html.parser') post_title = bs... 2017. 1. 12.
[네이버] 카페글 크롤링 """ 네이버 카페글 크롤링 """ #카페글은 크롤링이 되나, 로그인을 요구시 자연스럽게 블락당함.. ㅠㅠ import urllib.request from bs4 import BeautifulSoup navercafe_URL = 'https://m.cafe.naver.com/dnfspirit/'result1 = []for num in range(3418, 3419) : num +=1 result1.append(num) for page in result1 : url = navercafe_URL+str(page) f = urllib.request.urlopen(url) html = f.read() bs = BeautifulSoup(html, 'html.parser') post_title = bs.find(".. 2017. 1. 12.
반응형