반응형 분류 전체보기463 [네이버] 추천검색어 크롤링3 #네이버 검색어 URL 만들기 from bs4 import BeautifulSoupimport urllib.parseimport urllib.request file = open("C:/Users/eyeden-FF14/Desktop/Auction/all_keywords.txt", 'r' )Food_keyword_list = open("C:/Users/eyeden-FF14/Desktop/Food_keyword_list.txt", 'w' , encoding='utf-8' ) keywords = file.readlines()file.close() Naver_first_URL = 'https://m.search.naver.com/search.naver?query='Naver_behind_URL = '&where=.. 2017. 1. 18. [네이버] 섹션 크롤링3 #네이버 키워드 URL 만들기 from bs4 import BeautifulSoupimport urllib.parseimport urllib.request f = open("C:/Users/eyeden-FF14/Desktop/Auction/all_keywords.txt", 'r')f1 = open("C:/Users/eyeden-FF14/Desktop/Naver_URL_List.txt", 'w' , encoding='utf-8' ) keyword = f.readlines()f.close() Naver_first_URL = 'https://search.naver.com/search.naver?where=nexearch&query='Naver_behind_URL = '&sm=top_hty&fbm=0&ie=ut.. 2017. 1. 18. [파이썬3] 한글 교정 Python2를 주로 사용하다가 Python3을 사용해 보았는데 한글코드 문제로 하루를 날렸네요. ^^^ 문제가 된 것은 mbcs/cp949로 코딩된 파일에서는 깨지는 한자가 있는 경우입니다.예를 들면, 이 글자 "豐". utf-8이나 유니코드에서만 제대로 보임. 저 글자가 있는 라인을 파일에 쓸때마다 계속 아래와 같은 에러 메시지가 발생하더군요. UnicodeEncodeError: 'cp949' codec can't encode character '\u8c50' in position 15: illegal multibyte sequence 해결 방법은 의외로 간단했습니다.프로그램 파일은 어떤 코딩을 이용해도 상관없으나 입출력은 utf-8로 저장되어 있어야 겠지요. fin1 = open(file1, enc.. 2017. 1. 17. [네이버] 옥션 검색어를 통한 추천검색어 크롤링(모바일) from bs4 import BeautifulSoupimport urllib.parseimport urllib.request file = open("C:/Users/eyeden-FF14/Desktop/Auction/food_keywords.txt", 'r' )Food_keyword_list = open("C:/Users/eyeden-FF14/Desktop/Food_keyword_list.txt", 'w' , encoding='utf-8' ) keywords = file.readlines()file.close() Naver_first_URL = 'https://m.search.naver.com/search.naver?query='Naver_behind_URL = '&where=m&sm=mtp_hty' #네.. 2017. 1. 17. 이전 1 ··· 106 107 108 109 110 111 112 ··· 116 다음 반응형