반응형 분류 전체보기462 [네이버] 섹션 크롤링3 #네이버 키워드 URL 만들기 from bs4 import BeautifulSoupimport urllib.parseimport urllib.request f = open("C:/Users/eyeden-FF14/Desktop/Auction/all_keywords.txt", 'r')f1 = open("C:/Users/eyeden-FF14/Desktop/Naver_URL_List.txt", 'w' , encoding='utf-8' ) keyword = f.readlines()f.close() Naver_first_URL = 'https://search.naver.com/search.naver?where=nexearch&query='Naver_behind_URL = '&sm=top_hty&fbm=0&ie=ut.. 2017. 1. 18. [파이썬3] 한글 교정 Python2를 주로 사용하다가 Python3을 사용해 보았는데 한글코드 문제로 하루를 날렸네요. ^^^ 문제가 된 것은 mbcs/cp949로 코딩된 파일에서는 깨지는 한자가 있는 경우입니다.예를 들면, 이 글자 "豐". utf-8이나 유니코드에서만 제대로 보임. 저 글자가 있는 라인을 파일에 쓸때마다 계속 아래와 같은 에러 메시지가 발생하더군요. UnicodeEncodeError: 'cp949' codec can't encode character '\u8c50' in position 15: illegal multibyte sequence 해결 방법은 의외로 간단했습니다.프로그램 파일은 어떤 코딩을 이용해도 상관없으나 입출력은 utf-8로 저장되어 있어야 겠지요. fin1 = open(file1, enc.. 2017. 1. 17. [네이버] 옥션 검색어를 통한 추천검색어 크롤링(모바일) from bs4 import BeautifulSoupimport urllib.parseimport urllib.request file = open("C:/Users/eyeden-FF14/Desktop/Auction/food_keywords.txt", 'r' )Food_keyword_list = open("C:/Users/eyeden-FF14/Desktop/Food_keyword_list.txt", 'w' , encoding='utf-8' ) keywords = file.readlines()file.close() Naver_first_URL = 'https://m.search.naver.com/search.naver?query='Naver_behind_URL = '&where=m&sm=mtp_hty' #네.. 2017. 1. 17. [파이썬3] python txt파일 읽기 에러 'cp949' UnicodeDecodeError: 'cp949' codec can't decode bytes in position : illegal multibyte sequence python3 부터는 ANSI 기준으로 작성된 파일만 읽을 수 있다. UTF-8로 작성된 파일은 보통 방법으로 읽을 때 에러가 난다. 2가지 방법이 있다. 1. utf-8을 붙여준다. f = open( "text.txt", "r", "utf-8" ) 2. 파일의 인코딩을 ANSI로 바꾸면 된다.해당 파일을 메모장으로 열었을 경우 [다른 이름으로 저장]에서 가능하다.밑에 보면 나와있다. 인코딩: ~~ 2017. 1. 17. 이전 1 ··· 106 107 108 109 110 111 112 ··· 116 다음 반응형