본문 바로가기
반응형

파이썬128

[python] 네이버쇼핑 연관검색어 수정 버전 키워드 크롤링 python 네이버쇼핑 연관검색어 수정 버전 키워드 크롤링 이번 코딩 같은 경우에는 네이버 쇼핑 쪽에서 연관 검색어 키워드로 클로링 했었던 것을 파이썬이죠. 파이썬으로 했었던 거를 이전에 소개시켜드린 적이 있었는데 그게 오류가 있었습니다. 이걸 수정을 해서 다시 들고 왔어요. 세 가지가 있는데 기존과 똑같습니다. 이전 거 했었던 분들은 왜 갑자기 연관 검색어가 왜 이렇게 안 나와라는 게 있으실 거예요. 버전업을 해놨었기 때문에 정상적으로 오류 없이 나올 겁니다. python 네이버 쇼핑 자동완성어 추출 첫 번째로는 네이버 쇼핑 쪽에서 자동 완성어예요. 이 키워드를 입력을 해서 보시면 네이버 쇼핑 쪽에 검색 란에다가 키워드를 입력을 하면 밑에 자동 완성으로 뜨는 추천 키워드들 있지 않습니까? 그게 나올 거.. 2022. 8. 19.
[python] 정규식 expected string or bytes-like object 에러 문구 해결 python 정규식 expected string or bytes-like object 에러 문구 해결 h2_class_name = re.search('', str(shop_rel_soup)).group() #클래스명 정규식 표현으로 찾기 h2_class_name_2 = re.search('"(.+?)"', str(h2_class_name)).group() #클래스명 정규식 표현으로 찾기 클래스명 정규식 표현으로 찾을 떄 다음와 같은 expected string or bytes-like object 에러 문구 발생시 str(shop_rel_soup) str 문자열로 감싸면 된다. 즉 str 문자열로 감싸면 에러 해결됨. 2022. 8. 17.
[python] 고전 사이트 게시판 텍스트 추출 크롤링 이건 어쨌든 고전 사이트가 있었거든요.고전 사이트 안에 게시판 형식이 있습니다. 게시판 형식 중에 텍스트를 어떻게 클로징하는지 예시로 가져왔습니다. 특별한 것은 없고 큰 부분도 아닙니다. 단순한 테스트라고 생각하세요.그렇게 어려운 내용은 아니지만 아까 하나 추가로 한글이 깨졌을 때 문제가 있을 수 있습니다. python 고전 사이트 게시판 텍스트 추출 크롤링 크롤링을 할 때 여러분들이 BeautifulSoup를 많이 쓰잖아요. 한글이 깨지는 경우가 있기 때문에 그 때 어떻게 하면 좋을지 적어놓은 것이라고 생각하면 됩니다. 보통 한글이 깨진 경우는 두 가지 경우입니다. 문자 인코딩 디코딩 여기서 주로 한글 깨짐 현상이 발생하거든요. 인코딩과 디코딩을 어떻게 해야 할까요? 지금 그것만 고려해서 코딩을 해주시.. 2022. 8. 14.
[python] 정규식 영문 숫자 제외 한글 텍스트 추출 여러분들 중에 정규식을 쓰는데 어려운 부분들이 많으실 거예요. 저도 정규직을 처음. 접했었을 때 어려운 부분들이 많았습니다. python 정규식 영문 숫자 제외 한글 텍스트만 크롤링 추출 그중에서 이제 한국 테스트만 뽑아서 뭔가 클로닝을 한다든가 이런 걸 할 때 그게 힘들었던 부분들이 있었어요. 한글 테스트만 가져오고 뭐 영어 혹은 영문이죠. 숫자를 제외를 해놓고 오로지 한글 텍스트만 가지고 올 수 있는 그것에 대해서만 말씀드리고자 이렇게 작성을 하게 됐습니다. 여기 밑에 관련했었던 코딩을 아까 집어넣었었었는데 참고를 해보시고요 리스트 형식이긴 한데 리스트 형식 안에 여러분들의 데이터를 집어넣으면 한글 테스트만 나옵니다 해서 결과는 무조건 한글 테스트만 나오게끔 그렇게 해놨어요. 특히나 빈칸도 다 제외를.. 2022. 8. 14.
반응형