본문 바로가기
반응형

크롤링16

[python] 네이버쇼핑 실시간 디지털가전 인기 키워드 검색어 크롤링 추출 python 네이버쇼핑 실시간 디지털가전 인기 키워드 검색어 크롤링 추출 이거는 이전에 네이버 쇼핑에서 인기 키워드 검색어를 크로링 하는 것에 대해서 가지고 와봤습니다. 근데 아주 기초적인 것만 가지고 오는 거기 때문에 아쉬워하시는 부분들이 있으실 것 같아서 이번에는 뭘 가지고 왔냐면은 디지털 가전이 있지 않습니까? 이 디지털 가전에서 실시간으로 인기 키워드의 검색어를 전부 다 크롤링 즉 추출해서 가지고 오는 것을 제가 파이썬 코딩으로 가져왔습니다. 이거 여러분들 복사 붙여넣기만 넣으셔서 파이썬으로 코딩만 돌리시면 키워도 다 나오실 거예요. 거의 다 나오기 때문에 별다른 이유가 없으면 이거 키워드가 대량으로 나올 것으로 예상이 됩니다. 말씀드리자면 대략적으로 코딩만 설명을 해드릴게요 먼저 Beautifu.. 2022. 8. 31.
[python] Requests BeautifulSoup 옛날 게시판 정규식 크롤링 Python Requests BeautifulSoup 옛날 게시판 정규식 크롤링 이거는 옛날 관련했었던 어떤 특정 url을 가져와 보기 그걸로 해서 시험상에서 했는데요. 다른 점은 뭐냐 하면 엄청 옛날 관련됐었던 그런 게시판들 있지 않습니까 간혹씩 그런 것들을 가끔씩 크롤링 한다거나 뭐 이런 경우가 있기는 하는데 연습 삼아서 저는 가지고 와봤어요. 한 20년 전에 있었던 크롤링 이런 것들을 가져와 보는 것. 특히 BeautifulSoup 로 해서 예시 삼아서 가지고 오긴 했는데 저 같은 경우에는 정규식을 이용했습니다. 정규식을 이용을 해서 특정적으로 뭔가 반복되는 뭔가 이거를 html을 크롤링을 하면서 부분만 가지고 오게 되는 거죠. 일반적으로 있었던 크롤링과는 다릅니다. 정규식으로 해서 뭔가 특정 내용.. 2022. 8. 28.
[python] 스마트스토어 해시태그 키워드 추출 수정 버전(2022.08.25 기준) python 스마트스토어 해시태그 키워드 추출 수정 버전 예전에 어떤 분이 요청을 주셨는데 스마트스토어에서 태그 키워드 추출이 안 된다고 해서 수정 버전을 가져왔습니다. 대략적으로 내용은 이렇게 나오기 때문에 이전 버전에 더 자세한 정보가 나와 있기 때문에 그것을 참고해 보세요. 해시태그를 가져올 건데요, 제품 상세페이지 안에서요. 여기에 한 가지 단점이 있습니다. 브랜드 카탈로그에 묶여 있던 상품명은 크롤링이 불가합니다. 가져오지 못하고 쇼핑몰 등급 중에 파워,빅파워, 프리미엄 여기 있는 등급의 상세 페이지에 태그를 추출하는데요. 태그를 추출하는데 메타 태그 안에서 키워드 부분이 있습니다. 키워드 부분이 스마트스토어의 상세 페이지 태그로 키워드가 됩니다. 적어도 빅파워라든지 프리미엄 정도의 쇼핑몰 수준.. 2022. 8. 26.
[python] 네이버 블로그 아이디 크롤링 추출 엑셀 가공 python 네이버 블로그 아이디 크롤링 추출 엑셀 가공 오늘 네이버 블로쪽으로 아이디만 크롤링 했었던 거를 가지고 왔었던 건데 주로 판다스라고 있죠 판다스랑 정규식을 이용을 해서 네이버 블로아이디를 크롤링하는 그거를 따왔습니다. 네이버 블로그 아이디 크롤링 엑셀 파일 합치기 첫 번째는 엑셀 파일을 합쳐보는 거예요. 처음은 엑셀 파일에 있는 네이버 블로그가 있죠. 엑셀 파일을 처음에 합쳐보는 거고 두 번째는 엑셀 파일을 합친 엑셀 파일을 그 확인해보는 겁니다. 두 가지 파일에 데이터를 합쳤다 하면 행의 개수가 똑같아야 되잖아요. 행의 개수를 확인을 해봐야 되는 거죠. import os import pandas as pd import re blog_content_result_1 = pd.read_csv('.. 2022. 8. 23.
반응형