본문 바로가기
반응형

Python193

[python] Requests BeautifulSoup 옛날 게시판 정규식 크롤링 Python Requests BeautifulSoup 옛날 게시판 정규식 크롤링 이거는 옛날 관련했었던 어떤 특정 url을 가져와 보기 그걸로 해서 시험상에서 했는데요. 다른 점은 뭐냐 하면 엄청 옛날 관련됐었던 그런 게시판들 있지 않습니까 간혹씩 그런 것들을 가끔씩 크롤링 한다거나 뭐 이런 경우가 있기는 하는데 연습 삼아서 저는 가지고 와봤어요. 한 20년 전에 있었던 크롤링 이런 것들을 가져와 보는 것. 특히 BeautifulSoup 로 해서 예시 삼아서 가지고 오긴 했는데 저 같은 경우에는 정규식을 이용했습니다. 정규식을 이용을 해서 특정적으로 뭔가 반복되는 뭔가 이거를 html을 크롤링을 하면서 부분만 가지고 오게 되는 거죠. 일반적으로 있었던 크롤링과는 다릅니다. 정규식으로 해서 뭔가 특정 내용.. 2022. 8. 28.
[python] konply 설치 및 다운로드 방법 python konply 설치 및 다운로드 방법 오늘은 파이썬 중에 konply라는 것에 대해서 설치 다운로드하는 방법에 대해서 알아보도록 하겠습니다. konply에 대해서는 잘 사용하신 분들은 아시겠지만 저 같은 경우에는 주로 konply를 사용하는 방법 중에 하나가 자바를 설치를 해야 돼요. 자바를 어느 정도 최신식 버전을 설치를 해야 되고요. 그다음에 자바에 따른 환경 변수를 입력을 해야지만 그다음부터 파이썬 내에서 konply라는 이 패키지를 사용을 할 수가 있습니다. 오늘은 그거에 대해서 알아볼 건데요. python konply 설치하기 위한 자바 설치 https://www.oracle.com/java/technologies/downloads/#jdk17-windows Download the L.. 2022. 8. 28.
[python] 검색엔진 줌 ZUM 자동완성 연관 키워드 검색어 크롤링 추출 python 검색엔진 줌 자동완성 연관 키워드 검색어 크롤링 추출 혹시 여기 계신 분들 중에 검색 엔진에 줌 ZUM이라고 있습니다. 네이버, 구글, 카카오, 아니면 다음 이런 유명한 검색엔진 이외에 한국에서 쓰이는 검색엔진 중에서도 ZUM 이라고 있는데요. 비록 점유율은 엄청 적지만 알찬 내용들이 많이 포함되어 있기도 합니다. 그중에서 여러분들이 많이 사용하시는 실시간 키워드 검색어 같은 경우에도 줌 에서 많이 따오는 경우가 있어요. 왜냐하면 지금 네이버나 카카오 같은 경우에는 실시간 검색어의 서비스를 지금 다 종료를 했어요. 지금 보여주는 게 그나마 남아 있는 게 검색엔진 ZUM 입니다. 그다음에 그중에서 저희는 오늘은 실시간 말고 자동 완성하고 그다음에 연관 키워드의 검색어 키워드죠 이거를 크롤링하는.. 2022. 8. 26.
[python] 스마트스토어 해시태그 키워드 추출 수정 버전(2022.08.25 기준) python 스마트스토어 해시태그 키워드 추출 수정 버전 예전에 어떤 분이 요청을 주셨는데 스마트스토어에서 태그 키워드 추출이 안 된다고 해서 수정 버전을 가져왔습니다. 대략적으로 내용은 이렇게 나오기 때문에 이전 버전에 더 자세한 정보가 나와 있기 때문에 그것을 참고해 보세요. 해시태그를 가져올 건데요, 제품 상세페이지 안에서요. 여기에 한 가지 단점이 있습니다. 브랜드 카탈로그에 묶여 있던 상품명은 크롤링이 불가합니다. 가져오지 못하고 쇼핑몰 등급 중에 파워,빅파워, 프리미엄 여기 있는 등급의 상세 페이지에 태그를 추출하는데요. 태그를 추출하는데 메타 태그 안에서 키워드 부분이 있습니다. 키워드 부분이 스마트스토어의 상세 페이지 태그로 키워드가 됩니다. 적어도 빅파워라든지 프리미엄 정도의 쇼핑몰 수준.. 2022. 8. 26.
반응형