본문 바로가기
반응형

python102

[python] Requests BeautifulSoup 옛날 게시판 정규식 크롤링 Python Requests BeautifulSoup 옛날 게시판 정규식 크롤링 이거는 옛날 관련했었던 어떤 특정 url을 가져와 보기 그걸로 해서 시험상에서 했는데요. 다른 점은 뭐냐 하면 엄청 옛날 관련됐었던 그런 게시판들 있지 않습니까 간혹씩 그런 것들을 가끔씩 크롤링 한다거나 뭐 이런 경우가 있기는 하는데 연습 삼아서 저는 가지고 와봤어요. 한 20년 전에 있었던 크롤링 이런 것들을 가져와 보는 것. 특히 BeautifulSoup 로 해서 예시 삼아서 가지고 오긴 했는데 저 같은 경우에는 정규식을 이용했습니다. 정규식을 이용을 해서 특정적으로 뭔가 반복되는 뭔가 이거를 html을 크롤링을 하면서 부분만 가지고 오게 되는 거죠. 일반적으로 있었던 크롤링과는 다릅니다. 정규식으로 해서 뭔가 특정 내용.. 2022. 8. 28.
[python] konply 설치 및 다운로드 방법 python konply 설치 및 다운로드 방법 오늘은 파이썬 중에 konply라는 것에 대해서 설치 다운로드하는 방법에 대해서 알아보도록 하겠습니다. konply에 대해서는 잘 사용하신 분들은 아시겠지만 저 같은 경우에는 주로 konply를 사용하는 방법 중에 하나가 자바를 설치를 해야 돼요. 자바를 어느 정도 최신식 버전을 설치를 해야 되고요. 그다음에 자바에 따른 환경 변수를 입력을 해야지만 그다음부터 파이썬 내에서 konply라는 이 패키지를 사용을 할 수가 있습니다. 오늘은 그거에 대해서 알아볼 건데요. python konply 설치하기 위한 자바 설치 https://www.oracle.com/java/technologies/downloads/#jdk17-windows Download the L.. 2022. 8. 28.
[python] 검색엔진 줌 ZUM 자동완성 연관 키워드 검색어 크롤링 추출 python 검색엔진 줌 자동완성 연관 키워드 검색어 크롤링 추출 혹시 여기 계신 분들 중에 검색 엔진에 줌 ZUM이라고 있습니다. 네이버, 구글, 카카오, 아니면 다음 이런 유명한 검색엔진 이외에 한국에서 쓰이는 검색엔진 중에서도 ZUM 이라고 있는데요. 비록 점유율은 엄청 적지만 알찬 내용들이 많이 포함되어 있기도 합니다. 그중에서 여러분들이 많이 사용하시는 실시간 키워드 검색어 같은 경우에도 줌 에서 많이 따오는 경우가 있어요. 왜냐하면 지금 네이버나 카카오 같은 경우에는 실시간 검색어의 서비스를 지금 다 종료를 했어요. 지금 보여주는 게 그나마 남아 있는 게 검색엔진 ZUM 입니다. 그다음에 그중에서 저희는 오늘은 실시간 말고 자동 완성하고 그다음에 연관 키워드의 검색어 키워드죠 이거를 크롤링하는.. 2022. 8. 26.
[python] 파이썬 한글 hwp 파일 문서 열기 및 텍스트 추출 python 파이썬 한글 hwp 파일 문서 열기 및 텍스트 추출 python 파이썬 한글 hwp 파일 문서 열기 오늘 알아봐야 될 거는 파이썬으로 한글 파일 문서를 열어보고 안에서 텍스트를 한번 추출해보는 코딩을 만들어 왔었는데요. 여기 안에 내용을 보자면은 여기서 새로운 파이썬 패키지를 썼던 건데 ole 라는 구조적인 파일이 있다 하더라고요 근데 파일이 뭐냐면 원래 워드라든가 ppt 이런 파일에서 개발해서 불러와서 쓰는 그건데 거기에 한글 파일도 뭔가 되는 부분이 있다고 합니다 해서 파이썬으로 만들어 봤는데요. python 파이썬 한글 hwp 파일 오류 제가 사용했었던 바로는 전반위적으로 텍스트 추출하는 데는 전혀 문제가 없었습니다. 근데 여기 제일 맨 밑에 보시면 오류 사항이 하나가 있었어요. 그게 .. 2022. 8. 25.
반응형