본문 바로가기
반응형

분류 전체보기462

[python] 네이버 블로그 전체 주소 제목 URL 리스트 추출 저장 크롤링 python 네이버 블로그 전체 주소 제목 URL 리스트 추출 저장 크롤링 오늘의 그거는 네이버 블로그 전체 주소를 어떻게 하면 제목하고 url 리스트만 뽑아서 이걸 크로링 해서 저장을 하는 과정 이것에 대해서 가지고 와봤습니다. 파이썬 코딩으로 아까 만들어 놨었었는데요. 이것에 대한 용도는 아주 간단합니다 만약 여러분들이 네이버 블로그를 오랫동안 이용하셨었다고 한다면 한 블로그 전체 글로만 보더라도 거의 한 2천 개 이상이 넘어갈 거예요. 만약에 블로그를 많이 이용을 안 하시고 최근에 이용을 하셨다면 블로그전체 글 수가 거의 한 100개에서 한 500개 이 사이로만 될 텐데 오랫동안 블로그를 애지중지하시면서 운영하셨던 분들이라면 블로그전체 글수가 거의 기본 1천 개가 이상 넘어갑니다. 1천 개가 이상 .. 2022. 9. 5.
[python] str object has no attribute read 에러 문구 해결 python 'str' object has no attribute 'read' 에러 문구 해결 간혹 json 파일로 read 로 읽을시 'str' object has no attribute 'read' 와 같은 에러 문구가 발생하는 경우가 있다. 이는 주로 json으로 된 형식 내 텍스트를 주로 긁어올 때 문제가 발생된다. 이에 해결책으로는 해당 컨텐츠를 불러오고, 리스트화 해서 for 문 구문을 통해 하나씩 처리하면 쉽게 가능하다. 이에 PDF 파일을 텍스트로 가져오는 다른 파일에서 이에 따른 문제가 발생되어 이렇게 작성하게 되었다. 또한 list 형식으로 만들어 놓고, 해당 문장을 하나씩 for 문으로 불러와서 쓸데없는 빈 공간의 \n 처리된 문장은 생략하고 print화 시키도록 하였다. 그럼 빈 공.. 2022. 8. 31.
[python] 네이버쇼핑 실시간 디지털가전 인기 키워드 검색어 크롤링 추출 python 네이버쇼핑 실시간 디지털가전 인기 키워드 검색어 크롤링 추출 이거는 이전에 네이버 쇼핑에서 인기 키워드 검색어를 크로링 하는 것에 대해서 가지고 와봤습니다. 근데 아주 기초적인 것만 가지고 오는 거기 때문에 아쉬워하시는 부분들이 있으실 것 같아서 이번에는 뭘 가지고 왔냐면은 디지털 가전이 있지 않습니까? 이 디지털 가전에서 실시간으로 인기 키워드의 검색어를 전부 다 크롤링 즉 추출해서 가지고 오는 것을 제가 파이썬 코딩으로 가져왔습니다. 이거 여러분들 복사 붙여넣기만 넣으셔서 파이썬으로 코딩만 돌리시면 키워도 다 나오실 거예요. 거의 다 나오기 때문에 별다른 이유가 없으면 이거 키워드가 대량으로 나올 것으로 예상이 됩니다. 말씀드리자면 대략적으로 코딩만 설명을 해드릴게요 먼저 Beautifu.. 2022. 8. 31.
[python] hanspell 맞춤법, 오탈자 띄어쓰기 교정해보기 hanspell 맞춤법, 오탈자 띄어쓰기 교정해보기 바로 시작할게요. 파이썬으로 오늘은 맞춤법 오탈자, 띄어쓰기 교정을 해줄 수 있는 hanspell 패키지입니다. 여러분들 혹시 네이버 검사 결과를 보시면 부산대에서 쓰는 한국어 맞춤법 검사기 있습니다. 주로 거거를 많이 사용하시는 것 같은데 음 그거를 파이썬 코딩에서도 똑같이 할 수 있습니다. 네이버에서 여러분들이 사용하시는 맞춤법 검사기 그거 동일하다고 생각하시면 돼요. 여전히 다른 분들도 마찬가지고 부산대학교에서 나왔었던 hanspell 맞춤법 검사기를 많이 사용을 하고 있죠? 제가 어떠한 유명한 소설이 있었었는데 이 유명한 소설에 나와 있었던 문장을 한번 메모장에다가 넣어서 네이버 맞춤법 검사기를 사용을 해봤어요. 이거 같은 경우에는 최대 500자.. 2022. 8. 31.
반응형