안녕하십니까, 오늘은 여러분들한테 근데 이거는 시간이 되긴 했어요. 이게 뭐냐면 보통은 협찬을 보낼 때 어떤 블로그의 방문자가 궁금하지 않았습니까? 그래서 그래서 오늘은 그것에 대한 방법을 찾아냈어요. 근데 의외로 아주 간단합니다. 아주 간단한 코딩이 있는데 흔히 말하면 어떤 네이버 사이트 안에 들어가서 보면 이미지로 되어 있는 어떤 그래프를 보는 게 있을 거예요. 방문자의 그래프 한 5일 정도 근데 이게 그것을 주는 다른 사이트가 있습니다. 오늘 그 사이트를 봐서 네이버 블로그에서 협찬할 때 방문자가 많은 그런 블로그 네이버 블로그를 타깃으로 해서 협찬을 하고 싶잖아요. 그럴 때 쓰는 용도로 사용을 하는 겁니다.
파이썬 xml 파싱으로 네이버 블로그 방문자 수 크롤링
그래서 그걸 비공개 식으로 되어 있는 사람들이 있는데 근데 이거를 또 볼 수 있는 방법도 있습니다. 그 코딩을 파이썬으로 어떻게 하는 건지 이거에 대해서 가지고 왔습니다. 먼저 첫 번째로는 파이썬으로 xml 파싱을 통해서 방문자 수를 처음에 크롤링을 합니다. 그래서인포트 하는 게 또 따로 있는데요. 보통은 뷰리풀 수프를 통해서 html을 파싱을 하죠. 그런 파싱하는 방법도 따로 있긴 한데 xml로 파싱 하는 것도 또 따로 있습니다. 그래서 오늘은 그것을 덧붙여서 어제 날짜 기준으로 네이버 방문자 수를 가져오는 거예요.
파이썬 어제 날짜 기준으로 네이버 블로그 방문자 수 체크하기
보통은 평균이나 이런 식으로 해서 가져오는 그런 경우도 있긴 한데 그래서 어제 날짜 기준으로 해서 보면 거의 다 또이또이 합니다. 그래서 그것을 어떻게 할까라는 게 있는데 어제 날짜로 가져오기 위해서는 데이트 타임이라는 이 패키지를 import 해야 돼요. 그다음에 타임은 컴퓨터한테 조금 쉬면서 긁어와라 라는 것을 하기 위해서 하는 거고요. 그래서 해당 파이썬 코딩 같은 경우에는 어제 날짜를 기준으로 변환을 포맷을 날짜를 변환을 시켜놔서 어제 날짜의 기준으로 있었던 유입을 가져오는 걸로 그렇게 해서 파이선 코딩으로 짜놨습니다. 짜놓긴 해서 근데 여기에서 오류 현상이 있는 경우도 있어요. 몇몇 경우가 있기는 하는데 그래서 파이썬 코딩이 보시면 아시겠지만 수정되어 있습니다.
import requests
from bs4 import BeautifulSoup
import xml.etree.ElementTree as ET
import datetime
import time
blogIds = ['big203040'
]
for blogId in blogIds :
url = 'https://blog.naver.com/NVisitorgp4Ajax.nhn?blogId={}'.format(blogId)
try :
raw = requests.get(url) #협찬
#html = BeautifulSoup(raw.text, 'html.parser') #긁기
format = '%Y%m%d'
today = datetime.datetime.now() #오늘날짜
yesterday = today - datetime.timedelta(days=+1) #어제날짜
str_datetime = datetime.datetime.strftime(yesterday,format) #어제날짜변환
for node in ET.fromstring(raw.text) :
if node.get("id") == str_datetime :
print(str(url) +' ,'+node.get("cnt"))
else :
pass
except :
pass
time.sleep(2) #2초간
파이썬 어제 날짜 기준으로 네이버 블로그 방문자 수 체크하기 오류 현상
그래서이 부분을 유념을 하고 들어가시면 될 것 같아요. 대표적인 경우가 숫자로 된 블로그 주소인 같은 경우는 에러가 뜨는 경우가 있더라고요 혹은 그냥 데이터가 없는 경우도 있는데 아마 그런 거는 아마 제 블로그 생성한 지 아마 며칠 되지 않았나 그런 블로그라서 아마 노출이 안 된 것 같기도 하고 여튼 그렇습니다. 그래서 근데 만약에 노출이 된 만약에 유입이 아예 안 된다 아니 뭐라고 해야 될까 유입이 아예 널 값으로 처리되는 그런 네이버 블로그가 있잖아요. 근데 이런 것은 그냥 그냥 안 되는 블로그겠거니 하고 그냥 넘어가셔도 괜찮은 것 같습니다. 그렇게 크게 많지는 않아요. 한 1천 개를 긁으면 한 10개 정도 한 1% 정도 한 이 정도 경우니까 거의 한 99%는 그냥 웬만하면 검색 결과에 나오는 그런 블로그 같은 경우에는 웬만해서는 그냥 다 긁을 수 있다. 방문자 수를 볼 수 있다라고 보시면 될 것 같습니다. 오늘은 여기까지입니다.
'Python' 카테고리의 다른 글
[파이썬] 판다스 MS-SQL 이용시 한글 깨짐 오류 수정 (0) | 2022.07.16 |
---|---|
[파이썬] 핀터레스트 비공식 API 핀 이미지 업로드 오류 해결 (0) | 2022.07.15 |
[파이썬] 네이버, 다음 통합 검색 영역 내 키워드 노출 모니터링 (0) | 2022.07.11 |
[파이썬] 유투브 API 동영상 업로드하기 (0) | 2022.07.11 |
[파이썬] 네이버 클로바 Summary API 문장 3줄 요약 해보기 (0) | 2022.07.10 |
댓글