본문 바로가기
반응형

전체 글463

[python] 구글 드라이브 내 이미지 텍스트 변환 해보기 python 구글 드라이브 내 이미지 텍스트 변환 오늘은 구글 드라이브 내에서 이미지를 텍스트로 변환해 보는 것에 대해 이야기하려고 합니다. 오늘은 어떤 특정 url에서 어떻게 url을 수집하고 어떤 이미지를 가지고 와서 그걸 구글 드라이브에 올려놓고 OCR을 통해서 해당 이미지를 텍스트로 자동화할 수 있는 전체적으로 코딩화시켜서 가져왔습니다. 의외로 쉬워요. 첫 번째 경우는 사이트 맵이 있죠. 어떤 특정 사이트 맵 안에 들어가서 url 전체를 긁어옵니다. 전체를 긁어오는 것부터 시작했어요. import advertools as adv #설치완료 import pandas as pd import requests import json import time import requests import json i.. 2022. 10. 12.
[python] konlpy counter 정렬 [python] konlpy counter 정렬 오늘 건 쉬운 겁니다. 한글 텍스트의 전처리하는 패키지 중에 konlpy라는 것이 있습니다. 이건 형태소 분석 같은 건데 대표적으로 많이 쓰이는 패키지예요. 오늘은 그 중에서도 특히 어떤 문장이 몇 개 있으면 어떤 nlp 안에서 많이 쓰이는 패키지가 있습니다. 패키지를 이용해서 카운터라는 패키지가 따로 있는데 이 패키지를 이용해서 주로 사용되는 파이썬 코딩을 정리해봤습니다. 정리한 것은 가장 많은 명사의 빈도를 정리하는 것이고, 그 다음에 가장 많은 단어만을 나열하거나 가장 많이 쓰여진 것 중에서도 상위 몇 개의 단어를 기준으로 하거나 필터링할 수 있는 기타 등을 정리해 보았습니다. 그래서 주요 간단한 내용입니다.참고사항으로만 넣었으니 재밌지만 보면 될 것.. 2022. 10. 12.
jupyter notebook IOPub data rate exceeded 문제 해결 다음과 같은 에러 문구가 떠서 주피터 노트북에서 해결되지 않는 상태가 나오긴 한다. IOPub data rate exceeded. The notebook server will temporarily stop sending output to the client in order to avoid crashing it. To change this limit, set the config variable `--NotebookApp.iopub_data_rate_limit`. Current values: NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec) NotebookApp.rate_limit_window=3.0 (secs) 이럴땐 아래와 같이 New > Terminal.. 2022. 10. 8.
[python] 한국인터넷진흥원 인터넷주소(도메인, 아이피) 정보 검색 조회 python 한국인터넷진흥원 인터넷주소(도메인, 아이피) 정보 검색 조회 오늘은 한국 인터넷진흥원 인터넷주소(도메인, 아이피) 정보 검색 조회하여, 파이썬 코딩을 통해 어떻게 진행되는지를 알아보도록 하겠습니다. api 연동을 통한 연결하는 방법입니다. python 인터넷주소자원 중 도메인 이름의 등록정보 및 할당정보 조회1 한국인터넷진흥원이 관리하는 인터넷주소자원인 도메인 이름(.kr, .한국) 등록정보(등록일, 만료일, 등록인 이름, 관리자 연락처, 네임서버 등)를 조회합니다. (.net, com 등 해외 TLD 도메인은 지원하지 않습니다.) from urllib.request import urlopen from urllib.parse import urlencode, unquote, quote_plus.. 2022. 10. 5.
반응형