반응형 전체 글463 Excel VBA NGram 유사도 알고리즘 계산 Excel VBA NGram 유사도 알고리즘 계산 excel vba NGram 유사도 알고리즘 계산을 vba 코드로 옮겨봄. N-Gram 유사도에서 1에 가까운 값은 두 텍스트 또는 시퀀스가 매우 유사하다는 것을 의미. N-Gram 유사도는 주로 교집합의 크기를 합집합의 크기로 나누어 계산하기 때문에, 이 비율이 1에 가까워질수록 두 시퀀스 사이의 공통된 N-Gram의 비율이 높아지는 것을 나타냄. 따라서, 유사도가 1에 가깝다면 두 시퀀스는 거의 동일하거나 매우 비슷한 패턴을 가지고 있다고 볼 수 있음. 반대로, 유사도가 0에 가까운 경우는 두 시퀀스 간에 공통된 N-Gram이 거의 없거나 전혀 없다는 것을 의미하며, 이는 두 시퀀스가 매우 다르다는 것을 나타냄. 텍스트 예시로, "과과과과과과과"와 ".. 2024. 1. 31. Excel VBA 레벤슈타인 거리 계산 Excel VBA레벤슈타인 거리 계산 Excel VBA를 사용하여 레벤슈타인 거리를 계산하는 방법은 두 문자열 간의 차이를 측정하는 과정. 이 방법은 문자열을 추가, 삭제, 또는 교체하여 한 문자열을 다른 문자열로 변환하는 데 필요한 최소한의 편집 횟수를 측정. 이는 주로 맞춤법 검사, DNA 서열 정렬, 데이터 클렌징 등 다양한 분야에서 활용됨. Excel VBA에서 이를 구현하기 위해 다음과 같은 과정을 진행 : 기준 문자열 설정: Excel 시트에서 한 개의 기준 문자열을 선택합니다. 비교 문자열 설정: 동일한 시트 내에서 N개의 다른 텍스트(비교 대상)를 선택합니다. 레벤슈타인 거리 계산: 기준 문자열과 각 비교 문자열 간의 레벤슈타인 거리를 계산합니다. 이 거리는 Levenshtein 함수를 통.. 2024. 1. 31. Excel VBA Dart 공시 원본 문서 다운로드시 CopyHere Unzip 압축 해제 문제 해결 Excel VBA CopyHere Unzip 압축 해제 문제 해결 아래의 VBA 코드에서 공시 문서를 API 키를 사용해 다운로드하고 압축 해제하는 과정에서 발생한 주요 문제점은 CopyHere 메소드가 제대로 작동하지 않았던 것입니다. 이 문제의 원인은 unzipFolder, zipFile, targetFolder 변수들을 Variant 타입으로 선언하지 않았기 때문입니다. 이 변수들은 Shell 객체의 Namespace 메소드와 함께 작동할 때 반드시 Variant 타입으로 지정되어야 합니다. 이러한 변경을 적용하면, 코드는 문제 없이 압축 파일을 해제할 수 있습니다. 아래는 최종 공시 원본 문서를 다운로드하는 내용입니다. Sub DownloadDisclosureDocument() ' 공시 문.. 2024. 1. 31. 엑셀 VBA 오픈 DART API 기업 개황 정보 데이터 추출 이 VBA 코드는 오픈 DART API에서 회사 정보를 XML 형식으로 가져와 엑셀에 한글로 레이블링된 데이터를 표시하는 과정을 담고 있습니다. 아래는 step by step으로 분석한 내용입니다. 1단계: 필수 정보 설정 API 키(apiKey), 회사 코드(corpCode), 요청 URL(url)을 상수로 설정합니다. 이들은 API 요청에 필요한 정보입니다. 2단계: HTTP 요청 객체 초기화 MSXML2.XMLHTTP 객체를 사용하여 HTTP 요청을 처리합니다. 이 객체는 웹 서버에 요청을 보내고 응답을 받는 데 사용됩니다. 3단계: HTTP 요청 보내기 설정된 URL로 GET 요청을 보냅니다. .Open 메서드는 요청 타입과 URL을 지정하고, .Send 메서드는 실제 요청을 서버로 전송합니다. .. 2024. 1. 30. 이전 1 ··· 7 8 9 10 11 12 13 ··· 116 다음 반응형