파이썬 Pandas 재무 데이터 분석
Python Panda 패키지는 데이터 분석 및 조작을 위한 강력한 도구입니다. 금융 및 비즈니스에서 재무 데이터 분석에 흔히 사용됩니다. 이 블로그 게시물에서는 Panda 패키지를 사용하여 웹 사이트에서 재무 데이터를 추출하고 데이터 프레임에 저장하는 코드 스니펫을 분석할 것입니다. 각 코드 라인에 대해 설명하고 각 코드 스니펫의 기능에 대한 간략한 설명을 제공합니다.
import pandas as pd
import requests
code = '005930' # 회사코드
URL = "https://finance.naver.com/item/main.nhn?code=" + code
company = requests.get(URL)
html = company.text
df = pd.read_html(company.text)[3]
df.set_index(('주요재무정보', '주요재무정보', '주요재무정보'), inplace=True)
df.index.rename('주요재무정보', inplace=True)
df.columns = df.columns.droplevel(2)
annual_finance = pd.DataFrame(df).xs('최근 연간 실적', axis=1)
print(annual_finance[['2021.12']])
파이썬 Pandas 재무 데이터 분석 코드 설명
첫 번째 줄은 "pd"라는 별칭으로 판다 패키지를 가져옵니다. 이 별칭은 간결성과 편의성을 위해 코드 전반에 걸쳐 사용됩니다.
두 번째 줄은 Python에서 HTTP 요청을 보내는 데 사용되는 "requests" 라이브러리를 가져옵니다. 이 라이브러리를 사용하여 URL에서 데이터를 검색할 수 있습니다.
세 번째 줄은 회사 코드를 변수 "code"에 할당합니다. 이 경우 코드는 회사에 해당하는 '005930'입니다.
네 번째 줄은 회사 코드를 재무 데이터 웹 사이트의 기본 URL에 연결하여 URL 문자열을 구성합니다. 이 URL은 회사의 재무 데이터를 검색하는 데 사용됩니다.
다섯 번째 줄은 requests 라이브러리를 사용하여 URL로 HTTP GET 요청을 보냅니다. 웹 사이트의 응답은 변수 "회사"에 저장됩니다.
여섯 번째 줄은 "회사" 변수의 ".text" 메서드를 사용하여 응답의 HTML 내용을 추출합니다.
일곱 번째 줄은 "pd.read_html" 함수를 사용하여 웹 사이트의 HTML 콘텐츠에서 테이블을 추출합니다. "[3]" 인덱스는 페이지의 네 번째 테이블을 추출해야 함을 나타냅니다.
8번째 줄은 데이터 프레임 "df"의 인덱스를 재무 정보에 해당하는 표의 세 번째 열로 설정합니다. "inplace=True" 매개 변수는 새 복사본을 만드는 대신 제자리에 있는 데이터 프레임을 수정합니다.
아홉 번째 줄은 지수의 이름을 "주요 재무 정보"를 뜻하는 한국어인 "주요 재무 정보"로 변경합니다. "inplace=True" 매개 변수는 새 복사본을 만드는 대신 제자리에 있는 데이터 프레임을 수정합니다.
열 번째 줄은 중복된 열 인덱스의 세 번째 수준을 삭제합니다. 이를 위해 ".drop level(2)" 방법을 사용합니다.
11번째 줄은 "연간_재정"이라는 새 데이터 프레임을 생성하며, 여기에는 "연간 성과" 또는 "최근 연간 성과" 열에 대한 데이터만 포함됩니다. xs 방법은 이름별로 열을 추출하는 데 사용됩니다.
12번째 줄은 2021.12년의 재무 데이터를 인쇄하며, 이는 사용 가능한 가장 최근의 연간 데이터에 해당합니다.
이 블로그 게시물에서는 Panda 패키지를 사용하여 웹 사이트에서 재무 데이터를 추출하고 데이터 프레임에 저장하는 방법을 보여주는 코드 스니펫을 분석했습니다. 코드의 각 줄에 대해 설명하고 기능에 대한 간략한 설명을 제공했습니다. Panda를 사용하면 재무 데이터를 쉽게 조작하고 분석할 수 있으므로 심층적인 분석과 시각화가 가능합니다. 재무 데이터는 정보에 입각한 비즈니스 의사 결정을 내리는 데 중요하며, Panda는 Python에서 이 데이터를 쉽게 추출, 조작 및 분석할 수 있도록 합니다.
이 블로그 게시물에서 분석한 코드는 Panda 패키지와 요청 라이브러리를 사용하여 웹 사이트에서 재무 데이터를 추출합니다. 그런 다음 데이터를 조작하여 특정 회사의 최신 연간 성능 데이터만 포함하는 새 데이터 프레임을 만듭니다. 마지막으로, 코드는 2021.12년의 재무 데이터를 출력합니다.
전반적으로 이 코드는 재무 데이터 분석에 판다를 사용하는 방법의 좋은 예입니다. 그것은 재무 데이터 분석의 일반적인 사용 사례인 웹 사이트에서 데이터를 추출하고 조작하는 데 판다를 사용할 수 있는 방법을 보여줍니다. 이 코드는 다양한 회사 또는 기간의 재무 데이터를 추출하도록 쉽게 수정할 수 있으므로 재무 분석가와 비즈니스 의사 결정자에게 유용한 도구가 됩니다.
결론적으로, Panda는 재무 데이터 분석을 위한 강력한 도구이며, 이 코드 스니펫은 그것을 사용하는 방법의 좋은 예입니다. 판다는 정보에 입각한 비즈니스 결정을 내리는 데 중요한 재무 데이터를 쉽게 추출하고 조작할 수 있도록 합니다.
'Python' 카테고리의 다른 글
Pydantic 2.0 업데이트: Python의 데이터 검증 및 구문 분석 향상 (0) | 2023.09.07 |
---|---|
[python] httpx BeautifulSoup 를 이용한 demoday 크롤링 (0) | 2023.03.10 |
python url parameter 인코딩 디코딩 변경방법 (0) | 2023.02.10 |
python error ERROR: 대상 컴퓨터에서 연결을 거부했으므로 연결하지 못했습니다. 파이썬 에러 해결 (0) | 2023.02.10 |
python Class Function 정의 기능 설명 (0) | 2023.02.07 |
댓글