본문 바로가기
카테고리 없음

Pandas query assign cut 함수 데이터 처리와 조작

by 퍼포먼스마케팅코더 2023. 8. 11.
반응형

Pandas 라이브러리의 query, assign, cut 함수는 데이터 처리와 조작을 위한 다양한 기능을 제공합니다.

1. query()

query() 메서드는 DataFrame에서 특정 조건을 만족하는 행을 필터링하기 위해 사용됩니다. 문자열 표현식을 사용하여 조건을 지정하고, 해당 조건을 만족하는 행으로 구성된 새로운 DataFrame을 반환합니다.

예시:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
result = df.query('A > 1 and B < 6') # A가 1보다 크고 B가 6보다 작은 행을 선택

2. assign()

assign() 메서드는 DataFrame에 새로운 열을 추가하거나 기존 열을 변경하기 위해 사용됩니다. 새로운 열의 이름과 값을 지정하여 새 열을 만들거나 기존 열을 변경할 수 있으며, 원본 DataFrame을 변경하지 않고 새로운 DataFrame을 반환합니다.

예시:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3]})
result = df.assign(B = df['A'] * 2) # 'A' 열의 값을 2배한 새로운 'B' 열을 생성

3. cut()

cut() 함수는 연속형 변수를 여러 구간으로 나누는 데 사용됩니다. 지정된 구간의 경계값을 기준으로 값을 분류하며, 카테고리형 데이터를 생성할 수 있습니다. 히스토그램과 같은 분석에서 연속된 값을 구간별로 나눌 때 유용합니다.

예시:

import pandas as pd

ages = [15, 25, 35, 45, 55]
bins = [10, 20, 30, 40, 50, 60]
result = pd.cut(ages, bins) # 지정된 구간으로 나이를 나눔

각 함수는 DataFrame과 Series에서 데이터를 효과적으로 처리하고 분석하는 데 도움이 되는 강력한 도구입니다.

반응형

댓글