본문 바로가기
Python

[파이썬] BeautifulSoup 하위 태그 제거 extract() 사용 방법

by 퍼포먼스마케팅코더 2022. 8. 12.
반응형

파이썬 BeautifulSoup 하위 태그 제거 extract() 사용 방법

이거는 파이썬에서 제가 간혹씩 쓸 때마다 하는 게 있는데 하위 태그에서 제거하는 그러한 방법 사용법 이거에 대해서 적은 거예요. BeautifulSoup라는 게 있죠.  많이 사용하시는 것 같은데 하위 태그를 제거를 한다든가 아니면 공백 텍스트만 추출한다거나 쉼표를 제거한다거나 다양한 부분이 있겠죠.  그럴 때 쓰이는 코딩 중에 하나입니다. 

 

많이 많이 쓰이기도 해요. 저는 많이 쓰는 편이지라 주로 웹 사이트에서 크롤링 이런 거 할 때 쓰이는 거라고 생각하시면 될 것 같습니다.  간혹씩 이거 사용하긴 하는데 생각이 안 날 때가 있거든요.  이거 유용한 건데 많이 헤매는 경우가 있어서 기록해 두신 거라고 보시면 될 것 같습니다.

    results = html.select("tr", {"class" : ""})
    for ar in results :
        try :  #제목
            title = ar.find("a", {"class" : "subject-link"})  #타이틀 가져오기
            title_2 = title.span.extract() #span 태그 제거
            title_3 = title.get_text().strip() #공백 및 텍스트만 추출
            title_4 = title_3.replace(",", "") #쉼표제거
반응형

댓글