반응형
파이썬 BeautifulSoup 하위 태그 제거 extract() 사용 방법
이거는 파이썬에서 제가 간혹씩 쓸 때마다 하는 게 있는데 하위 태그에서 제거하는 그러한 방법 사용법 이거에 대해서 적은 거예요. BeautifulSoup라는 게 있죠. 많이 사용하시는 것 같은데 하위 태그를 제거를 한다든가 아니면 공백 텍스트만 추출한다거나 쉼표를 제거한다거나 다양한 부분이 있겠죠. 그럴 때 쓰이는 코딩 중에 하나입니다.
많이 많이 쓰이기도 해요. 저는 많이 쓰는 편이지라 주로 웹 사이트에서 크롤링 이런 거 할 때 쓰이는 거라고 생각하시면 될 것 같습니다. 간혹씩 이거 사용하긴 하는데 생각이 안 날 때가 있거든요. 이거 유용한 건데 많이 헤매는 경우가 있어서 기록해 두신 거라고 보시면 될 것 같습니다.
results = html.select("tr", {"class" : ""})
for ar in results :
try : #제목
title = ar.find("a", {"class" : "subject-link"}) #타이틀 가져오기
title_2 = title.span.extract() #span 태그 제거
title_3 = title.get_text().strip() #공백 및 텍스트만 추출
title_4 = title_3.replace(",", "") #쉼표제거
반응형
'Python' 카테고리의 다른 글
[파이썬] 영화진흥위원회 영화 정보 DB API 사용 방법 (0) | 2022.08.12 |
---|---|
[파이썬] 한국 수출입 은행 환율 Open API 사용 방법 (0) | 2022.08.12 |
[파이썬] 정규식 표현 정리 (0) | 2022.08.12 |
[파이썬] 네이버 블로그 정규식으로 포스팅 텍스트 교정 (0) | 2022.08.12 |
[파이썬] 인스타그램 DM 발송 자동화 (0) | 2022.08.09 |
댓글