반응형
[자주 사용하는 문자 클래스]
[0-9] 또는 [a-zA-Z] 등은 무척 자주 사용하는 정규 표현식이다. 이렇게 자주 사용하는 정규식들은 별도의 표기법으로 표현할 수 있다. 다음을 기억해 두자.
\d - 숫자와 매치, [0-9]와 동일한 표현식이다.
\D - 숫자가 아닌 것과 매치, [^0-9]와 동일한 표현식이다.
\s - whitespace 문자와 매치, [ \t\n\r\f\v]와 동일한 표현식이다. 맨 앞의 빈 칸은 공백문자(space)를 의미한다.
\S - whitespace 문자가 아닌 것과 매치, [^ \t\n\r\f\v]와 동일한 표현식이다.
\w - 문자+숫자(alphanumeric)와 매치, [a-zA-Z0-9]와 동일한 표현식이다.
\W - 문자+숫자(alphanumeric)가 아닌 문자와 매치, [^a-zA-Z0-9]와 동일한 표현식이다.
반응형
'Python' 카테고리의 다른 글
[디시인사이드] 김소혜 게시판 댓글 웹 크롤링 (0) | 2017.01.06 |
---|---|
[디시인사이드] 김소혜 게시판 크롤링 (0) | 2017.01.06 |
[파이썬3] 파이썬 인터프리터에서 테스트 (0) | 2017.01.06 |
[파이썬3] 파이썬 Beautiful Soup 4 설치하기 (0) | 2017.01.06 |
[네이버] 웹툰 스크래핑 (0) | 2017.01.06 |
댓글