http://jokergt.tistory.com/52 에서 그대로 가져왔습니다. (문제시 삭제하겠습니다.)
파이썬에서 한글만 추출하는 정규식.
# -*- coding: utf-8 -*- import re s='韓子는 싫고, 한글은 nice하다. English 쵝오 -_-ㅋㅑㅋㅑ ./?!' hangul = re.compile('[^ ㄱ-ㅣ가-힣]+') # 한글과 띄어쓰기를 제외한 모든 글자 # hangul = re.compile('[^ \u3131-\u3163\uac00-\ud7a3]+') # 위와 동일 result = hangul.sub('', s) # 한글과 띄어쓰기를 제외한 모든 부분을 제거 print (result) result = hangul.findall(s) # 정규식에 일치되는 부분을 리스트 형태로 저장 print (result)
'Python > 2.7 information' 카테고리의 다른 글
전문가를 위한 파이썬 책에서 알아낸 것들.. (0) | 2017.07.15 |
---|---|
multiprocessing에서 여러 프로세스가 동시 변수 참조하는 문제 (2) | 2017.05.29 |
비동기 처리 관련.(python 3) (0) | 2017.04.30 |
yield from, generator(yield) vs coroutine (python 3) (0) | 2017.04.26 |
mongo db (0) | 2017.04.19 |