완성형 한글용 정규식 툴

 

 

  

범위에서 일부 제외

도움말

사용법

  1. 범위에서 일부 제외

    [ㄱ-ㅎ]에서 [ㅂ]를 제거시 전체선택후 ㅂ을 해제하면 됩니다.

  2. 모두 선택

    전체선택기능을 이용하세요.

  3. 일부 완성형 제외

    정규표현식 묶음[]으로 제외할 글자 또는 범위를 입력할 수 있습니다. (꼭 대괄호 안에 묶어야하고, | 등의 표현은 제공되지 않습니다.)

  4. 정규표현식을 Unicode형태로 표현하기

    소스코드 작성시 보기엔 불편하지만, 호환성을 위해 한글을 유니코드 형식으로 작성해야하는 경우를 위해 추가(2024년 4월 업데이트)하였습니다.

  5. 한글 목록을 *.txt파일로 저장

    테스트를 위해 한글 목록이 필요한 경우를 위해 생성된 정규식에 포함된 한글목록을 텍스트로 저장하는 기능을 추가(2024년 4월 업데이트)하였습니다.

 

이 툴이 만들어진 이유

완성형 한글은 프로그래머가 사용하기에 유니코드적인 연속성이 떨어집니다. (= 일반적인 생각방식으로 범위를 지정하기 어려우며, 외웠다고 해도 틀릴가능성을 배제하기 어렵기 때문에 다시 찾아봐야합니다.)

/[가-힣]/ 에서 '바'를 제거시 /[가-밓박-힣]/ 이지만 아무리 프로그래머여도 유니코드 순서를 다시 찾지않고 완성형한글 일부제외 정규식을 만들긴 어렵습니다.

ㄱ과 모음으로만 이뤄진 완성형 한글 범위는 /[가-기]/가 아닌 /[가개갸걔거게겨계고과괘괴교구궈궤귀규그긔기]/ 입니다.. (일일히 치기는 귀찮죠.)

특정 받침만, 특정 모음만 등 범위를 찾고 적용하는데 상당히 어려우며, 이런 툴이 있으면 언젠가 한글 정규식을 사용할때 도움될 것 같아 제작하게 되었습니다.

 

정규식 관련 팁

  • 의도적인지 알 수 없으나, 제가 정규식 사용중 발견한 내용으로는 컴퓨터언어(C#, Python, Javascript 등)에 따라 정규식 처리 결과가 다른 경우가 나타날 수 있습니다.

    C#에서는 \w 에 로컬 언어(한국어 등)가 포함됩니다. Javascript등에서는 영어(대소문자)와 숫자만 포함되는것과 차이가 있습니다.

    정규식 처리엔진에 따라 예약어는 달라질 수 있기 때문에 필요한 범위를 입력해서 사용하는 편이 더 안전해보입니다.

 

혹시 추가로 더 필요한 기능이 있거나, 잘못된 내용을 발견하였거나, 추가하고 싶은 팁이 있다면 아래 '오류제보 / 기능제안'에 댓글 남겨주세요.

오류제보 / 기능제안   글 작성하러가기