완성형 한글용 정규식 툴
범위에서 일부 제외
도움말
사용법
-
범위에서 일부 제외
예를들어 전체 초성
/[ㄱ-ㅎ]/
에서 ㅂ만 제거시 전체선택후 ㅂ을 해제하면 됩니다. -
모두 선택
전체선택기능을 이용하세요.
-
일부 완성형 제외
정규표현식 묶음
[가나]
, 괄호(가|나)
, 유니코드/[\uAC00]/u
등 으로 제외할 글자 또는 범위를 입력할 수 있습니다.잘못 입력한 예시:
/(가나다)/
단어 '가나다'는 이 툴에서 다루지 않음. -
정규표현식을 Unicode형태로 표현하기
소스코드 작성시 보기엔 불편하지만, 호환성을 위해 한글을 유니코드 형식으로 작성해야하는 경우를 위해 추가(2024년 4월 업데이트)하였습니다.
-
한글 목록을 *.txt파일로 저장
테스트를 위해 한글 목록이 필요한 경우를 위해 생성된 정규식에 포함된 한글목록을 텍스트로 저장하는 기능을 추가(2024년 4월 업데이트)하였습니다.
이 툴이 만들어진 이유
완성형 한글은 프로그래머가 사용하기에 유니코드적인 연속성이 떨어집니다. (= 일반적인 생각방식으로 범위를 지정하기 어려우며, 외웠다고 해도 틀릴가능성을 배제하기 어렵기 때문에 다시 찾아봐야합니다.)
/[가-힣]/
에서 '바'만을 제거시 /[가-밓박-힣]/
이지만..? 프로그래머여도 유니코드 순서를 다시 찾지않고 완성형 한글에서 일부제외 정규식을 만들긴 어렵습니다.
ㄱ과 모음으로만 이뤄진 완성형 한글 범위는 /[가-기]/가 아닌 /[가개갸걔거게겨계고과괘괴교구궈궤귀규그긔기]/
입니다.. (이런 경우에 일일히 치기는 귀찮죠.)
특정 받침만, 특정 모음만 등 범위를 찾고 적용하는데 상당히 어려우며, 이런 툴이 있으면 언젠가 한글 정규식을 사용할때 도움될 것 같아 제작하게 되었습니다.
참고용으로 유니코드 순서가 선택버튼 바로 아래 표기되어 있습니다.
순서를 보시면 아시겠지만 유니코드가 배정되어있으나 완성형에서 사용하지 않는 것은 숨김처리 되어있습니다.
완성형 한글 정규식에서 범위를 만들때는 단순히 ㄱㄴㄷ 순서 뿐만 아니라 사용하지 않는지도 범위(/[가-힣]/
)로 표기하기 위해 고려해야 합니다.
순서만 보면 그나마 직관적이나 완성형으로 가면서 일차방정식에서 고차방정식으로 가는 느낌으로 복잡해집니다.
한글 정규식을 쓸 일이 있을때 이 툴을 이용해보세요.
또한 이 툴은 폰트 테스트용 한글을 만들때 자주 안쓰이는 한글 목록을 불러오는 용도 등 다양한 한글이 필요한 상황에 활용가능합니다.
정규식 관련 팁
-
의도적인지 알 수 없으나, 제가 정규식 사용중 발견한 내용으로는 컴퓨터언어(C#, Python, Javascript 등)에 따라 정규식 처리 결과가 다른 경우가 나타날 수 있습니다.
C#에서는
\w
에 로컬 언어(한국어 등)가 포함됩니다. Javascript등에서는 영어(대소문자)와 숫자만 포함되는것과 차이가 있습니다.정규식 처리엔진에 따라 예약어는 달라질 수 있기 때문에 필요한 범위를 입력해서 사용하는 편이 더 안전해보입니다.
혹시 추가로 더 필요한 기능이 있거나, 잘못된 내용을 발견하였거나, 추가하고 싶은 팁이 있다면 아래 '오류제보 / 기능제안'에 댓글 남겨주세요.
'일부 완성형 제외' 기능은 원래 대괄호 [] 묶음만으로도 원하는 글자 정규식을 쓸 수 있어 대괄호만 지원했었으나, 사용하는 코드에 따라 호환성을 높이고 유니코드도 지원하기 위해 2024년 12월 업데이트 하였습니다.
오류제보 / 기능제안 글 작성하러가기