URL Filtering용 정규식을 작성하자

Posted 2010. 7. 21. 23:02
문서나 Text중에서 url의 위치를 찾고자 하는 경우가 있다.

일반적인 정규식에서 URL을 찾는 방법의 정규식은 다음과 같다.

https?://[-\w.]+(:\d+)?(/([\w/_.]*)?)?

설명 : 
https?://에서 물음표는 s가 있다면 하나와 일치한다는 뜻이니 http://나 https://와 일치한다.
[-\w.]+ 는 호스트 이름과 일치한다.
(:\d+)? 는 두번째와 여섯번째 URL과 같이 포트번호가 있을경우 일치한다.
(/([\w/_.]*)?)? 는 경로와 일치하는데, 바깥쪽 하위 푷ㄴ식은 슬래시가 존재한다면 슬래시 하나와 일치하고 안쪽 하위 표현식은 경로 자체와 일치한다..
위의 정규식은 호스트 이름, 포트번호, 경로로 이루어진 URL 대부분을 제대로 처리가능하다.

[참고문헌 : 손에잡히는정규표현식]


P.S. 다음의 링크는 자바에서 정규식을 어떻게 사용하고 응용하는지 참고.

http://jakarta.tistory.com/40

http://yanggoony.tistory.com/42


'개발노트' 카테고리의 다른 글

eclipse svn 계정변경  (0) 2011.03.15
[펌] 영역별 보안서버(https) 적용방법  (0) 2010.08.29
java Naming rule 링크모음  (0) 2010.06.02
Cookie Class 정리  (0) 2010.06.01
Cookie를 이용한 자동로그인 사용법  (0) 2010.06.01