저작권 안내: 저작권자표시 Yes 상업적이용 No 컨텐츠변경 No

스프링5 입문

JSP 2.3

JPA 입문

DDD Start

인프런 객체 지향 입문 강의

'태그 제거'에 해당되는 글 1건

  1. 2006.05.08 [팁] 문자열에서 HTML 태그 제거하기 (5)
정규 표현식을 사용해서 문자열의 HTML 태그를 제거하는 방법을 살펴본다.

정규 표현식을 사용하여 HTML 태그 제거하기

웹 프로그래밍을 하다보면 DB에 저장된 내용중 일부분을 보여주어야 하는 경우가 있다. 예를 들어, 게시판의 내용중 일부를 보여준다거나 제목의 일부만 보여주어야 하는 경우가 그렇다. 이렇게 내용의 일부만 보여주어야 할 때 주의해야 할 점은 내용에 포함된 HTML 태그를 제거해주어야 한다는 점이다. 자바 1.4부터 정규 표현식 기능이 추가되었는데, 이를 사용하면 매우 간단하게 String에 포함된 HTML 태그를 제거할 수 있다. 본 팁에서는 이 정규 표현식을 사용해서 HTML 태그를 제거하는 방법을 설명하겠다.

먼저 HTML 태그는 < 로 시작해서 > 로 끝나고, 종료 태그의 경우는 </ 로 시작하거나 또는 />로 끝난다. 따라서, 다음과 같은 정규 표현식은 HTML 태그를 모두 포함하게 된다.

    <(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>

자바 1.4부터 String.repalceAll(String regex, String replacemenet) 메소드를 제공하는데, 이 메소드는 문자열에서 regex의 정규 표현식에 일치하는 부분을 replacement로 취환해주는 기능을 제공한다. 따라서, 특정 문자열에 HTML 태그를 제거하려면 위의 정규 표현식을 다음과 같이 적용하면 된다.

    String text = "......";
    String textWithoutTag = text.replaceAll("<(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>", "");

관련링크:
Posted by 최범균 madvirus

댓글을 달아 주세요

  1. hyshin 2012.04.03 11:20 신고  댓글주소  수정/삭제  댓글쓰기

    큰 도움 됐습니다~ 좋은 정보 감사합니다~

  2. 감사합니다 2012.05.05 16:49 신고  댓글주소  수정/삭제  댓글쓰기

    태그 정규 표현식 감사히 얻어갑니다! ^^

  3. eizt 2013.03.21 15:48 신고  댓글주소  수정/삭제  댓글쓰기

    정규식 감사합니다!!!!!!!

  4. 나돌라 2014.02.13 13:57 신고  댓글주소  수정/삭제  댓글쓰기

    잘 쓰고 갑니다~

  5. 우와!! 2014.04.16 16:48 신고  댓글주소  수정/삭제  댓글쓰기

    당신은 진정한 지식인 감사합니다!!!