주요글: 도커 시작하기
반응형
XML과 XML 관련 기술에 대해서 간략하게 알아보며, 자바와 XML 사이의 관계에 대해서 알아본다.

XML은 무엇인가?

XML! XML! XML! 만약 여러분이 IT 세상의 흐름과 함께 하고 있다면 XML에 대한 많은 것들에 대해서 들어보았을 것이며, 이제 막 개발자의 세계에 발을 들여놓았다 하더라도 적어도 한번 정도는 'XML'이란 단어를 들어보았을 것이다. 현재 마이크로소프트, 썬 마이크로시스템즈, 오라클, IBM과 같은 IT 분야를 대표하는 대부분의 기업들은 XML을 분석(parsing)하고 변환(transformation)할 수 있는 여러 도구들을 제공하고 있으며, 최근에 각 기업이 내 놓고 있는 제품들은 XML을 여러 형태로 사용하고 있다. 이러한 XML 영역의 증가추세는 앞으로 더욱 가증될 것으로 예상된다. 이번 Article에서는 초보 개발자 뿐만 아니라 아직까지 XML이 무엇인지에 대해서 자세하게 알지 못하는 개발자들을 위해 XML이 무엇인지, 어디서 XML을 사용하는지 그리고 XML을 왜 사용하는 지에 대한 전반적인 내용을 간략하게 알아볼 것이다.

XML의 정의

XML은 'Extensible Markup Language'이다. 우리말로 하자면 '확장가능한 마크업 언어' 정도가 될 것이다. XML은 앞서 나온 SGML과 마찬가지로 다른 언어를 정의할 때 사용되는 메타언어(metalanguage)이다. 하지만, XML은 SGML 보다 훨씬 더 간단하다. 또한, 오늘날 가장 많이 사용되고 있는 마크업 언어인 HTML의 확장성이 거의 없는 반면에 XML은 거의 무한의 확장성을 갖고 있다. 이러한 XML의 확장성은 XML이 문법(grammar)이나 '태그집합(tag set)'을 규정하지 않은 마크업 언어이기 때문에 가능하다. 간단히 비교를 하기 위해 HTML과 비교해보자. 현재 나와 있는 HTML 규약은 사용자가 사용할 수 있는 태그 및 속성의 종류를 제한하고 있다. 다시 말해서, HTML은 미리 정의된 태그 집합과 문법을 갖고 있다. 예를 들어, HTML에서 <table> 태그를 사용할 수는 있지만, <furniturelist> 태그를 사용할 수는 없다. HTML 문서를 사용하는 어플리케이션(거의 웹 브라우저일 것이다)에 대해 <table> 태그는 특정한 의미를 지니며 표의 시작을 나타낼 때 사용되는 반면에, <furniturelist> 태그는 HTML 문서를 사용하는 어플리케이션에 대해 어떤 의미도 갖지 않으며 웹 브라우저는 이 태그를 처리하지 않고 무시할 것이다. 이는 HTML을 정의할 때, HTML 규약에 사용가능한 태그 집합을 정의했기 때문에 그렇다. 따라서 새로운 태그를 추가하거나 불필요한 태그를 삭제하기 위해서는 새로운 버전의 HTML 규약을 발표해야만 한다. 또한, HTML은 언어에 정의된 태그의 올바른 사용법을 정의한 '문법(grammar)'을 갖고 있다. 예를 들어, <tr> 태그는 반드시 <table> 태그에 중첩되어야 하며, <table> 태그는 width, border, cellpadding과 같은 속성의 값을 지정할 수는 있지만 type이라는 속성을 지정할 수는 없다.

반면에 XML은 미리 정의된 태그 집합이나 문법을 규정하고 있지 않기 때문에 HTML과는 달리 완전한 확장성을 가진다. XML 문서 작성자는 원하는 태그를 사용할 수 있으며, 태그에 원하는 속성을 지정할 수 있으며, 원하는 형태로 태그를 중첩시킬 수 있다. 즉, 자신만의 태그 집합과 문법을 만들 수 있다는 것이다. 예를 들어 다음의 간단한 XML 문서를 살펴보자.

<?xml version="1.0" encoding="euc-kr"?>
<furniture-list>
    <table type="B" class="보급형">
        <productName>XX 책상</productName>
        <drawer>4</drawer>
        <hasBookshelf>true</hasBookshelf>
        <hasLamp>true</hasLamp>
        <target>학생</target>
        <price>130000</price>
    </table>
    <chair class="고급형">
        <productName>듀오 의자</productName>
        <target>모두</target>
        <price>35000</price>
    </chair>
    <bed>
        <productName>에이스 침대</productName>
        <size>2</size>
        <target>모두</taget>
        <price>280000</price>
    </bed>
</furniture-list>

예제 XML 문서를 보면 HTML과는 많이 다르다는 것을 알 수 있다. 여기서 사용된 <table>, <size>, <target>과 같은 태그는 문서 작성자가 만든 것이며, 각 태그간의 중첩 관계 역시 작성자에 의해 구성된 것이다. 이것이 바로 XML의 힘이다. 여러분은 XML 규약이 요구하는 일반적인 구조에 따라 XML 문서를 만드는 한, 다양한 방법으로 데이터의 내용을 정의할 수 있으며, 이에 따라 데이터를 표현하는 데 있어 HTML로는 불가능한 유연성을 갖게 된다.

이러한 XML의 유연성은 XML의 가장 큰 장점중의 하나이면서 동시에 단점이 되기도 한다. 한 가지 목적을 위해 여러 다양한 방법을 사용할 수 있기 때문에, 데이터의 표현과 변환을 처리하기 위한 많은 다른 규약들이 존재하며, 이러한 규약을 통해서 XML은 유연성에 의해 발생하는 단점을 보완하고 있다. 실제로 XML 기술이라고 하면, 단순히 XML을 의미하기 보다는 XML 및 XML 관련 기술을 의미하는 경우가 더 많다.

XML을 HTML과 비교할 때, 또 하나의 큰 차이점은 XML은 표현(presentation)을 위한 데이터가 아닌 내용을 위한 데이터라는 점이다. HTML의 경우 <code>와 <strong>은 그 태그의 값이 각각 프로그래밍 코드와 강조된 것이라는 것을 나타내는 내용 기반의 태그인 반면에 <b>와 <i>는 태그는 내용을 어떻게 출력하라는 표현에 중점을 태그이다. 즉, 표현과 내용이 하나의 문서에 혼합되어 있는 것이다. 따라서, XML 문서를 작성할 때 표현을 어떻게 할 것인가에 대해서는 전혀 생각할 필요가 없으며, 단지 내용을 어떻게 XML 문서로 나타낼 것이가엔 대해서만 생각하면 된다.

XML에 대해서 이해하기 위해서는 XML 뿐만 아니라 XML 관련 기술에 대해서도 이해하고 있어야 한다. 이제부터 XML과 관련된 기술들에 대해 간단하게 알아보도록 하자.

XML

XML은 모든 XML 관련 기술의 핵심이다. XML은 핵심 언어 자체를 정의하고 메타데이터 타입의 구조를 정의한다. XML에 기반한 모든 다양한 기술을 통해서 개발자와 콘텐트 관리자들은 데이터 관리와 전송 측면에 있어서 전에 없던 유연성을 제공받게 되었다. 현재 1.0 규약의 권고안(Recommendation)이 나온 상태이다. XML 1.0 규약은 http://www.w3.org/TR/REC-xml에서 참조할 수 있다.

XML 문서는 처리 지시어(Processing Instruction; PI)와 DTD(Document Type Definition; 문서 타입 정의)를 가질 수 있다. PI는 XML 문서를 사용하는 어플리케이션이 특정한 작업을 하도록 지시하는 일종의 명령어이다. DTD는 XML 문서에서 사용할 태그가 따라야 할 문법(사용가능한 태그, 사용가능한 속성, 가능한 태그의 중첩)을 정의한다. 즉, XML 문서는 DTD에 의해 제약받게 된다. 만약 XML 문서가 DTD를 참조하고 있다면, 그 문서는 반드시 DTD에서 지정한 문법에 지정되어 있는 태그와 속성만을 사용해야 하며, DTD에 정의되어 있는 순서대로 각 태그의 순서를 지켜야 하며, DTD에 정의된 중첩 순서대로 각 태그의 중첩 순서를 정해주어야 한다. DTD를 통해서 XML 문서는 모호함을 없앨 수 있게 된다. 예를 들어, 앞의 예제 XML 문서에서 <table> 태그가 책상을 의미하는지 혹은 표를 의미하는지, 그리고 class 속성이 가질 수 있는 값이 어떤 것이 있는 지 어떻게 결정할 수 있는가? DTD를 통해서 이러한 결정들을 쉽게 할 수 있게 된다. 또한, DTD는 XML을 사용하여 데이터를 주고 받는 어플리케이션 사이에서 중요한 역할을 한다. 왜냐면, 두 어플리케이션은 서로를 이해하기 위해서 각 시스템 사이에 협의된 포맷팅(formatting)과 구문을 필요로 하며, DTD가 바로 이러한 것을 제공하기 때문이다.

참고로, DTD는 XML 형식이 아닌 그것만의 규약을 갖고 있다. 예를 들면 DTD는 다음과 같은 형태로 구성되어 있다.

<!ELEMENT furniture-list (table | chair | bed)+>
<!ELEMENT table (productName, drawer, hasBookshelf, hasLamp, target, price) >
<!ATTLIST tale
            type CDATA #REQUIRED
            class (보급형, 고급형) "보급형">
<!ELEMENT productName #PCDATA>
<!ELEMENT drawer #PCDATA>
.....

완전히 XML과 다른 형태로 XML 문서의 문법을 지정하는 것을 알 수 있다. 이에 따라 DTD는 몇 가지 한계점을 갖고 있으며, 이는 다음과 같다.

  • 계층(hierarchy) 개념이 없다. (즉, 개층 개념이 없다!)
  • 이름공간을 유연하게 처리하기 어렵다.
  • XML 문서 사이에 연관성을 줄 수 있는 방법을 갖고 있지 않다.
이러한 한계점이 발생하게 된 원인은 DTD 규약을 처음 작성할 때 지금처럼 많은 곳에서 XML이 사용될 것이라고 예상하지 못했기 때문이며, 따라서 지금처럼 한계를 갖게 되는 것은 어쩌면 당연한 것이다. 하지만, 이러한 한계점은 개발자들을 괴롭히는 요인이 되기도 한다. 따라서 이러한 한계점을 없애야 할 필요성이 생겼으며, 그것들을 해결하기 위해 나온 규약이 바로 XML 스키마(Schema)이다. XML 스키마에 대해서는 잠시 뒤에 알아보기로 하자.

이름공간(Namespace)

이름공간은 요소(element; 일반적으로 태그를 element라고 하며, 요소라고 번역한다)의 접두어(prefix)와 URI 사이의 매핑(mapping)이다. 이름공간은 일반적으로 태그가 속한 이름공간에 따른 이름 충돌 문제를 해결할 때 사용된다. 예를 들어, 앞의 XML 예제에서 <table>, <chair>, <bed> 태그가 상점에서의 판매 가격과 공장도 가격을 표시해야 한다고 해 보자. 이 경우 여러분은 어떤 태그를 사용할 것인가? 이미 <price> 태그가 사용되고 있기 때문에, <factory-price>와 같은 새로운 태그를 사용해야 할 것이다. 만약 할인가격이나 도매가격과 같은 또 다른 형태의 가격이 필요하다면? 필요한 만큼의 <xxx-price> 형식의 태그를 만들어야 할 것이다. 이름공간은 접두어를 사용하여 같은 이름을 갖는 태그를 사용할 수 있도록 해 줌으로써 이러한 문제점을 해결해준다. 예를 들어, 이름공간을 사용하면 상점 판매가, 공장도가격, 도매가격을 각각 <shop:price>, <factory:price>, <wholesale:price>의 태그로 표시할 수 있다. 즉, 같은 이름('price')을 가지는 세 개의 태그를 별도의 이름공간에 속하게 함으로써 충돌없이 같은 이름을 가진 태그(즉, 같은 의미를 갖는 태그)를 사용할 수 있는 것이다. 여기서 세미콜론 앞에 있는 이름이 접두어이며, 각 접두어는 특정한 URI와 연관되어 있다. 이름공간은 XML 문서에서 자주 사용고 있으며 XML 스타일쉬트, XML 스키마를 비롯한 많은 XML 관련 규약에서도 사용되고 있다. 이름 공간 관련 규약은 http://www.w3.org/TR/REC-xml-names/에서 참조할 수 있다.

XSL와 XSLT

XSL은 'Extensible Stylesheet Language'을 의미하며, 한 형식의 XML 데이터를 다른 형식으로 변환하고자 할 때 사용된다. 예를 들어, 하나의 XML 문서를 HTML, PDF, PS 형태로 변환해야 한다고 가정해보자. 이 경우 우리는 XML 문서를 일일이 복사하여 각 포맷에 알맞게 변환해야 할 것이다. XSL은 이렇게 일일이 복사할 필요없이, 이러한 종류의 작업을 수행해주는 스타일쉬트를 정의해주는 방식을 제공한다. 다시 말하면, XSL이 XML 데이터를 표현을 위한 포맷으로 변경해준다는 것이다. 앞에서 XML 문서는 내용을 위한 데이터라고 했던 점을 기억할 것이다. 그렇다면 XML 문서를 어떻게 웹 브라우저와 같은 클라이언트 프로그램에서 표현할 수 있을 것인가? 바로 XSL을 통해서 가능하게 되며, XSL은 내용과 표현을 완전히 분리해준다. 문서를 변환하기 위해 XSL 문서는 '포맷팅 객체(formatting object)'를 포함할 수 있다. 포맷팅 객체는 특정한 이름의 태그이며, 이 태그는 변환할 문서의 타입에 맞는 알맞은 내용으로 변경될 수 있다. 예를 들어 XML 문서를 PDF로 변환할 경우 포맷팅 객체에 해당하는 태그는 PDF에 알맞은 정보로 변경될 것이다.

XSLT는 'Extensible Stylesheet Language Transformation'를 의미하며, 포맷팅 객체가 아닌 완전한 텍스트 기반의 변환을 나타낸다. 일반적으로 XML 문서의 변환은 텍스트 위주로 이루어지기 때문에, 따라서 XSLT가 많이 사용된다.

XML 문서를 다른 형식으로 변환하는 것은 보통 XML 문서에 있는 특정 요소 A를 변환될 문서의 특정 요소 B로 바꾼다는 것을 의미한다. 이러한 변환을 처리하기 위해서는 어떤 요소를 변형할 지, 그리고 요소의 어떤 속성의 값을 처리할 지, 혹은 각 요소의 값에 따라 어떤 형식으로 변환할지를 결정할 수 있어야 한다. 이러한 요소의 선택 문제는 XPath를 통해서 이루어지며 XPath에 대해서는 잠시 뒤에 알아본다.

XSL 1.0 규약은 http://www.w3.org/TR/xsl/에서 참조할 수 있으며, XSLT 1.0 규약은 http://www.w3.org/TR/xslt에서 참조할 수 있다.

XML 스키마(Schema)

앞에서 DTD는 그 자체가 XML로 되어 있지 않으며, 뿐만 아니라 그에 따른 여러가지 한계점들이 발생한다고 하였다. DTD가 XML의 계층 구조를 공유하지 않는 다는 것은 이미 앞에서 DTD의 한계점에서 언급한 바 있다. 이 외에도 DTD는 XML과 같은 방법으로 데이터를 표시할 수 조차 없다. 반면에 DTD 이외에 XSL, XHTML, 이름공간 등의 다른 XML 관련 규약들은 그것의 목적을 표시하기 위해서 XML의 요소, 속성 등을 사용한다. 이러한 상황은 DTD를 다소 이상한 것으로 만들었으며, XML 문서를 어떻게 작성해야 한다는 것을 정의하기 위해 일반적으로 DTD를 사용하기 때문에 어떤 혼동을 일으키기도 했다.

XML 스키마는 XML 문서를 어떻게 작성해야 한다는 것을 정의하기 위해 XML 그 자체를 사용함으로써 DTD가 안고 있던 많은 한계점을 해결하였다. "데이터에 대한 데이터를 정의하는" 방법으로서 XML 그 자체를 사용함으로써 XML 스키마는 계층적 구조를 사용할 수 있으며, 확장성을 갖게 되었으며, 이름공간의 처리 역시 손쉽게 할 수 있게 되었다.

XML 스키마의 요구안을 http://www.w3.org/TR/NOTE-xml-schema-req에서 참조할 수 있다.

XPath

앞에서 XSLT에 대해서 언급할 때, XPath를 사용하여 변환할 대상을 선택하였다. XPath 규약은 XML 문서에 있는 특정한 항목을 어떻게 위치시킬지를 정의하고 있으며, XML 문서에 있는 어떤 '노드(node)'를 참조함으로써 이것을 하게된다. XPath는 XML 문서를 트리로 간주하며, 따라서 여기서 노드는 요소, 속성 또는 텍스트 데이터를 포함한 XML 데이터의 일부를 나타낸다. 실제로 노드를 위치시키기 위해서 XPath는 표현식을 사용한다. 이 표현식이 어떻게 구성되는 지에 대한 내용은 http://www.w3.org/TR/xpath에서 참고할 수 있다.

XQL

XQL은 'Extensible Query Language'를 의미하며, Query에서 알 수 있듯이 XQL은 XML 문서 형식을 사용하여 쉽게 데이터베이스 질의(query)를 표현할 수 있도록 하기 위해 설계된 질의 언어(query language)이다. XQL은 질의(query) 언어를 표현하기 위해 XPath 개념을 사용하고 있다. 왜 XPath 개념을 사용하는지 알아보기 위해 데이터베이스의 특정한 테이블로부터 데이터를 읽어오는 SQL 문장을 생각해보자.

select id, name, password from member_table where id = 'madvirus'

위의 SQL 문장을 보면 member_table이라는 테이블로부터 id 값이 madvirus인 행의 id, name, password 필드값을 읽어오는 것을 알 수 있다. 여기서 중요한 것은 id, name, password나 member_table과 같은 것들이 모두 XML 문서의 특정한 노드로간주될 수 있다는 점이다. (데이터베이스와 XML과의 매핑을 한번 생각해보면 그럴 것이라는 것을 알 수 있을 것이다). 또한, XQL은 질의의 결과 집합을 표준 XML을 사용하여 표시한다. 이때, XML 문서는 XQL에 특정한 태그 집합을 통해서 표현된다.

XSP

XSP라는 단어를 보면서 JSP나 ASP와 비슷한 기술이 아닐까라는 생각을 할 지도 모르겠다. 혹시 XSP가 JSP나 ASP와 비슷하게 서버사이드 스크립트 언어를 나타내는 것이 아닐까라고 생각했다면, 어느 정도 맞게 추측한 것이다. XSP는 'Extensible Server Pages'를 의미한다. XSP는 XML에 기반하고 있으며, 따라서 언어에 독립적이고 웹 페이지와 웹 사이트를 만드는 데 있어서 스크립트 언어 대신 사용될 수 있다. 표현과 내용의 구분에 있어 완전하지 못한 JSP에 비해, XSP는 완전하게 이 둘을 구분해준다. JSP는 JSP 페이지 내에 로직 부분을 담고 있는 반면에 XSP는 로직 부분을 로직쉬트(logicsheet)라는 것에 정의한다. 로직쉬트는 스타일쉬트와 비슷하며, 이를 통해 XSP는 표현의 내요을 완전히 분리해준다. 이러한 구분은 개발자들이 동적이나 동적으로 내용의 생성에만 집중할 수 있도록 해 주고, 반면에 XML과 XSL 제작자들은 XSP 페이지에 적용할 XSL 스타일 쉬트를 변경함으로써 표현과 스타일만을 처리할 수 있도록 해 준다.

XSP는 현재 웹 출판 프레임워크(Web Publishing Framework)인 아파치 코쿤(Cocoon)에 속해 있다. XSP에 대해 자세히 알고자 하는 사람은 http://xml.apache.org/cocoon/xsp.html을 참조하기 바란다.

지금까지 XML과 관련된 기술에 대해서 알아보았다. 이 외에도 XLink, XLL과 같은 많은 XML 관련 규약들이 존재하지만, 여기서는 자바와 관련해서 많이 사용되는 또는 사용될 기술들에 대해서만 알아보았다.

XML의 활용

XML을 어떻게 사용하는가

XML이 아무리 좋은 개념을 갖고 있다고 해도 개발자들이 익숙환 프로그래밍 환경에서 사용할 수 없다면 쓸모 없는 기술에 불과할 것이다. 다행스럽게도 프로그래밍에서 손쉽게 XML을 분석하고, 처리하고, 변환할 수 있도록 해주는 몇몇 API가 발표되었으며, 자바 개발자들은 이러한 API 중에서 알맞은 것을 선택해서 XML을 이용한 자바 프로그래밍을 손쉽게 할 수 있다. 이러한 API에는 SAX, DOM, JAXP, JDOM 등이 있다.

SAX

SAX는 'Simple API for XML'을 의미하며, 그 이름 그대로 XML을 위한 간단한 API를 제공한다. SAX는 XML 데이터를 분석하기 위한 이벤트 기반의 구조를 제공하며, 이러한 구조는 크게 문서를 읽어나가는 과정과 데이터를 사용할 수 있는 부분으로 분리된다. 이벤트는 XML 문서를 순차적으로 처리하는 동안 각 단계에서 발생하며, SAX는 각 이벤트가 발생할 때 호출되는 메소드를 정의하고 있다. 예를 들어, 한 요소의 여는 태그를 만날 경우 startElement() 메소드를 호출하며, 끝 태그를 만날 경우 endElement() 메소드를 호출한다.

SAX는 문서를 읽어나가는 과정에서 발생하는 이벤트를 위한 인터페이스 뿐만 아니라, 잘못된 문서나 비적격(non well-formed) 문서와 같이 XML을 분석하는 과정에서 발생할 수 있는 다양한 상황을 처리할 수 있도록 해 주는 에러와 경고 집합을 정의하고 있다.

DOM

DOM은 'Document Object Model'을 의미한다. SAX가 단지 XML 문서의 데이터에 접근하기 위한 방법을 제공한다면, DOM은 그러한 데이터를 처리하는 방법을 제공하기 위해 설계되었다. DOM은 XML 문서를 트리 형태로 표현한다. 자바를 비롯한 프로그래밍 언어에서는 트리 구조를 쉽게 순회하고 처리할 수 있기 때문에, DOM 트리(XML 문서를 DOM으로 표현한 것을 DOM 트리고 부른다)를 쉽게 처리할 수 있다. SAX와 달리 DOM은 전체 XML 문서를 메모리에 읽어온 후에 DOM 트리를 구성하기 때문에, 한번 문서를 읽으면 매우 빠르게 전체 문서에 접근할 수 있다.

DOM이 전체 XML 문서를 메모리에 읽어온 후에 DOM 트리를 작성한다는 것이 빠르게 XML 문서의 각 요소에 접근할 수 있다는 장점을 제공하긴 하지만, 반면에 결정적인 단점을 제공하기도 한다. DOM은 XML 문서의 크기에 비례한 메모리를 필요로 하기 때문에, XML 문서의 크기가 커질수록 많은 메모리를 요구하게 된다. XML 문서의 매우 클 경우 이는 매우 많은 양의 시스템 자원을 사용하게 되며, 따라서 시스템의 전체적인 성능 저하 현상을 일으키기도 한다.

JAXP

JAXP는 썬이 자바에서 XML 분석을 위해 내 놓은 API이다. JAXP는 SAX와 DOM API를 대신하거나 완성시킨 것은 아니지만 JAXP는 자바 개발자들이 XML API를 좀더 쉽게 사용할 수 있도록 하기 위해 만든 편리한 메소드를 제공하고 있다. JAXP는 이름공간을 지원할 뿐만 아니라 SAX와 DOM 권고안을 따르고 있다. 또한, JAXP는 교체가능(pluggability) 계층을 통해서 XML을 따르는 모든 파서를 사용할 수 있도록 해 준다.

현재 EJB 1.1 규약과 Tomcat은 XML 형식의 설정 및 배치(deployment) 파일을 사용하고 있으며, 앞으로 나올 J2EE 1.3이나 J2SE 1.4에 JAXP가 추가될 것으로 예상된다.

JDOM

현재 나와 있는 XML API 중에서 자바 개발자들에게 가장 흥미를 끌고 있는 API가 있다면, 바로 JDOM이다. JDOM은 일반적으로 SAX와 DOM을 대체할 수 있는 자바 중심적이고 고성능의 API를 제공하고 있으며, DOM이나 SAX에 기반하지 않은 대신 개발자가 DOM의 특징 없이 트리 형태로 XML 문서를 처리할 수 있도록 해 준다. 또한 SAX와 같은 고성능을 제공하기 때문에 분석과 출력을 매우 빠르게 할 수 있도록 해 준다. 또한, DOM과 달리 속성이나 요소 집합을 나타내기 위해서 자바 2의 콜렉션 클래스를 사용한다. (참고로, DOM은 속성이나 요소 집합을 나타내기 위해서 Attributes 또는 Nodelist와 같은 별도의 클래스를 사용한다).

JDOM은 자바에 맞춰서 개발된 API이기 때문에, SAX나 DOM과 달리 자바에 최적화되어 있다. 그 하나의 예로 자바 2의 콜렉션 API를 사용하는 것을 들 수 있다. 또한, JDOM은 이미 증명된 자바 디자인 패턴에 따라 설계되었으며, 직접적으로 클래스의 인스턴스를 생성함으로써 JDOM의 구성 요소(요소, 주석, 속성, 기타 등등)를 생성할 수 있도록 하고 있다.

XML을 어디에 사용하는가

아직까지 XML을 미션 크리티컬한 어플리케이션에서 사용하지는 않고 있다. 하지만, 자바와 비교해보면 XML의 발전 속도는 매우 빠른 편이며, 점차적으로 XML을 사용하는 분야가 증가하고 있다. 실예로, 앞으로 나올 ASP+나 JSP 차기 버전의 경우 페이지 자체를 XML로 작성할 수 있도록 하고 있다. 또한, XML에 있어서 중요한 점은 자바와 찰떡궁합을 이룬다는 점이다. 이에 대해서는 이 Article의 마지막 부분에서 살펴볼 것이다.

XML을 현재 어느 분야에서 사용하고 있는 지에 대해서 살펴보도록 하자.

표현에서의 XML

XML의 가장 큰 장점은 내용과 표현을 분리한다는 점이다. 이는 오늘날과 같이 클라이언트의 종류가 다양한 환경에서 큰 힘을 발휘하게 된다. 예를 들어, 클라이언트의 종류가 웹 브라우저, 휴대전화와 같은 무선 기기, 자바 애플리케이션이라고 해보자. 기존의 방법을 사용하려면 각각의 클라이언트에 대해서 각각 HTML, WML 그리고 자바 애플리케이션에 알맞은 어떤 형태로 제공해야 한다. 내용이 변경되거나 표현부분이 변경되는 경우 모두 각각의 문서를 변경해주어야 한다. 내용을 변경하는 경우에도 이 각각의 문서를 변경해야 한다는 것은 매우 귀찮은 일일 수 있으며, 지원해야 하는 클라이언트의 종류가 세 가지 이상으로 늘어날 경우 이는 관리에 있어서 어려움을 제공하는 원인이 되기도 한다. 또한, 하나의 문서를 변경하기 위해서는 개발자와 페이지 디자이너가 모두 필요하다는 것도 문제가 된다.

XML을 사용하면 이러한 문제의 상당히 많은 부분을 해결할 수 있게 된다. 앞에서 XSL/XSLT에 대해서 설명할 때, XSL/XSLT는 한 형식의 문서를 다른 형식으로 변환해 준다고 하였다. 개발자는 단순히 내용을 저장하고 있는 XML 문서만을 생성하면 되며, 페이지 디자이너는 XML 문서를 HTML, WML 그리고 자바 애플리케이션에 알맞은 형태로 변환해주는 XSL/XSLT를 작성하기만 하면 된다. 만약 사용자가 웹 브라우저를 통해서 접속했다면 XML+HTML로 변환해주는 XSLT를 통해서 HTML 문서를 제공해주며, 휴대전화로 접속했다면 XML+WML로 변환해주는 XSLT를 통해서 WML 문서를 제공해줄 것이다. 즉, 하나의 XML 문서를 통해서 여러개의 표현을 만들어낼 수 있는 것이다. 현재 이러한 기능을 제공해주는 출판 프레임워크가 개발되고 있으며, 대표적인 아파치 코쿤을 예로 들 수 있다.

통신에서의 XML

어플리케이션 사이에서 정보를 주고 받기 위해서 XML을 사용할 수 있다. 각각의 어플리케이션은 자신만의 문서 형식을 작성할 필요가 없으며, 단지 두 어플리케이션이 알고 있는 DTD나 스키마에 맞춰서 XML 문서를 작성하기만 하면 된다. 뿐만 아니라 XML로 정보를 표현하기 때문에 특별한 어플리케이션에 종속되지 않으며 따라서 DTD를 따르는 모든 애플리케이션에서 같은 정보를 사용할 수 있게 된다. 또한, XML로 표현된 정보를 XSL/XSLT를 사용하여 손쉽게 어플리케이션에 특정한 형식으로 변환할 수도 있다.

이러한 XML의 응용 범위는 오늘날 인터넷 비니지스에 있어서 핵심으로 떠오르고 있는 B2B로 확장될 것으로 예상된다. 즉, 어플리케이션 사이에서 뿐만 아니라 기업간에 XML을 통해서 정보를 주고 받을 것이다. 이미 많은 곳에서 XML을 이용하여 기업간에 정보를 주고 받을 수 있는 어플리케이션을 개발하고 있으며 몇몇 제품은 이미 판매되고 있다. 오늘날 기업간에 정보를 주고 받을 때 주로 사용되는 EDI에 비해 XML은 더욱 더 다양한 형태로 정보를 주고 받을 수 있도록 해 준다.

설정에서의 XML

앞에서도 말했듯이 XML은 설정에 있어서 유용하게 활용할 수 있다. 이미 EJB 1.1 규약과 앞으로 정식으로 발펴될 EJB 2.0 규약에서 XML을 사용하여 설정 및 배치 기술자를 정의하고 있으며 서블릿 2.2 역시 XML을 사용하여 설정과 배치 부분을 기술하고 있다. 앞으로 이러한 설정 및 배치와 관련된 곳에서 XML의 사용범위는 점차적으로 증가할 것으로 예상된다.

자바 & XML

마지막으로 자바와 XML과의 관계에 대해서 간략하게 알아보자. 이 두 기술의 관계를 다음의 문구로 간단하게 표현할 수 있다.

Java + XML = Portable Code + Protable Data

자바의 이식성은 별다른 설명이 필요 없을 정도로 자명하다. 자바는 중간 코드인 바이트코드와 JVM을 통해서 거의 완벽한 이식성을 제공하고 있으며, 쓰레드와 Native 메소드와 같은 몇가지 문제점을 제외하고는 거의 모든 플랫폼에서 특별한 문제없이 같은 자바 코드를 사용할 수 있게 되었다.

XML의 이식성은 자바의 이식성보다 더욱 더 완벽에 가깝다. 자바를 실행하기 위해서 단지 플랫폼에 알맞은 JVM이 있으면 되듯이, XML을 사용하기 위해서는 표준 XML을 지원하는 파서, 처리기(Processor) 등이 있으면 된다. XML 데이터 자체는 플랫폼에 어떠한 플랫폼에도 영향을 받지 않는다.

자바는 XML을 사용할 수 있는 풍부한 API를 제공하고 있으며, 따라서 자바와 XML의 조화는 어플리케이션과 데이터에 있어서 완벽한 이식성을 제공해주며, 이는 앞으로 개발될 어플리케이션(특히 엔터프라이즈 어플리케이션)에서 큰 힘이 될 것이다.

XML 파서(Parser)와 처리기(Processor)

XML을 실제 어플리케이션 환경에서 사용하기 위해서는 XML을 분석할 수 있는 파서(parser)와 XSL/XSLT를 사용하여 XML을 변환할 수 있는 XML 처리기가 필요하다. 여기서는 XML을 분석하고 처리할 수 있도록 해 주는 파서와 처리기의 종류를 나열할 것이다.

파서

현재 사용할 수 있는 파서에는 다음과 같은 것들이 있다.

처리기(Processor)

현재 사용할 수 있는 처리기에는 다음과 같은 것들이 있다.

관련링크:

+ Recent posts