Q:
시맨틱웹이라는 말을 근래에 굉장히 많이 듣게 됩니다. 무엇인가 가능성이 많은 차세대 기술인 것 같은데요. 도대체 시맨틱웹이 무엇인가요?
A:
현재의 우리가 알고 사용하는 웹은 인간의 사용을 위한 웹입니다. 즉, 우리가 직접 URL을 입력하여 찾아가고 마우스 클릭을 통하여 브라우징을 하며 모든 정보는 오로지 나에게 “보여짐”을 통해 나의 정보 취득과 흡수를 위해 존재하는 정보공간이 바로 지금의 웹이라는 것이죠. 웹의 이런 특성은 지난 10여년동안 전세계적으로 수십억의 이들에게 어마어마한 정보의 양을 창출해 내었으며 또한 그에 접근가능하게 함으로써 우리가 원하는 정보를 항상 어디에선가는 구할 수 있는 정보 천국을 만들어 놓는데 일등공신 역할을 했습니다.
그런데 웹이 우리 일상생활에서 필수적인 환경이 되어감에 따라 이런 웹의 특성 때문에 생겨난 문제가 하나가 있죠. 바로 정보가 너무나 많아졌다는 것입니다. 이는 단순히 양적인 것 뿐만 아니라 유사한 주제에 관한 정보라도 질적인 부분에서도 그 수준 차이가 엄청나게 많이 나는 것을 포함합니다. 기하급수적으로 증가하는 정보의 양 앞에 우리는 웹에서 원하는 정보를 내가 원하는 형태로 찾는다는 것이 바닷가에서 원하는 모래알갱이 찾기처럼 어려운 것이 되어버렸죠.
날로 정보의 중요성이 늘어만가는 지식기반의 현대사회에서 이러한 문제를 해결하는 가장 좋은 방법은 전과 마찬가지로 사람에게 시간 낭비인 일은 기계가 하게 만드는 것입니다. 농업혁명 당시에는 이런 “기계” 역할을 농기구가, 산업혁명에선 증기동력장치가 했다면 정보혁명 시대에는 컴퓨터와 같은 정보처리장치가 바로 이 기계에 해당되는 것이죠. 웹을 고안해낸 팀 버너스리는 웹을 구상하던 처음부터 웹을 단순히 현재의 웹인 오로지 사람과 사람과의 정보공간이 아닌 사람과 기계(컴퓨터)가 협력할 수 있는 공간으로 만든다는 비전을 가지고 있었습니다. 90년대 말에 사람과 사람의 정보공간으로서의 웹이 성숙단계에 이르자 웹을 사람과 기계, 그리고 기계와 기계의 공간으로 만드는 제2단계 웹에 대한 노력이 시작되었으며, 이러한 노력이 바로 “시맨틱웹(Semantic Web)“이라 불리우는 비전으로 이어졌습니다.
시맨틱 웹에서 “Semantic”이라는 단어는 “의미의”, “의미론적인” 이라는 뜻을 가지고 있습니다. 따라서, 시맨틱웹이란 기계와 기계 사이의 정보 관련 활동 시에 기계가 정보의 의미를 이해하고 처리, 조작할 수 있는 웹을 뜻하는 것이죠. 그런데, 여기서 잠시 생각해 보면, 먼저 기계가 의미를 이해한다는 말에 많이 의아해시는 분들이 있으실 것입니다. 사실대로 말씀을 드리자면, 기계는 우리 인간과는 달라서 어떤 것을 이해할 수는 없는 존재죠. 그렇기 때문의 기계의 의미 이해라는 것을 재정의 해보자면, 기계가 웹 상에 존재하는 어떠한 정보 객체에 대하여 그 안의 내용물 부분을 스스로 처리할 수 있는 형태를 가진 개념으로 표현해 주는 것이라고 할 수 있습니다. 컴퓨터의 세계에서 이러한 표현은 정형화된 정보 형식(예를 들면, “나는 사과를 좋아한다” -> :나 :좋아한다 :사과)과 논리체계를 통하여 가능해집니다.
시맨틱웹이라는 비전을 향해 나아가면서 여러가지 파생 기술들이 연구되고 등장하게 되었습니다. 시맨틱웹 상에 정보표현주체 대상을 가리키는데 사용되는 일종의 ID역할을 하는 URI (Universal Resource Identifier), 위의 예에서 (:나 :좋아한다 :사과) 와 같이 어떠한 정보라도 표현 가능한 표현의 틀을 제공해주는 RDF (Resource Description Framework), 각 개념을 유형(class)과 계층적 관계 정의 등을 통하여 구체적으로 논리적인 표현이 가능할 수 있도록 해주는 언어인 OWL (Web ontology Language), 이런 언어로 표현된 개념에 논리엔진을 추가하여 유추를 해낼 수 있도록 하는 Inference Layer 등이 바로 그런 기술들에 속하게 됩니다. 웹상에 소위 거짓정보와 질이 낮은 정보, 사용자가 원치 않는 상업성 스팸 정보와 점점 중요시되고 있는 개인의 사생활 정보 보호 등 웹의 전체적인 정보의 신뢰성과 관련된 부분은 Web of Trust (신뢰의 웹)이라는 비전 하에 연구되고 있습니다.
이런 기술을 통해 기계가 이해할 수 있고 처리할 수 있는 웹이 만들어지면 우리 생활에는 어떤 변화가 오게 될까요? 시맨틱웹에 관해 가장 많이 활용되는 기사인 “The Semantic Web” 을 읽어보면 다음과 같은 가상시나리오가 나옵니다.
전화벨이 울렸을 때는 엔터테인먼트 시스템에서 비틀즈의 “We Can Work It Out” 이 우렁차게 울려나오고 있었을 때였다. 피트가 전화를 받자마자, 그 전화기는 집안에 음량조절이 되는 장치 모두에게 메시지를 보내서 볼륨을 낮춘다. 병원에 있는 루시 누나에게서부터 걸려온 전화였다. “어머니께서 전문의도 봐야 되고 물리치료도 몇번 받아야 한대네. 2주마다인가 그래. 난 내 에이전트로 예약한다~”. 피트도 즉시 서비스를 공유하기로 한다.
병원에서는 루시가 그녀의 휴대용 단말기에 탑재된 웹브라우저를 통해 시맨틱웹 에이전트에게 지시한다. 에이전트는 곧 의사선생님의 에이전트에서부터 얻은 어미니의 진단 자료를 뽑아내고, 그에 따른 치료를 제공하는 곳의 목록을 본 다음, 그 중에서 어머니의 보험이 적용되고 집에서 20마일 이내에 있으며 믿을만한 신용서비스기관에서 “매우 훌륭함” 또는 “아주 좋음”의 등급을 획득한 곳을 알아본다. 다음은, (웹사이트들에 떠 있는 각 치료 서비스 제공자의 에이전트을 통해) 예약이 가능시간과 루시와 피트의 바쁜 일정이 맞아 떨어지는 시간을 맞추려고 한다.
몇 분 후에 에이전트가 스스로 세운 계획을 보여준다. 피트는 그 계획이 마음에 별로 들지 않는다. 대학병원은 어머님 집에서부터 도시 완전 반대쪽에 있을 뿐만 아니라, 피트가 병원에서 돌아오는 시간에는 퇴근시간의 교통체증을 뚫고가야 할 것이 뻔하기 때문이다. 그래서 피트는 장소와 시간까지 포함한 좀 더 엄격한 검색을 자기 에이전트에게 지시한다. 현재 업무에 관한 모든 신뢰를 피트의 에이전트에게 허락한 루시의 에이전트는 접근 증서와 스스로가 이미 정리해 놓은 자료에 바로 가기를 제공함으로써 피트의 에이전트를 자동으로 지원한다.
바로 새 계획이 만들어졌다. 첫번째보다는 위치도 훨씬 가깝고 시간도 이르지만, 두 개의 경고 메세지가 있었다. 첫째는, 피트는 중요도가 낮은 다른 약속 몇 개를 재조정해야 한다는 것이였다. 피트는 이 약속들이 무엇인지 보고나서 바로 문제가 없음을 확인한다. 또 하나는 보험적용가능 회사 목록에 물리치료시 이 서비스 제공 회사 (또는 병원)이 포함되어 있지 않다는 것에 관한 메시지였다. “서비스 종류와 보험 상태가 다른 방법에 의해서 안전하게 확인 되었음”라고 하며, 에이전트는 피트를 안심시켰다. 피트는 생각하기를, “자세한 것좀?”.
피트가 세부항목에 관해서 궁금해 하는 것과 동시에, 루시는 자신의 승인을 등록시키고, 모든 과정은 마쳐진다. (물론 자세한 것이 궁금했던 피트는 그날밤 에이전트를 통해서 그 에이전트가 적합한 목록에 존재하지도 않는 그 치료 서비스 제공자를 어떻게 찾았는지 알아보았다.)
즉, 웹상에 존재하는 정보를 바로 나를 위해 필요에 맞게 “에이전트” (정보를 처리해주는 컴퓨터프로그램으로 이해하시면 됩니다)가 사용하고 궁극적으로 나에게 도움을 주는 그런 웹이 만들어지게 되는 것이죠.
아직도 전세계적으로 인터넷 사용률이 무섭게 증가하고 있으며, 뿐만 아니라 이제는 유비쿼터스 시대가 오면서 단순 PC 뿐만이 아니라 모바일 기구와 심지어는 가전제품과 자동차를 통해서도 생성되는 정보는 그 양과 종류가 우리가 감히 상상할 수도 없는 곳에 이르게 될 것입니다. 이런 환경에 맞춰 궁극적으로 인간의 편리함을 위해 만들어진 웹을 더욱더 강력하게 사용할 수 있도록 기계가 정보를 이해/처리할 수 있는 웹으로 진화시키는 것. 이것이 바로 시맨틱웹 비전입니다.
July 14th, 2005 at 2:39 am
예로 드신 내용은 유비쿼터스쪽에서 자주 사용하는 전형적인 시나리오군요. ^_^ “에이전트”라는 개념에 너무 치중한 느낌이 살짝 드네요. “그럼 시멘틱웹이란 유비쿼터스의 다른 이름인가?”라는 오해가 생길 것 같다는 노파심이 잠깐 듭니다.
물론, 장래에는 유비쿼터스든 시멘틱웹이든 모든 개념과 기술이 뭉뚱그려진 “멋진 신세계”가 도래하겠지만, 시멘틱웹에 처음 입문하는 분들께는 “너무 앞선 예시”가 아닌가 싶습니다.
차라리 온톨로지 기반(혹은 다른 방식으로도)의 간단한 정보짝짓기 정도의 예시로도 충분히 시멘틱웹에 대한 관심과 방향을 잡아줄 수 있지 않을까요?
technorati와 flickr, podcasting등 현재 직접 보고 체험할 수 있는 서비스들에서 어떤 식으로 시멘틱웹의 초기형태가 발아하고 있는지 설명해주시는 쪽이 더 피와 살이 될 것 같아요.
아무튼, 연재 기대하고 있겠습니다. ^_^
July 15th, 2005 at 12:37 am
eouia님// 지당하신 말씀을 하셨습니다. eouia님께서 지적하신 “이게 도대체 시맨틱웹인가요 유비쿼터스 컴퓨팅인가요?”에 관해서는 이미 시맨틱웹계에서 여러번 논란이 되었었던 부분입니다. 위의 글이 사실 시맨틱웹 입문글로 가장 많이 사용되었음에도 불구하고 유비쿼터스를 너무 강조한 나머지 시맨틱웹의 참 모습을 보여주지 못했다는 의견이 많이 있었거든요.
개인적인 소견으로는 윗글의 저자인 Ora Lasilla의 Nokia와 U-Computing과 관련된 배경, 그리고 James Hendler교수님의 지식표현 및 인공지능의 배경이 위와 같은 글을 탄생하게 했는지도 모릅니다. (하지만, 이 부분에 대해서는 절대로 제 얘기를 믿지 마세요 ㅋ) 우리가 흔히 알고 있는 RDF나 온톨로지에 관한 이야기는 전혀 없지요.
그러나 사실 어떻게 보면, 바로 위의 예제가 시맨틱웹을 통해서 우리가 경험하게 될 정보사회를 그대로 보여주고 있는지도 모릅니다. 위의 예제에서 “웹”이라는 단어가 한번도 언급된 적 없는 것만큼, 팀버너스리경의 목표는 정보를 전기와 같이, 공기와 같이, 물과 같이 우리가 의식하지도 못하도록 자유롭게 쓸 수 있는 자원으로 만드는 것이거든요. 위의 모든 활동이 시맨틱웹이라는 보이지 않는 정보구조를 타고 나타나고 있거든요. (물론 다 읽어보셨으리고 이미 느낌이 팍팍 오지만 ㅋ) 혹시 이 글의 원문을 다 읽어보시면 왜 위와 같이 보이는 현상이 시맨틱웹을 통해서 가능한가부터 시작해서 온톨로지, 논리 층 등까지 시맨틱웹의 부품별 설명이 나옵니다. 도움이 될 듯 하네요.
말씀하신, 우리가 흔히 “web 2.0″라고 불리우는 XML 기반의 애플리케이션인 technorati, flickr, podcasting 등이 어떻게 웹이 시맨틱웹으로 진화해가는지 보여주는가에 대한 정리는 아마 10개짜리 시리즈가 모두 끝난 다음에 하게 될 것 같네요. 물론 온톨로지 기반 예제 등에 대한 샘플이 있으시면 언제든지 환영합니다. 아직 충분한 예제를 수집하지 못한 터라 ^^;;
좋은 지적 감사합니다. 이런 멋진 대화를 원하고 있었거든요 ㅋ