270 likes | 590 Views
Introduction to Semantic Web 시맨틱 웹의 개요 (1). SungWon, Jung. Problem of Web. 급속한 변화 ( 웹 발전의 한계 ) 멀티미디어 정보 증가 이용 환경 다변화 정보 및 웹 사용자의 기하급수적인 증가 기 타 현재의 웹은 정보의 외형적 표현 방법에 치중 사용자의 클릭을 통한 Web Navigation 검색 엔진을 통한 정보 소재 파악 인간 위주의 자료 작성 : 컴퓨터에 의한 부가정보 추가 어려움 검색엔진을 통한 정보 검색의 부정확성 검색엔진 관련 회사
E N D
Introduction toSemantic Web시맨틱 웹의 개요(1) SungWon, Jung
Problem of Web • 급속한 변화 (웹 발전의 한계) • 멀티미디어 정보 증가 • 이용 환경 다변화 • 정보 및 웹 사용자의 기하급수적인 증가 • 기 타 • 현재의 웹은 정보의 외형적 표현 방법에 치중 • 사용자의 클릭을 통한 Web Navigation • 검색 엔진을 통한 정보 소재 파악 • 인간 위주의 자료 작성 : 컴퓨터에 의한 부가정보 추가 어려움 • 검색엔진을 통한 정보 검색의 부정확성 • 검색엔진 관련 회사 • 무분별한 자료 저장 창고의 역할 • 정보 검색의 기능 약화 • 자연언어처리 기술을 통한 검색 기능 약화 (속도 저하 문제…)
W3C has a long-range plan • 보편적 접근(Universal Access) • 전 세계의 사용자들이 그들의 문화교육능력물질적 자원물리적 한계에 대한 차이를 극복할 수 있도록 기술을 증진함으로써 누구든지 웹에 접근할 수 있도록 한다. • 시맨틱 웹(Semantic Web) • 개인 사용자들이 웹에서 얻을 수 있는 자원을 최대한 잘 사용할 수 있도록 소프트웨어 환경을 발전시킨다. • 신뢰의 웹(Web of Trust) • 웹의 기술과 관련된 법적상업적사회적 이슈에 관해 깊이 고려하면서 웹을 발전시켜 나간다.
Advent of Semantic Web • Semantic Web • 1999년, Tim Berners-Lee (W3C) • 2001년 2월 공식적으로 Semantic Web Activity 착수 • 웹상에 존재하는 자료에 의미를 부가하고 사람이 관여하지 않아도 컴퓨터가 자동으로 처리할 수 있는 차세대 지능적인 웹 • 웹상에 존재하는 정보들을 사람뿐만 아니라 컴퓨터 프로그램 같은 기계들이 해독하고 작업하기 용이하게 표현 • 정보간의 유기성까지 체계적으로 표현 : 정보공유 체제 마련 • 자연어 위주의 기존 웹 문서와 달리 컴퓨터가 해석하기 쉽도록 의미를 부여한 계층을 가짐 • 웹에 의미(Semantic)를 부여한다는 것 • 사용자 인터페이스를 위한 자연어 처리 기능을 부가하고자 하는 것이 아니라 컴퓨터가 처리하기 용이하게 하고자 선언적인 추가 정보를 부여하는 것을 뜻함
Effect of Semantic Web • 시맨틱 웹의 예상 효과 • 기본 : 기존 웹과 같이 단어를 식별해서 관련된 사이트나 문서를 찾아 줌 • 새롭게 구성된 문서에 사물간의 관계를 명확히 기술하여 정확하고 의미 있는 정보 제공 • 컴퓨터가 스스로 자료를 처리하고, 통합하는 데 필요한 정보들을 포함함으로써 사람들은 더욱 편리하게 컴퓨터의 도움을 받으며 일함 • 사용자의 취향을 분석한 후 가장 적합한 정보를 제공하기 위해 관련된 웹 페이지를 스스로 검색 • 다른 웹을 찾아 다니면서 필요한 정보들을 자발적으로 제시해주는 기능 • 현재의 웹보다 더 지능적인 웹 서비스 가능 • 의미적으로 더욱 강력한 검색엔진 개발 • 몇 개의 독립적인 사이트로부터 발견한 정보들을 통합하여 어떤 결론을 도출
Structure of Semantic Web Semantic Web의 계층적 구조 (Berners-Lee, XML 2000)
Structure of Semantic Web • Unicode • 문자 인코딩을 위한 국제 표준인 유니코드는 65536개의 문자를 포함할 수 있는 2바이트 문자를 지원하므로 이를 지원하는 SW에서는 국제적인 데이터 교환을 원활히 할 수 있을 것이다. • URI(Uniform Resource Identifier) • 인터넷에 존재하는 각종 객체의 명칭, 위치 등에 대한 표현법 • URL(Uniform Resource Locator), URN(Uniform Resource Name) 등 포함 • URI의 특징 • 어떤 허가나 권한 없이도 언제든지 자유롭게 만들 수 있음 • 소유하고 있지 않은 것, 실존하지 않는 추상적인 것을 위한 URI도 만들 수 있음 • SW에서도 URI의 특징을 이어받아 사용
Structure of Semantic Web • XML + NS + XML schema • XML(eXtensible Markup Language) • 컴퓨터 판독(computer-readable)이 용이한 문서작성 규정 • 언어를 표현하는 언어 역할인 메타언어(meta-language)의 기능 • XML은 임의의 문서구조를 지정할 수 있는 반면에 문서구조가 갖는 의미에 대해서는 아무 것도 정의하지 않으며 따라서 표현한 문서의 의미를 해석하는 역할은 하지 않음 • RDF(Resource Description Framework) : 문서의 의미를 지정하는 역할 • DAML(DARPA Agent Markup Language)+OIL(Ontology Inference Layer) • Namespace • XML 문서에서 요소(element)나 속성(attribute)의 이름으로 쓰일 수 있는 이름들의 집합 • XML을 사용할 때 상이한 의미를 가지는 동일한 용어간의 불확실성을 해결 • XML Schema • 문서가 마크업되는 방식에 대한 정의 (DTD도 하나의 스키마라 할 수 있음)
Structure of Semantic Web • RDF(Resource Description Framework) + RDF Schema • XML 문서 구조를 통해 의미를 파악하기는 쉽지 않음 예) <저자> 태그를 사용한 문서 : 컴퓨터는 ‘저자’가 무슨 의미인지 모름 의미를 파악한다고 하더라도 ‘사람’과 연결되는지 등에 대한 정보를 정의하지 못함 • RDF : 정보자원이나 자원의 타입을 기술하는 언어 • SW에서는 의미표현을 위한 수단으로 RDF 사용 • 메타데이터(metadata)를 기술하기 위해 사용 • 컴퓨터가 이해할 수 있는 형태의 정보를 응용프로그램 사이에서 교환하기 위한 수단 • RDF 문장은 대부분의 단어가 URI라는 사실만 제외하면 단순한 일반 문장과 유사 예)
Structure of Semantic Web • Ontology • 특정 도메인에 대한 공유되는 일반적인 이해, 개념의 표현, 개념과 관계에 대한 공식적인 기술 등의 의미로 사용 • SW에서의 Ontology 이용 • 정보자원에 대한 의미와 이들 간의 연관성을 기술하는 것으로 사용 • 기본적으로 RDF를 확장하여 이행성(transitivity), 단일성(unique), 명백성(unambiguity), 중요성(cardinality) 등의 특징을 지원 • OIL, SHOE, DAME, WebOnt 등과 같은 연구가 활발하게 진행 • Logic • 연구개발 초기 단계에 있음 : 기존의 logic 등의 연구 결과를 SW에 적용 • 기존 정의를 바탕으로 새로운 결론을 도출하는 추론 기능 등이 지원 예) ‘어떤 자동차 회사에서 사원이 한 달에 자동차를 10대 이상 판매하면 A 클래스’ SW program : “최호섭은 차를 15대 팔았다. 그러므로 최호섭은 A클래스의 구성원이다.”
Structure of Semantic Web • Trust / Digital Signature • SW가 성공하기 위해서는 문서에 신뢰를 줄 수 있는 방법이 있어야 함 • 이러한 목적으로 Digital Signature를 SW에 적용하는 연구가 진행 • 어떤 사람이 어떤 문서나 문장을 작성했다는 증거로 Digital Signature를 제공하면 이러한 문서를 읽었을 때 어느 정도 신뢰할 수 있는지를 결정할 수 있을 것임 • 정리 • 자원 서술 : XML, RDF • 지식 서술 : Ontology • 통합 운용 : Agent System
W3C의 7가지 목표 • W3C(World Wide Web Consortium) • 웹 표준을 만드는 곳 • 임무 • 정보, 의견 교환, 영감, 독립적 사고, 그리고 공동의 이해를 위한 포럼이 기술(명세, 가이드라인, 소프트웨어, 툴) 개발함으로써 웹의 모든 잠재력을 이끌어 내는 것 • W3C의 목적과 운영 원칙을 설명하는 7가지 목표 • 광역 접근성 • 시맨틱 웹 • 신용 • 상호운용성 • 진화 • 분산화 • 멋있는 멀티미디어
W3C의 7가지 목표 - 1 • 광역 접근성 • 웹을 (컴퓨터, 전화기, 텔레비전, 또는 냉장고 등을 통한 접근 가능한) 광역 네트워크 접근 정보로 정의 • 모든 사람에게 그들이 어떠한 하드웨어, 소프트웨어, 네트워크 구조, 모국어, 문화, 지역적인 위치, 또는 육체적/정신적 능력이 어떠하건 간에 이러한 혜택을 제공하는 것 • W3C의 의무 • 국제화 활동, 기기 독립 활동, 보이스 브라우저 활동, WAI
W3C의 7가지 목표 - 2 • 시맨틱 웹 • 컴퓨터가 해석할 수 있고, 교환하도록 표현 • 여러 가지 문제를 해결 • 의료정보, 영화 논평, 도서 구매서 등 우리가 원하는 것을 빠르게 찾도록 도와줌 • 시맨틱 웹을 위한 기반이 되는 W3C의 언어 • RDF • XML • XML 스키마 • XML 전자 서명…
W3C의 7가지 목표 - 3 • 신용 • 신용의 웹 • 기밀성 제공 • 신뢰 • 웹상의 출판에 대한 책임(또는 해명) • XML 전자 서명, 해설 추가 메커니즘(annotations mechanisms), 공동 저작(group authoring), 버전 등의 업무에 박차를 가함
W3C의 7가지 목표 - 4 • 상호운용성 • 시스템 또는 제품이, 고객 측의 특별한 노력 없이도 다른 시스템이나 제품과 함께 잘 동작하기 위한 능력 • 20년 전 : 다른 소프트웨어와 같이 연동하기 위해 같은 회사의 제품 구매 • 현 재 : 제품 선택의 자유, 교체할 수 있는 소프트웨어 컴포넌트 기대 웹 컨텐츠를 그들이 원하는 소프트웨어(그래픽한 데스크톱 브라우저, 언어합성기, 점자출력기, 카폰…)로 볼 수 있기를 기대 • W3C : 개방형 컴퓨터 언어와 프로토콜 설계·촉구 • 산업 합의·토론을 위한 개방형 포럼을 장려함으로써 형성
W3C의 7가지 목표 – 5,6 • 진화 • 더 좋은 웹으로 발전 • 기존의 작업을 유지하는 웹을 위해 노력 • 단순성, 모듈화, 호환성, 확장성의 원칙 • 분산화 • 분산화는 현대 분산 시스템의 원칙 • 중앙 웹의 수를 제한 • 설계 단계에서 전체 웹이 공격 당하는 것을 줄이기 위함 • 유연성 : 분산 시스템의 필수적인 요소
W3C의 7가지 목표 – 7 • 멋있는 멀티미디어 • 웹상에서의 다양한 미디어 • 크기조정 가능한 이미지 • 우수한 사운드 • 3D 효과 • 애니메이션 • W3C의 노력 • 컨텐츠 제공자의 독창성이나 사소한 브라우징에 제약을 두지 않음 • 스케이러블 벡터 그래픽스(SVG) 언어와, 동기화된 멀티미디어 통합 언어(SMIL)와 같은 언어를 통하여 멋진 웹의 개발을 위한 충실한 프레임워크를 제공
W3C의 시맨틱 웹 동향 - 시맨틱 웹과 관련한 W3C 워킹 그룹 • W3C의 표준 관련 작업 • Working Group을 중심으로 활동(Activity) • 도메인(Domain)으로 그룹핑 • 시맨틱 웹과 관련한 W3C 워킹 그룹 • 기술과 사회 도메인(Technical and Society Domain) 산하의 Semantic Web Activity • RDF 코어 워킹 그룹 • 웹 온톨로지 워킹 그룹 • RDF Interest 그룹 • 코디네이션 그룹
W3C의 시맨틱 웹 동향 - 메타데이터(Metadata) 표준화 동향(1) • 메타데이터 : “데이터의 데이터” • 문제점 • 거의 대부분이 자원(resource)에 대한 기술을 특정 단체 중심으로 각각 수행 • 어휘나 구조가 모두 달라 서로 간의 호환성 유지 곤란 • 응용 프로그램은 특정 단체의 메타데이터만 지원 • 문제 해결 W3C에 의해 RDF 제안 • RDF • 웹 기반의 메타데이터 기술과 교환을 위한 구조 • 상이한 메타데이터 간의 의미, 구문, 구조에 대한 공통적인 규칙을 지원 • 구조화된 메타데이터 간의 상호운용성(inter operability)을 지원
W3C의 시맨틱 웹 동향 - 메타데이터(Metadata) 표준화 동향(2) • RDF 개발에 다수의 워킹 그룹 참여 • 기본적으로 PICS(Platform for Internet Content Selection)를 기반으로 함 • PICS : 서버에서 클라이언트로 웹 페이지를 전달할 때 페이지에 대한 평가 정보를 기반으로 필터링할 수 있는 메커니즘 • 더블린 코어(Dublin Core)와 워윅 프레임워크(Warwick Framework)로부터 영향을 받음 • XML 기반의 메타데이터 기술 방법에 대해 개발 • 메타데이터 참고 : http://dewey.yonsei.ac.kr/metadata/
W3C의 시맨틱 웹 동향 - 웹 온톨로지 표준 동향(1) • 웹 온톨로지 워킹 그룹 • 2002년 11월 1일부터 활동 시작 • 2002년 3월 “웹 온톨로지 언어에 대한 요구사항” 정의만을 작업 초안으로 제출한 상태 • 온톨로지에 대한 정의 • 온톨로지를 이용하는 예 : 웹 포털, 멀티미디어, 웹 사이트 관리, 웹 문서 설계, 에이전트, 분산 컴퓨팅 등 • 온톨로지 언어의 설계 목적 • 온톨로지 언어를 위한 요구사항 정의 등
W3C의 시맨틱 웹 동향 - 웹 온톨로지 표준 동향(2) • 웹 온톨로지 워킹 그룹의 활동 • 복잡한 추론, 정보의 교환, RDF, 폰트, 웹 온톨로지에 대한 질의 언어 및 질의 규칙, 저장소에 대한 연구 • 웹 컨텐츠에 정보 관계를 이용해 논리적 웹을 만들 목적인 웹 로직(Universal Web Logic:UWL)에 관한 연구 • 웹 온톨로지와 로직을 이용해 에이전트 기반의 컴퓨팅을 지원하기 위한 ACL(Agent Communication Language) 등에 관한 연구
W3C의 시맨틱 웹에 대한 견해 - XML과 RDF… • HTML과 XML이 다르듯이, XML과 RDF도 전혀 별개의 개념 (상호 보완적인 관계) • XML : 데이터의 구조를 정의 • RDF : 데이터의 의미를 정의 • RDF로 구현된 온톨로지 • RDF가 실생활의 모든 일을 표현할 수 있는가? • RDF 스키마보다 조금 진화된 온톨로지 언어 • 인공지능 기반의 마크업 언어인 OIL과 DAML • 시맨틱 웹(온톨로지)의 문제 • RDF, OIL, DAML 등과 같이 정확히 정해진 기술의 부재 • 수많은 언어들의 연관 관계가 RDF 스키마나 온톨로지에서 어떻게 설명될 수 있을까? • 지금의 거의 모든 웹 페이지는 HTML로 되어 있음 • 시맨틱 웹의 에이전트의 개발도 하나의 문제 • 지금의 검색 에이전트로는 불가능 • 시맨틱 웹에 맞는 인공지능을 가진 에이전트 개발의 어려움
W3C의 시맨틱 웹에 대한 견해 - 표준화 문제 • XML 웹 서비스와 시맨틱 웹의 차이 • 시맨틱 웹 : 의미있는 질의를 통해 결과를 도출 • XML 웹 서비스 : 요청에 의한 컴포넌트 호출로 결과를 얻어내는 것 • 통합의 의미가 아닌 상호 보완적 관계 • 하나처럼 보이는 두 개의 서비스 • 표준화 문제 • 온톨로지의 개념 • 인공지능, 그리고 로직에 대한 프로그래밍 • 추론 엔진이나 인공지능 기반의 마크업 언어 연구 • 개발자 입장 : 개발자로서의 접근과 그에 대한 툴의 개발 • 현재의 웹을 버리지 않고 시맨틱 웹과 함께 사용할 수 있는 방안 모색