430 likes | 689 Views
URI 개요 및 국제동향. 이흥규 KAIST 전자전산학과 2001. 7. 25. 목차. 서론 URI 개요 국제동향 결론. 1. 서론. URI Resource 를 식별하기위한 단순하고 확장 가능한 수단 URI(Uniform Resource Identifier) Unform : 통일된 Resource : 정보자원 Identifier : 식별체계. Uniform( 통일된 ) 정보자원에대한 접근방식이 다르고 서로 다른 유형의 정보자원 식별기호를 사용한 경우에도 같은방법으로 처리할 수 있으며
E N D
URI 개요 및 국제동향 이흥규 KAIST 전자전산학과 2001. 7. 25.
목차 • 서론 • URI 개요 • 국제동향 • 결론
1. 서론 • URI • Resource를 식별하기위한 단순하고 확장 가능한 수단 • URI(Uniform Resource Identifier) • Unform : 통일된 • Resource : 정보자원 • Identifier : 식별체계
Uniform(통일된) • 정보자원에대한 접근방식이 다르고 서로 다른 유형의 정보자원 식별기호를 사용한 경우에도 같은방법으로 처리할 수 있으며 • 다른 유형의 정보자원 식별기호를 사용한 경우에도 공통적인 문장형식에 통일된 의미적 해석이 가능하고 • 이미 있는 식별기호의 사용방법에 영향을 주지 않으면서 새로운 형태의 식별기호 도입이 용이하다
Resource(정보자원) • 전자문서, 영상, 서비스(기상예보, 등), 다른 정보자원의 집합, 네트워크로 접근 가능하지 않은 자원(사람, 도서관의 제본된 책, 등)도 고려대상. 간접적으로 무엇이든 참조 가능것들 • 정보자원이란 독립된 실체(물)에대한 개념적인 mapping이므로 특정 시각에 대응된 실체일 필요는 없다. • 따라서 시간이 지남에따라 해당 실체의 내용이 바뀌어도 정보자원은 항상 일정하게 있을 수 있다.
Identifier(식별기호) • 제한된 구문의 문자열을 의미한다. • http://www.math.uio.no/faq/xxx.html/ • telnet://melvyl.ucop.edu/ • ftp://ftp.is.co.za/rfc/rfc108.txt • mailto:mduu@ifi.unz.ch • 등등
2. URI 개요 • URI는 다양한 문서 형식과 프로토콜의 변화에도 불구하고 web과 함께 영속적으로 남는다. • 많은 문서 형식들이 URI를 사용한다. • HTML(URI를 기본 linking mechanism으로 사용) • Extensible Markup Language (XML) • Resource Description Framework (RDF) • Synchronized Multimedia Integration Language (SMIL) • Scalable Vector Graphics (SVG) • email messages, Xpointer, 등 • 많은 프로토콜들이 core에 URI를 사용한다 • HTTP, ENUM, LDAP, SIP
URI, URL, URN, URC, URx • URI • URL : 네트워크 상에서의 위치등의 표현방식으로 정보자원을 식별한다. • URN : 고유하고 영구적인 정보자원의 이름을 나타낸다. • URC : 정보자원에대한 메타데이타
URL, URN, URC의 관계 URL http:www.mic.go.kr ftp:ftp.dpc.or.kr telnet: emailto:hap@mic.go.kr … URN URC doi:10.1082/xx dci:02.134/xxx … Resolution Dublin Core MARC INDECS … URN to URL
URL, URN, URC의 관계 데이터베이스 Web Browser 웹브라우저 URC URN URL URN 변환기 웹 서버 Resource
IETF RFC for URI - 1 • URI의 형식및 의미에대한 규격은 기본적으로 WWW에서 사용된 개념들로부터 유도되었다. • 최초 규격집 : RFC 1630 (1994), “URI in WWW” • Recommendation • RFC 1736(Functional Rec. for Internet Resource Locator, 1995) • RFC 1737(Functional Req. for URN, 1994)
IETF RFC for URI - 2 • URL(RFC 1738, 1994), Relative URL(RFC 1808, 1995) • URN Syntax(RFC 2141, 1997) • URI Generic Syntax(RFC 2396, 1998) • Primary reference work on URI • It discuss only the issue and rec. for US-Ascii character set. • Registration procedure(RFC 2717, 1999) • Guideline for new URL(RFC 2718, 1999)
2.1. URL 개요 • Syntax • Generic form of URL = scheme “:” scheme-part • URL = httpurl | ftpurl | newsurl | telneturl | gopherurl | ….. • httpurl= “h t t p : / /” hostport [ “/” hpath [ “?” search ]] • hostport= host [ “:” port ] • host= hostname | hostnumber • hostname= *[domainlabel “.”] toplabel • http://<host>:<port>/<path>?<search-part> • http://www.acme.edu.au:8080/projects/oil.html
새로운 URL들 • tel, fax, modem URL • The syntax includes the subscriber telephone number of terminal and necessary parameters • tel : normal telephone, voice mailbox, voice message system, 등 • fax , modem • Tel:+82-2-876-2578:postd=pp22 • Voice call to 876-2578, and wait for an implementation time and emit two DTMF dial tones “2” on the line
새로운 URL들 • go URL • CNRP(Common Name Resolution Protocol) working group • Common names are not URIs in that they lack the syntactic structure imposed by URIs; furthermore, unlike URNs, there is no requirement of uniqueness or persistence of the association between a common name and a resource. • go://?Mercedes%20Benz • This example shows a general query for the common-name "Mercedes Benz" that is sent to the server
새로운 URL들 • URL • ENUM(Telephone Number Mapping) WG • DNS-based architecture and protocols for mapping a telephone number to a a set of attributes(URL) • +46-8-9761234 4.3.2.1.6.7.9.8.6.4.8.2.E164.arpa • E164.arpa : domain zone • 8.2. : country code zone • 4.3…. : national zone
ENUM 사용가능 서비스 표시 전화번호입력 Email 전송 Fax 이용 선 택 전 화 이 용 홈페이지 이동
새로운 URL들 • URL • IDN(Internationalized Domain Name) working group • to specify the requirements for internationalized access to domain names and to specify a standards track protocol based on the requirements
2.2. URN 개요 • URN 구조 • URN + NID+ NSS • <urn> : = "urn:" <NID> ":" <NSS> • NamespaceIdentifier • NamespaceSpecific String • urn:nrm:123456789X • urn:doi:10.1082/TEST-KOSTI99_PROC/299-317 • urn:oid:1.3.6.1
Web Browser ? URL 이용자 “404 not found” “...has moved to…” URL 배경
배경 • 1991년 IETF는 디지털객체에 대한 영구적인 접근방법으로 지식정보자원의 원활한 접근, 유통 및 이용의 편의성 제고를 위해 URN 체계 도입 • URN은 콘텐츠 자체에 부여되는 불변의 영구식별기호로서, URN을 이용하여 정보자원의 위치, 접근방법과는 무관하게 해당 정보자원에 쉽게 접근할 수 있음 • Syntax for Uniform Resource Names : RFC 2141(1997) • Functional Requirements for Uniform Resource Names : RFC 1737(1994)
URN의 특징 • 전세계적인 범위(global scope) : 하나의 URN은 범세계적인 이름으로서 어디에서나 같은 의미를 가짐 • 전세계적인 유일성(global uniqueness) : 동일한 URN은 두개의 다른 자원에 절대로 할당되지 않음 • 영구성(persistence) : URN이 식별하는 정보자원의 수명이나 그 명칭의 할당과 관련된 모든 기구의 수명에 관계없이 영구적으로 존속됨 • Scalability : URN은 수백년동안 어떤 정보자원에도 부여할 수 있어야한다 • Extensibility : URN을위한 모든 체계는 후에 확장될 수 있어야한다 • Independence : 어떤 조건으로 명명할 것인가를 결정하는것은 명명기관에 책임이 있다.
URN의 특징 • Resolution : URN을 URL로 변환하는 메커니즘이 있어야한다. • URN은 단일 부호화 방법을 가져야하며, 사람들이 쉽게 옮겨 쓸 수 있어야하며, 자동으로 처리되고 인식될 수 있어야 한다. • 문제점 • 정보가 삭제되면 해당 링크는 死藏 된다 • 간결하게 단축할 수 없어 user-friendly 하지 않다 • Urn:isbn:89-86685-07-8
URN 응용 • OCLC PURL(persistent URL) • 특정 정보자원관 관련된 여러 개의 정보자원 또는 URL에 하나의 PURL이 부여된다. • PURL 서버는 이를 저장하였다가 클라이언트의 요구에따라 HTTP를 통해 PURL을 URL로 변환하는 서비스를 제공한다. • http://purl.oclc.org/keith/home 프로토콜 변환기주소 자원이름 • URN이 보편화되기 전의 전단계 • IDF DOI/CNRI Handle System
2.3. URC 개요 • URC(metadata for masses) • 목적 : URI와 그와 관련된 메타정보의 표현을 위한 전달수단이나 구조를 융통성있게 제공
2.3. URC 개요 • 보편성 : 네트워크에서 접근 가능한 다양한 자원의 기술에 적합하여야한다. • 다양성 : 응용, 자원의 보안수준, 성능, 신뢰성, 지속성 등에 따른 차이에 때문에 동일자원에대한 서로 다른방식의 기술이 가능하여야 한다. • 네트워크 통신측면에서의 최소한의 기술요소를 필수 사항으로 규정 • 시스템 환경, 자원, 프로토콜, 용도등에 구애받지 않음 • 필수사항 이외의 요소들은 해당 자원과 그 주변 조건에 맞게 선택 • URC 하위유형(subtype) 정의
Subtype(하위유형) • 필수요소 • <URC> • 컨테이너 요소, 어떤 특정의 정보원과 관련된 정보를 그룹화 하기위하여는 URC 요소를 반드시 사용하여야 한다. URC 요소에는 다른 URC 요소 포함이 가능함 • <URN> • URC에서 기술한 자원의 URN을 기술한다 • <IDENTIFIER scheme = “URN”> • URC가 기술한 자원이외의 자원을 식별하기 위하여 사용한다. URN이 여러개일 때는 type 속성을 통해 기술한다.
Subtype(하위유형) • 필수요소 • <URL> • URC의 모든 URL 요소는 해당 자원의 유사한 내용을 서로 식별하기 위해 요구되며, 유사성의 판단은 URC 작성자가 한다. • <LOCATION scheme = “URL”> • URC가 기술하는 일반적 인터넷 자원 이외의 자원에 대한 소재를 기술하는데 사용한다 • <INSTANCE> • 특정 자원의 다양한 유형을 식별하기 위해 필요한 관련 정보를 모으는 역할을 수행한다
Subtype(하위유형) • 필수요소 • <FORMAT scheme = “IMT”> • 자원의 데이터 포맷을 기술하는데 사용된다. 기본적인 기술 방식은 MIME(Multi-purpose Internet Mail Extension)이라고 알려져 있는 IMT을 따른다. • 선택요소 • Author, title, subject, publisher, data, other agents, object type(소설, 시, 등), format, relation, source, language, coverage(자원의 소재와 존속기간), URC-creation, URC-source, URC-change
URC 구현 제안 • Trivial URC syntax • SGML-based syntax • Dublin Core • HTML • URL/URC 시스템 • CNRI Handle System • OCLC URN service • U. of Tennessee RCDS • Whois++, 등등
3. 국제동향 • 관련 표준 단체 • IETF, W3C • WAP(Wireless Application Protocols Forum) • Unicode Consortium • Web3D Consortium • Some ISO committees • 관련 기관 • UKOLN : The UK Office for Library and Information Networking
URI는 인터넷 정보자원을 참조하는데 사용되기 때문에 'http' URI 이외에 모든URI scheme 들은 web과 직접 관련 지어진다. • 따라서 모든 URI 활동들은 모든 종류의 식별자와 인테넷 정보자원들 사이의 관계에관한 각종 광범위한 issue들을 다루고 있다. • 각종 연구 활동들은 다양한 방법으로 식별자들에 대하여 연구하고 있다. 대표적인 것들을 보면: Xlink, Xpointer, IDrefs attribute, TV-URIs ( TV-URI requirements 참조), fragment identifiers, HTTP extension identifiers, MIME type names, URI scheme names등이다. 관련 식별자들의 그룹들인 XML namespaces, W3C XML schemas와RDF schemas 등도 포함된다.
IETF URI working group • March 1994 – July 1995 • URN과 URC(UR characteristics, or citation)에 대하여 많은 연구작업 수행 • IETF URN working group • URN syntax(RFC 2141, 1997) • RFC 2168, 2169, 2611, 2648, 2915… • IETF ENUM working group • 1999년 활동 시작
IETF CNRP WG • 1999년 활동 시작 • IETF IDN WG • 2000년 활동 시작 • 다국어 키워드 • UKOLN • openURL
W3C URI/URL WG • W3C URI Planning Interest Group • 2000년 10월에 시작 • W3C의 대표적인 URI 관련 활동들은 다음의 내용들이다 : • Persistence of URIs • Metadata and URIs • New URI schemes • Web resources and identifiers • Internationalization
Internationalized Resource Id.(IRI) • Natural language • easier to memorize • easier to interpret • easier to transcribe • easier to create • easier to guess • easier to identify with • Some problems • Meaning of words changes • The contents of resource changes
IRI • Mapping from IRI to URI • The mapping remove technical restrictions on user-oriented decisions • The mapping extends the benefits of using native languages and scripts without excluding those that do not know these languages or scripts or do not have the appropriate software
IRI • Mapping of IRIs to URIs • IRI를 UCS 방식의 문자로 표기 • Normalization form에따라 문자들을 normalize 시킨다 • US-Ascii code가 아닌 문자에대해 다음을 적용한다 • 문자들을 UTF-8을 사용하여 하나 또는 여러 개의 octet로 변환한다. • 각 octet들을 %HH 로 변환한다 • 원 문자들을 얻어진 결과 문자열로 교환한다. • Work in progress
4. 결론 • IETF, W3C 의 국제 표준활동에 참여 • IETF URN, CNRP, ENUM WG • W3C URI/URL WG • IDF 등 관련 기관의 기술 추적 • URC 메타데이타 개발 및 데이타베이스 구축 • 한글 URL/URN 연구개발 • 음성, 무선환경에서의 URL 등