메타데이터를 위한 상호호환성 수준

작성자 :
Mikael Nilsson
KMRGroup, NADA, KTH (Royal Institute of Technology), 스웨덴
작성자 :
Thomas Baker
DCMI
작성자 :
Pete JohnstonM
Eduserv Foundation, 영국
발행일 :
2009-05-01
식별자 :
http://dublincore.org/documents/2009/05/01/interoperability-levels/
대체함 :
http://dublincore.org/documents/2008/11/03/interoperability-levels/
대체됨 :
Not applicable
최신 버전 :
http://dublincore.org/documents/interoperability-levels/
문서의 지위 :
이 문서는 DCMI의 권고안 (권고 자원) 이다.
설명 :
이 문서는 상호호환성의 다른 유형들을 위한 어플리케이션을 설계하는데 포함되는 설계 초이스들을 다루고 있다. 제 1 수준에서, 어플리케이션은 공유된 자연어 정의와 함께 데이터 요소를 사용한다. 제 2 수준에서, 데이터는 W3C 자원기술프레임워크의 형식 시맨틱 모델에 기초한다. 제 3 수준에서, 데이터는 기술집합(레코드)으로서 구조화된다. 제 4 수준에서, 데이터 내용은, 기술집합프로파일에서 기술된, 공유된 제약 집합에 의해 제약된다. 각 수준에 맞는가에 대한 테스트들과 예시들은 각 수준별로 제공된다. 저자들은 이 문서가 상호호환성의 각 수준에 있어서 잃어버리는 것과 얻는 것이 무엇인가를 알아보면서 발전할 것으로 기대하며, 독자들로부터의 피드백을 환영하는 바이다.

목차

  1. 1.서론
  2. 2.제 1 수준: 공유된 용어 정의
  3. 3.제 2 수준: 공식 시맨틱 상호호환성
  4. 4.제 3 수준: 기술 집합 구문론적 상호호환성
  5. 5.제 4 수준: 기술 집합 프로파일 상호호환성
  6. 6.참고자료
  7. 7.감사의 말

서론

지난 10년에 걸쳐 15개의 요소들 [RFC2413]에서 더블린코어 어플리케이션 프로파일 [DCAP]를 위한 싱가포르 프레임워크로 이끌어온 발전하는 가정은 상호호환성의 층을 이룬 모델 안에서 설명될 수 있다. 여기서 말하는 단계모델은 더블린 코어의 다양한 상호호환성의 정도를 갖는 다양한 프로젝트들을 위치시키는 데에서 느껴지는 필요성을 설명하고 있지만, 적당한 용어체계가 부족한 것은 사실이다.

이 모델의 의도는 향상된 표준 상호호환성을 위한 어플리케이션을 설계하는 것과 관련된 선택권, 비용, 그리고 혜택을 구체화하기 위한 상호호환성의 계단(ladder of interoperability)을 제공하는 데에 있다. 이 문서는 어떤 규격 (또는 어플리케이션) 의 가능한 더블린코어 메타데이터의 상호호환성 수준을 기술한다. 이러한 단계들은 "더블린코어와 호환"하기를 원하거나 "더블린코어 호환" 규격 이용자들의 기대 수준을 설정하기를 원하는 프로젝트의 범위를 결정하는 데에 도움이 될 수 있다.

이 단계들은 가이드라인으로서 상호호환성의 수준을 결정하기 위한 간단한 리트머스 시험과 함께 온다. 이러한 단계들은 서로 연결되면서 높아가는데, 그러므로 3단계 일치 규격은 자동적으로 1단계와 2단계를 충족시키며, 4단계 일치 규격은 이전의 세 단계를 모두 충족시키다. 이 시점에서 이 수준들에 있어서의 광범위한 의견 일치는 없다. 저자들은 이 문서가 상호호환성의 각 수준에 있어서 잃어버리는 것과 얻는 것이 무엇인가를 알아보면서 발전할 것으로 기대하며, 독자들로부터의 피드백을 환영하는 바이다.

Interoperability Levels

제 1 수준: 공유된 용어 정의

15개 요소 더블린코어 (NISO, ISO, 그리고 IETF 표준에서의)는 자연어 정의과 함께 개념의 어휘를 제공한다. 기계처리가능성 ("공식적" 시맨틱)의 고려는 제쳐 두고, 이러한 어휘들은, 한 집단 내에서 혹은 여러 집단 간에 의미를 공유할 수 있는 기반을 제공하는데, 즉 참조용어에 관한 URI들 (공식적으로 정해진 도메인, 범위 혹은 DCMI 추상모델 같은 높은 수준에서의 구조물들) 을 제공하지 않아도 되는 "비공식적" 상호호환성이라고 할 수 있을 것이다. 예를 들어, IEEE Learning Object Metadata에 의해 제공된 DCMI 용어로 DCMI 용어 정의와 맵핑을 재사용하는 것은 심플 더블린코어(Simple Dublin Core)에 "비공식적으로 일치" 하는 것으로 보여질 수 있다.

이 수준은 더블린코어 용어의 자연어 정의를 사용하는 것에 해당한다.

  • 용어 URI의 사용은 필수사항은 아니다 - 용어는 어떤 방법으로든 참조될 것이다.
  • 특정 도메인과 범위들의 용어를 따르는 것은 필수사항이 아니다.
  • DCMI 추상모델을 따르는 것은 필수사항이 아니다.
  • 역사적으로 말하자면, 더블린코어와의 공식적인 상호호환성은 15가지의 요소들의 사용을 의미해왔지만, 비공식적 상호호환성의 개념은 자연어로 정의된 어느 메타데이터 용어로도 원칙 적으로 적용가능하다.

테스트

  • "문자열들과 사용되는, 반복가능한, 오래된 15개 요소"로서 정의되는 부분적인 맵핑이 심플 더블린코어(Simple Dublin Core)로 가능한가? 만약 그렇다면, 그 사양은 비공식적으로 더블린코어 메타데이터와 상호호환이 가능한 것이다.

예시

  • IEEE LOM은 DC 용어 정의를 재사용하며 심플 더블린코어(Simple Dublin Core)로의 매핑을 제공한다.

제 2 수준: 공식적인 시맨틱 상호호환성

"시맨틱" 상호호환성은 RDF 그래프 데이터 모델 내, DCMI 메타데이어 용어와 같은 RDF-기반의 어휘들 내에서 구체화된 공식적인 RDF 시맨틱의 정밀하고 정확한 사용에 기초한다. 이런 점에서 "시맨틱"은 형식을 잘 따르는 자연어 정의(더블린코어 커뮤니티 내에서 사실 이렇게 "시맨틱"이라는 용어가 전통적으로 사용되었다)를 일컫는 것은 아니다. 오히려, 이것은 자동적인 결론 (논리적인 추론)을 이끌어내는 어떤 문장들을 사용하기 위한 용어와 규칙 사이에 공식적으로 정해진 관계들을 의미한다. 이것은 URI의 사용(또는 추론가능성)과 형식적으로 구체화된 도메인, 범위 그리고 하위속성 관계와의 일치를 포함한다. 본래의 인코딩 형식에도 불구하고, 예를 들어 만약 GRDDL 변형을 통하여 RDF 트리플로의 완벽한 매핑이 제공된다면, 이 사양은 "의미론적 상호호환가능한 것"으로 일컬어질 수 있을 것이다.

이 단계는 DCMI 용어들 밑에 있는 암묵적 또는 명료한 RDF 시맨틱의 사용과 일치한다. 그래서, 용어들의 사용에 있어서, RDF 모델, 도메인 그리고 용어의 범위를 정확하게 따를 필요가 있는 것이다.

  • 규격/어플리케이션은 URI를 사용하여 명시적으로 데이터를 인코드 할 필요는 없지만, 용어 URI들은 반드시 추론할 수 있어야만 한다.
  • 용어들이 구체화된 도메인과 범위를 따르는 것은 필수사항이다.
  • 사용된 속성의 하위 속성 시맨틱과도 맞아야 한다.
  • DCMI 추상 모델을 따르는 것은 필수사항이 아니다.

테스트

  • 사용된 용어들이 특정 도메인과 범위를 따르는 RDF로의 "완벽한" 맵핑이 있는가? 만약 있다면, 그 규격/사양은 의미론적으로 더블린코어 메타데이터와 상호호환가능하다.

예시

  • 모든 RDF 데이터는, 그 정의에 따라, 더블린코어 메타데이터와 의미론적으로 상호호환가능하다.
  • RDF로의 GRDDL 변형과 관련있는 모든 데이터는 더블린코어 메타데이터와 의미론적으로 상호호환가능하다.
  • 2008년 XHTML과 HTML 메타 태그 내에서의 더블린코어 메타데이터 표현" 규격을 사용하는 데이터는 더블린코어 메타데이터와 의미론적으로 상호호환가능하다.

제 3 수준: 기술 집합 구문론적 상호호환성

RDF에 의해 특정된, 한정되지않은 그래프에 더하여, DCMI 추상 모델은, 확인과 메타데이터 레코드 [ABSTRACT-MODEL]의 교환을 위한 기초를 제공하는, 한정된 기술과 기술집합의 개념들을 층으로 만들었다. DCMI 추상모델에 따라 구조화된 메타데이터 -- 예를 들어, 최근의 DCMI로부터의 구문론 가이드라인을 사용한 데이터 생성 --는 "DCMI 추상 모델과 상호호환가능"이라고 일컬어질 수 있다. RDF 추상 구문론을 넘어, DCMI 추상모델은 다음과 같은 내용을 제공한다:

  • 도서관이나 리포지터리 공동체에서의 관리될 수 있는 "레코드"의 개념과 같은, 특정된 식별을 가진 한정된 독립체로서의 "기술집합"의 개념.
  • 비록 레코드 내에 삽입된 기술이라 할지라도, 특정된 식별을 가진 한정된 독립체로서의 "기술"의 개념.
  • Value URIs, Value Strings, 그리고 Vocabulary Encoding Scheme URIs의 다양한 결합을 사용한 그래프로서 "진술(statements)"의 확장된 모델. (Vocabulary Encoding Scheme의 공식적인 개념은 DCMI 추상모델에 특정한다.)
  • 기술된 자원의 "표현"과 URI를 가진 그 자원의 "식별" 사이의 구별을 위한 관행들.
  • 여러 개의 값 문자열들을 가지고 하나의 값을 가진 자원을 "표현"하는 데 있어서의 관행들.

이 단계는 메타데이터 내에서 DCMI 추상모델을 명시적으로 사용하는 것에 해당한다.

  • 메타데이터는 반드시 기술과 기술집합의 DCMI 추상모델 개념을 사용하여 구조화되어야만 한다.
  • 기술 내에서의 진술들은 DCMI 추상모델에 의해 정의된 구조를 반드시 사용해야한다.

테스트

  • DC-TEXT [DC-TEXT]로의 완벽한 매핑이 있는가? 만약 있다면, 이 규격은 DCMI 추상모델과 호환가능하다.

예시

  • DCMI에 의해 발표된 DCMI 추상모델과 호환가능한 메타데이터 표현들을 사용한 모든 데이터.

제 4 수준: 기술 집합 프로파일 상호호환성

"기술 집합 프로파일: 더블린코어 어플리케이션 프로파일을 위한 제약 언어" [DC-DSP] 규격은 기술집합에 관한 정보 모델과 구조 제약의 XML 표현을 제공한다. 만약 이것이 기술 집합 프로파일 규격 내의 것들과 호환가능한 기술 집합에서 공식적인 제약을 제공한다면, Scholarly Works (Eprints) Application Profile과 같은 어플리케이션은 "기술-집합-프로파일-상호호환가능 (Description-Set-Profile-interoperable)"으로 일컬어질 수 있다.

관련된 규격인, 더블린코어 어플리케이션 프로파일 [DCAP]를 위한 싱가포르 프레임워크는 최대의 상호호환성과 재사용을 위한 메타데이터 어플리케이션을 보여주기 위해 필요한 문서 요소들의 집합에 관한 윤곽을 그리는데, 그 요소들은 Functional Requirements, Domain Model, 그리고 완벽한 메타데이터 집합을 다루는 기술집합프로파일과 같은 요소들을 의미한다.

테스트

  • "완전한" 기술 집합 프로파일이 있는가? 만약 있다면, 그 규격은 기술 집합 프로파일 규격의 수준에서 상호호환가능하다.

예시

  • Scholarly Works 어플리케이션 프로파일 (Scholarly Works Application Profile) [SWAP]

참고자료

[ABSTRACT-MODEL]

Powell, A., M. Nilsson, A. Naeve, P. Johnston, T. Baker. DCMI Abstract Model. DCMI 권고안.
http://dublincore.org/documents/2007/06/04/abstract-model/

[DC-DSP]

Nilsson, M. Description Set Profiles: A constraint language for Dublin Core Application Profiles.DCMI 규격 초안..
http://dublincore.org/documents/2008/03/31/dc-dsp/

[DC-TEXT]

Johnston, P. Expressing Dublin Core metadata using the DC-Text format DCMI 권고안.
http://dublincore.org/documents/2007/12/03/dc-text/

[DCAP]

Nilsson, M., T. Baker, P. Johnston. The Singapore Framework for Dublin Core Application Profiles.DCMI 권고안.
http://dublincore.org/documents/2008/01/14/singapore-framework/

[RFC2413]

Weibel, S., J. Kunze, C. Lagoze, M. Wolf. Dublin Core Metadata for Resource Discovery. 의견을 위한 IETF 요청.
<http://www.ietf.org/rfc/rfc2413.txt>

[SWAP]

Scholarly Works Application Profile.
<http://www.ukoln.ac.uk/repositories/digirep/index/SWAP>