会员系统 | 网站地图 | 联系我们
 
   

FAQ-常见问题与解答

1.DOI是什么
  DOI(Digital Object Identifier)意为“数字对象标识符”,是一种对包括互联网信息在内的数字信息进行标识的工具。在传统的实体出版物中,无论是书刊,还是磁带、光盘,都会被赋予ISBN、ISSN、ISCN等国际标准编号及其条形码,作为出版物在书海刊林中的唯一性标识。这些标识使出版物得到有效的管理,便于人们查找和利用。而网上的文档一旦变更了网址(URL),就消失得无影无踪,让人无从追索。如果给数字信息加上DOI,就如同出版物贴上了条形码一样,无论走到哪里都有踪迹可寻。因而DOI被形象地称为数字资源的条形码。


2.DOI的起源
  DOI的编码方式与技术特点DOI的诞生可追溯到1994年美国出版商协会(The Association of American Publishers,AAP)下属“技术授权委员会”(Enabling Technologies Committee)的成立,该委员会的任务是设计一种在数字环境下保护知识产权和版权所有者商业利益的系统。首先要引进一种出版业标准的数字信息识别码,以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。DOI系统在1997年法兰克福图书博览会上首次亮相,成为数字资源命名的一项标准。1998年在法兰克福成立了非营利性的组织国际DOI基金会(International DOI Foundation,IDF),负责有关DOI的政策制定、技术支持、名址注册等业务。


3.DOI的编码方式
  DOI的结构式为: <DIR>.<REG>/< DSS>,DO1分为前缀和后缀两部分,中间用一斜杠分开。前缀中又以小圆点分为两部分,<DIR>为DOI的特定代码,其值为10,用以将DOI与其他应用Handle System(句柄系统)技术的系统区别开。<REG> (Registrant Code)是DOI注册代理机构的代码,由DOI的管理机构IDF(International DOI Foundation,国际DOI基金会)负责分配,由四位阿拉伯数字组成。后缀<DSS> (DOI Suffix String)由DOI注册代理机构——目前主要是学术出版商自行给出,规则不限,只要在该出版商的所有产品中具有唯一性即可。如下面几  例都可以是DOI的合法编码:
  10.1234/567810.23416
  10.5678/978-0-7645-4889-4
  10.1000/ISBN0764548891
  10.1234/Norman..presentation
  10.2224/2003-1-29
  DOI的命名结构使每个数字资源在全球具有唯一的标识。DOI不同于URL,它是数字资源的名称,而与地址无关。实际上它是一种URI(Universal Resource Identifier,统一资源标识符)或URN(Universal Resource Name,统一资源名称),是信息的数字标签和身份证。有了它,就使信息具有了唯一性和可追踪性。


4.DOI的技术特点
  DOI以两种技术为基础:Handle System(句柄系统)和<indecs>元数据框架。Handle System 是由美国研究创新联合会(Corporation for National Research Initiative,CNRI)开发的技术平台,用于因特网信息的命名、解析和管理。< indecs> (Interoperability of Data in E-corn-merce Systems)是一套用于在电子商务环境下实现数据互操作的元数据框架,选择<indecs>作为元数据框架为DOI的多种应用提供了基础。Handle System和< indecs>元数据框架为DOI提供了从单一解析到多重解析的应用。首先应用的单一地址解析机制为用户提供了对数字资源的永久性访问。为了避免资源地址的改变造成用户链接失效,DOI系统对资源地址进行了有效的管理。出版商为其每项资源注册DOI时,要同时向Handle System 主机提交资源的DO1名称和网址(URL)。出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System 主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System 服务器上, Handle System 服务器将DOI解析为URL返还给用户终端,使用户实现对资源的访问。这一切都在后台进行,对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI。理论上,DOI提供的资源链接具有永久有效性。提供对资源的永久性链接只是DOI一个基本而初步的应用。


5.什么是单一解析
  单一地址解析机制为用户提供了对数字资源的永久访问。 为了避免由于资源地址的改变而造成用户链接的失效,DOI系统对资源的地址进行了有效的管理。出版商为其每个资源注册DOI时,要同时向Handle System主机提交资源的DOI名称和网址(URL),它们都存放在DOI Directory中。出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System服务器上,Handle System服务器将查询DOI Directory, 然后将DOI解析为URL返还给用户终端,使用户实现对资源的访问。这一切都在后台进行,对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI。理论上,DOI提供的资源链接具有永久有效性。


6.什么是多重解析
  在现实世界中,一个被标识的数字对象可能会有很多相关资源,并且可能会有多个复本放置于不同的地方。因此,单一解析不能很好地满足用户的信息需求,而Handle System的多重解析机制较好的解决了这个问题。多重解析使DOI不仅能指向一个URL,而且可以指向多个相关URL,以及其他类型的元数据。表1显示了一个DOI可以解析为多种类型的数据。

表1 DOI的多重解析

DOI

解析的数据类型

索引

数据

说明

10.1002/567

URL

3

http://srv1.pub.com/...

镜像1

URL

5

http://srv2.pub.com/...

镜像2

URL

6

http://srv3.pub.com/...

镜像3

EM

10

diglib@pub.com email

E-mail

IP

2

10.2344/458

知识产权

  DOI的多重解析机制为用户提供了更多的选择和便利。例如用户可以选择离自己最近的镜像站点下载数据;可以链接到与查询资源相关的其它资源,如相关评论、相关主题作品及相关音乐、动画等多媒体信息、版权人及出版商的信息与联系方式等,从而为深度利用资源打开了大门。


7.DOI元数据
  能够使DOI服务实现多样化的要素中最重要的手段是DOI元数据。DOI元数据不仅是提高DOI使用价值、而且是进行各种应用服务所必需的要素。但DOI元数据的开发并非易事,不仅可赋予DOI的资源种类繁多、范围广阔,而且为了确保系统间的互换性,还必须考虑多种元数据间的互用性。目前,IDF以INDECS为基础,倾力DOI元数据开发。并以开发、发表了可应用于DOI的基本的最小元数据---核心元数据,进而专注于可具体应用于特定资源(DOI类型)的扩展元数据开发。就现在情况而言,基本方案是取得对DOI元数据的正确理解,并以此为基础减少应用中的失误,提高费效比。


8.DOI元数据的必要性与作用
  DOI尽管是确认资源独一无二性的永久性固有识别符,但并非提供针对资源的所有信息。即,DOI其本身是无意义的识别符,它并不包含如被赋予DOI的相关资源的题目是什么、资源的载体是什么(书、电子图书、MP3、戏剧等)、作者是谁等相关信息。
  不过,为了提高DOI的使用价值,提供有用的服务,必须需要一种可使DOI提供关于匹配资源信息的手段。IDF研究的结果认为,元数据可以行使这样的作用,因而将元数据视为促进DOI服务多样化的必须要素。DOI元数据能够对DOI进行高效的检索。此外,元数据在对DOI进行多种转换(即用一个DOI映射URL等多种位置及服务)的过程中,提供实现有意义选择作业(映射所需的位置及服务)的每个变量。不仅如此,在实现目前DOI应用服务中倍受关注的参考链接服务中,元数据的应用也很重要。因此说,元数据不仅拓宽了DOI的应用范围,而且加速了DOI相关各种应用服务的开发。
  另一方面,通过在DOI注册要件中添加元数据,可以有效收集元数据。为保障元数据完美性并实现有效利用,注册机关应致力于元数据形式及内容的品质管理。


9.DOI核心元数据
  DOI元数据应具有兼容性和扩展性,以支持多种介质环境。为了解决这一问题,开发通用的最小限度的元数据要素、研究统一用语是最为重要的事情。当然,虽然说是最小限度的要素,但至少要达到识别匹配资源的程度,即应满足能够正确检索匹配资源的程度。对此,IDF以INDECS数据模式为基础,进行了DOI元数据开发,1999年上半年开发并发表了能够保障相互兼容性并可应用于任何DOI的构成最小限度数据要素的元数据。IDF将这种最小限度的元数据命名为DOI核心元数据。DOI核心元数据由8个最小限度要素构成。
  DOI核心元数据不具有表现“管理”所需的数据要素,仅由数据值不变的固定值构成。DOI通常必须具有一个以上的DOI类型。DOI核心元数据是可应用于所有DOI的必须项,并同时提供扩展性。即针对个别DOI类型元数据,必须包含DOI核心元数据的要素,与此同时,鉴于各个类型的自身特点,也可以通过对DOI核心元数据再添加或限定更具体的要素,采纳扩展了的元数据。DOI核心元数据将可以公开接近。即DOI使用者应能够自由使用核心元数据检索DOI。


10.DOI类型与元数据扩展
  所谓DOI类型,是指拥有共同属性的资源(作品)的分类。DOI类型多种多样,如学术期刊论文、MP3音频文件、e-book、医学照片等。之所以需要DOI类型的原因是各个DOI类型所需的元数据各异。虽然所有DOI类型都具有最小限度的元数据——DOI核心元数据,但为了对相关资源进行具有且行之有效地管理,大部分类型通常还需要扩展元数据。正如表示音频文件所需的元数据与表现论文所需的元数据必然各不相同一样。
  扩展元数据应由能够支持针对各个类型的具体应用的数据要素构成,这是通过添加或限定DOI核心元数据实现的。所谓添加即指在8种要素之外,再加上主题、形态、模式、观众等要素。所谓限定,是指将元数据要素进一步加以具体化,例如,在可实现文献间参考链接的类型中,被称为“标识符”的顶级核心要素,可被限定为“著作物识别符”以及作为著作物的表现物的“论文识别符”、“期刊识别符”、“出版日”、“页数”等具有个体值的要素。


11.IDF关于元数据的政策
  DOI注册者可以根据自己的判断选择DOI类型。被DOI注册的资源最低应具有一种以上DOI类型。需要生成新DOI类型的团体无论是谁, 都可以申请。IDF针对这种申请讨论是否确实需要该新DOI类型。有关新DOI类型的技术、程序、产业性规定的发展是要注册该类型的团体的份内之事,但这种开发作业一定要通过与IDF的合作与对话进行。
  DOI类型元数据模式也应当与INDECS元数据模式的原则及结构保持一致性。IDF负责检查DOI类型元数据模式是否与DOI核心数据和索引元数据保持有一致性,如果没有IDF的承认,任何DOI类型元数据都不能发布。另外,有关DOI的所有程序性、产业规定,为了确保与IDF政策的一致性,必需获得IDF的承认。
  必须有至少1个以上的注册机关从事有关DOI类型的业务,否则,IDF不承认该DOI类型为正式类型。虽然IDF采纳了这种开放型的政策,使DOI类型的生成及其应用开发完全在相关利益集团的主导下进行,但为了确保兼容性以及政策上的一贯性,原则上应经过IDF的核查及认可程序。


12.DOI的应用
  目前,西文DOI的发展已经比较成熟。多数西文出版社和全文数据库均采用DOI作为文章的唯一标识,DOI系统已经在许多领域中得到实际应用,越来越多的机构加入这个联盟。其中包括世界信息服务业的巨头,如Elsevier、Springer、John Wiley & Sons等;也包括小型的,非赢利性的行业协会或学会,如Association for Computing Machinery (ACM),Cambridge University Press (CUP),Oxford University Press (OUP)等;还包括新型的开放出版出版社,如Biomed Central;部分二次文献出版社如CABI Publishing也是联盟成员;另外,还有国家或国际组织,如WHO Press(世界卫生组织出版社)和世界银行以及信息服务机构,如日本科技机构(JST)、德国科技信息所(TIB)等。
  a.在电子期刊的应用
  根据DOI主要应用机构CrossRef统计,截止2007年3月2日,参加CrossRef联盟的出版社和学会有2335个;图书馆1188个;覆盖的刊物16,884个;共发放的DOI数量达到惊人的25,325,745个;而2007年2月单月的DOI发放量就达到585,846个,检索(引文匹配查询)量达到5,486,433个。
  b.DOI在电子图书中应用
  DOI在电子图书中也得到了应用,DOI-EB Project就是其中的范例。DOI-EB Project是由IDF发起的一项工程,目前已有几家最大的图书发行商(如Mc-Graw-Hill,Random House/Bertelsmann,John Wiley & Sons等)和许多技术公司加入DOI-EB Project。2000年11月,在AAP(美国出版商协会)的开放电子图书出版标准先导计划(Open Ebook Publishing Standards Initiative)中,建议采用DOI作为基本的标识系统来管理和电子图书发展相关的元数据。由于DOI的多重解析机制和使用<indecs>元数据框架来实现语义的互操作,因此如果在一本书的开始部分提供一个DOI链接,就能使用户在网上找到想要购买的印刷版本图书。同时,用户也可以通过这个DOI链接获得这本书的摘录、书评以及出版商的目录页等相关信息,进而用户可以通过这些相关信息决定是否购买电子版本的图书。 通过在电子文献阅读软件中嵌入DOI(DOI-EB Project主要采用Adobe eBook Reader和Microsoft Reader),用户就可以链接到出版商的地址去购买Ebook,或者付费打印电子文献。这是DOI在电子商务中的应用。由于DOI主要是由出版界发起建立的一个标准,它更多地考虑到促进出版界开展电子商务,保护知识产权和出版商利益的需要。因此,DOI在出版界电子商务领域的应用潜力是十分巨大的。
  c.其他
  同时,DOI所标识的数字对象类型也越来越多,包括期刊、会议记录、图书等各种资源,并且其他类型的数字对象也将逐步纳入DOI的标识范围内。 应该说西文DOI的发展充分表明了西方各数字出版商在合作中求生存的理念。通过这种理念的实施,在为图书馆和用户带来了最好的服务的同时,也拓展了整个行业的生存空间。


13.DOI给数字出版行业带来了什么
DOI的发展带来了行业共赢。
  出版商:国外的数字出版商使用唯一标识符首先是为了实现持久链接;其次是通过DOI系统实现引文到全文的链接,实现一站式服务,从而提高整个行业的服务数量和服务质量,提升整个行业的产品竞争力。
图书馆:通过在本地导入DOI并与OpenURL结合,图书馆为它的用户提供了访问更多的图书馆未能收藏的全文文献的机会,并可以更加有效的管理现有资源,开发更为高效的检索和馆藏功能。
  二次文献数据库:实现二次文献数据库与全文数据库的链接,如SCI、EI、CSA、CABI等都通过DOI建立了与全文的链接。
  搜索服务:在学术搜索中引入DOI可以提高搜索质量。例如CrossRef与Google合作的CrossRef Search。与一般的Google搜索不同,CrossRef Search仅在成员所提供的学术内容中进行搜索,因此不像一般的web搜索那样产生很多噪声结果,而且通过DOI保证了检索结果到全文链接的有效性和持久性。

14.中文DOI的发展和问题
  国内大型数字期刊生产商都不同程度使用了唯一标识符,例如万方数据、清华同方和重庆维普都采用各自的唯一标识符方案。此外,其他类型的数字资源生产商,如方正Apabi电子图书同样使用了唯一标识符。
同国外相比,国内唯一标识符的应用仍处于初级阶段,表现在几个方面:
  1、国内的唯一标识符没有形成统一规范,各个数字文献生产商使用的唯一标识符各异。
  2、唯一标识符仅在各自资源范围内发挥作用,一旦脱离各自的数据库,唯一标识符便成为没有意义的字符串
  3、唯一标识符的应用层次比较低,作用仅限于对内部数字对象的标识, 没有建立相应的解析系统和管理机制,更谈不上不同出版商系统之间的互操作。
  如果国内数字出版商能够采用DOI系统建立类似CrossRef这样的跨出版商参考文献链接系统,不仅有助于整体提升行业服务质量,而且对国家科技信息资源的建设也有重要的意义。

 

 
 

DOI® and DOI.ORG® are registered trademarks and the DOI> logo is a trademark of The International DOI Foundation.
最佳浏览环境:IE7.0以上版本浏览器 1024X768分辨率
--= 2007-2010 北京万方数据股份有限公司版权所有 中数创新技术支持 =--

 
返回首页