首页 > 帮助中心 > FAQ

FAQ-常见问题与解答


1.DOI是什么
    DOI(Digital Object Identifier)意为“数字对象标识符”,是一种对包括互联网信息在内的数字信息进行标识的工具。在传统的实体出版物中,无论是书刊,还是磁带、光盘,都会被赋予ISBN、ISSN、ISCN等国际标准编号及其条形码,作为出版物在书海刊林中的唯一性标识。这些标识使出版物得到有效的管理,便于人们查找和利用。而网上的文档一旦变更了网址(URL),就消失得无影无踪,让人无从追索。如果给数字信息加上DOI,就如同出版物贴上了条形码一样,无论走到哪里都有踪迹可寻。因而DOI被形象地称为数字资源的条形码。


2.DOI的起源
    DOI的诞生可追溯到1994年美国出版商协会(The Association of American Publishers,AAP)下属“技术授权委员会”(Enabling Technologies Committee)的成立,该委员会的任务是设计一种在数字环境下保护知识产权和版权所有者商业利益的系统。首先要引进一种出版业标准的数字信息识别码,以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。DOI系统在1997年法兰克福图书博览会上首次亮相,逐渐成为数字资源命名的事实标准。1998年在法兰克福成立了非营利性的组织国际DOI基金会(International DOI Foundation,IDF),负责有关DOI的政策制定、技术支持、标准制定与维护等。2010年11月,DOI系统(ISO 26324 Information and documentation -- Digital object identifier system)经国际标准化组织批准成为正式的ISO国际标准。2012年5月,DOI标准正式出版印刷。


3.DOI的编码方式
    DOI的结构式为: <DIR>.<REG>/< DSS>,DO1分为前缀和后缀两部分,中间用一斜杠分开。前缀中又以小圆点分为两部分,<DIR>为DOI的特定代码,其值为10,用以将DOI与其他应用Handle System(句柄系统)技术的系统区别开。<REG> (Registrant Code)是DOI注册代理机构的代码,由DOI的管理机构IDF(International DOI Foundation,国际DOI基金会)负责分配,由四位阿拉伯数字组成。后缀<DSS> (DOI Suffix String)由DOI注册代理机构——目前主要是学术出版商自行给出,规则不限,只要在该出版商的所有产品中具有唯一性即可。如下面几 例都可以是DOI的合法编码:
10.1234/567810.23416
10.5678/978-0-7645-4889-4
10.1000/ISBN0764548891
10.1234/Norman..presentation
10.2224/2003-1-29
    DOI的命名结构使每个数字资源在全球具有唯一的标识。DOI不同于URL,它是数字资源的名称,而与地址无关。实际上它是一种URI(Universal Resource Identifier,统一资源标识符)或URN(Universal Resource Name,统一资源名称),是信息的数字标签和身份证。有了它,就使信息具有了唯一性和可追踪性。


4.DOI的优越性
  (1)唯一性
    DOI标识符作为数字化对象的识别符,对所标识的数字对象而言,相当于人的身份证,具有全球唯一性。这种特性保证了在网络环境下对数字化对象的准确访问,有效地避免重复。
  (2)持久性
    一个数字化对象的DOI标识符一经产生就永久不变,不随其所标识的数字化对象的版权所有者或存储地址等属性的变更而改变。
  (3)兼容性
    DOI标识符的兼容性体现在DOI码的后缀中可以包含任何已有的标识符,例如国际标准书号ISBN,国际标准刊号ISSN,国际标准文本代码ISTC,出版物件标识符PII等。
  (4)互操作性
    DOI系统提供与数字对象相关的元数据,可以使不同的应用系统了解DOI标识符代表的数字对象,从而为应用系统的互联互通提供了技术基础。
  (5)动态更新
    在DOI系统中,可对DOI关联的元数据进行动态更新,保证DOI标识符提供的信息的有效性。如对数字对象的链接地址进行更新,可以有效避免“死链”的产生。
  (6) 国际通用
    DOI系统已在全球普遍使用,早已成为数字出版行业的事实标准。2010年11月,DOI系统(ISO 26324 Information and documentation — Digital object identifier system)正式成为ISO标准,并于2012年5月10日正式发布。各国相关产业链的参与者可遵循统一的DOI标准对数字对象进行标识、解析链接,可大大降低产业的技术沟通成本和社会沟通成本,促进跨国别、跨语言、跨系统、跨机构的资源链接和共享利用。

5.DOI的技术特点
    DOI以两种技术为基础:Handle System(句柄系统)和<indecs>元数据框架。Handle System 是由美国研究创新联合会(Corporation for National Research Initiative,CNRI)开发的技术平台,用于因特网信息的命名、解析和管理。< indecs> (Interoperability of Data in E-corn-merce Systems)是一套用于在电子商务环境下实现数据互操作的元数据框架,选择<indecs>作为元数据框架为DOI的多种应用提供了基础。Handle System和< indecs>元数据框架为DOI提供了从单一解析到多重解析的应用。首先应用的单一地址解析机制为用户提供了对数字资源的永久性访问。为了避免资源地址的改变造成用户链接失效,DOI系统对资源地址进行了有效的管理。出版商为其每项资源注册DOI时,要同时向Handle System 主机提交资源的DO1名称和网址(URL)。出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System 主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System 服务器上, Handle System 服务器将DOI解析为URL返还给用户终端,使用户实现对资源的访问。这一切都在后台进行,对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI。理论上,DOI提供的资源链接具有永久有效性。提供对资源的永久性链接只是DOI一个基本而初步的应用。



6.什么是单一解析
    单一地址解析机制为用户提供了对数字资源的永久访问。 为了避免由于资源地址的改变而造成用户链接的失效,DOI系统对资源的地址进行了有效的管理。出版商为其每个资源注册DOI时,要同时向Handle System主机提交资源的DOI名称和网址(URL),它们都存放在DOI Directory中。出版商负责对DOI数据的维护,当资源地址发生改变,如网络期刊文章从现刊目录转到存档目录时,出版商应通知Handle System主机作相应的改变,以确保链接的有效性。当用户点击资源的DOI索取信息时,用户的请求被传送到Handle System服务器上,Handle System服务器将查询DOI Directory, 然后将DOI解析为URL返还给用户终端,使用户实现对资源的访问。这一切都在后台进行,对用户来说,无需理会资源地址的任何更动,面对的始终只是同一个DOI。理论上,DOI提供的资源链接具有永久有效性。



7.什么是多重解析
    在现实世界中,一个被标识的数字对象可能会有很多相关资源,并且可能会有多个复本放置于不同的地方。因此,单一解析不能很好地满足用户的信息需求,而Handle System的多重解析机制较好的解决了这个问题。多重解析使DOI不仅能指向一个URL,而且可以指向多个相关URL,以及其他类型的元数据。表1显示了一个DOI可以解析为多种类型的数据。


表1 DOI的多重解析

DOI

解析的数据类型

索引

数据

说明

10.1002/567

URL

3

http://srv1.pub.com/...

镜像1

URL

5

http://srv2.pub.com/...

镜像2

URL

6

http://srv3.pub.com/...

镜像3

EM

10

diglib@pub.com email

E-mail

IP

2

10.2344/458

知识产权


    DOI的多重解析机制为用户提供了更多的选择和便利。例如用户可以选择离自己最近的镜像站点下载数据;可以链接到与查询资源相关的其它资源,如相关评论、相关主题作品及相关音乐、动画等多媒体信息、版权人及出版商的信息与联系方式等,从而为深度利用资源打开了大门。



8.DOI元数据
    DOI元数据是能够实现DOI服务多样化的重要要素。DOI元数据不仅是提高DOI使用价值、而且是进行各种应用服务所必需的要素。但DOI元数据的开发并非易事,不仅可赋予DOI的资源种类繁多、范围广阔,而且为了确保系统间的互换性,还必须考虑多种元数据间的互用性。目前,DOI标准中已提供了可应用于DOI的基本的最小元数据集---核心元数据,进而专注于可具体应用于特定资源(DOI类型)的扩展元数据开发。



9.DOI元数据的必要性与作用
    DOI尽管是确认资源独一无二性的永久性固有识别符,但并非提供针对资源的所有信息。即,DOI其本身是无意义的识别符,它并不包含如被赋予DOI的相关资源的题目是什么、资源的载体是什么(书、电子图书、MP3、戏剧等)、作者是谁等相关信息。
    不过,为了提高DOI的使用价值,提供有用的服务,必须需要一种可使DOI提供关于匹配资源信息的手段。IDF研究的结果认为,元数据可以行使这样的作用,因而将元数据视为促进DOI服务多样化的必须要素。DOI元数据能够对DOI进行高效的检索。此外,元数据在对DOI进行多种转换(即用一个DOI映射URL等多种位置及服务)的过程中,提供实现有意义选择作业(映射所需的位置及服务)的每个变量。不仅如此,在实现目前DOI应用服务中倍受关注的参考链接服务中,元数据的应用也很重要。因此说,元数据不仅拓宽了DOI的应用范围,而且加速了DOI相关各种应用服务的开发。
    另一方面,通过在DOI注册要件中添加元数据,可以有效收集元数据。为保障元数据完美性并实现有效利用,注册机.构应致力于元数据形式及内容的品质管理。



10.DOI核心元数据
    DOI元数据应具有兼容性和扩展性,以支持多种应用环境。为了解决这一问题,开发通用的最小限度的元数据要素、研究统一用语是最为重要的事情。当然,虽然说是最小限度的要素,但至少要达到识别匹配资源的程度,即应满足能够正确检索匹配资源的程度。对此,IDF以INDECS数据模式为基础,进行了DOI元数据开发,1999年上半年开发并发表了能够保障相互兼容性并可应用于任何DOI的构成最小限度数据要素的元数据。IDF将这种最小限度的元数据命名为DOI核心元数据。DOI核心元数据由8个最小限度要素构成。
    DOI核心元数据不具有表现“管理”所需的数据要素,仅由数据值不变的固定值构成。DOI通常必须具有一个以上的DOI类型。DOI核心元数据是可应用于所有DOI的必须项,并同时提供扩展性。即针对个别DOI类型元数据,必须包含DOI核心元数据的要素,与此同时,鉴于各个类型的自身特点,也可以通过对DOI核心元数据再添加或限定更具体的要素,采纳扩展了的元数据。DOI核心元数据将可以公开访问。即DOI使用者应能够自由使用核心元数据检索DOI。



11.DOI类型与元数据扩展
    所谓DOI类型,是指拥有共同属性的资源(作品)的分类。DOI类型多种多样,如学术期刊论文、MP3音频文件、e-book、医学照片等。之所以需要DOI类型的原因是各个DOI类型所需的元数据各异。虽然所有DOI类型都具有最小限度的元数据——DOI核心元数据,但为了对相关资源进行具有且行之有效地管理,大部分类型通常还需要扩展元数据。正如表示音频文件所需的元数据与表现论文所需的元数据必然各不相同一样。
    扩展元数据应由能够支持针对各个类型的具体应用的数据要素构成,这是通过添加或限定DOI核心元数据实现的。所谓添加即指在8种要素之外,再加上主题、形态、模式、观众等要素。所谓限定,是指将元数据要素进一步加以具体化,例如,在可实现文献间参考链接的类型中,被称为“标识符”的顶级核心要素,可被限定为“作品识别符”以及作为作品的表现物的“论文识别符”、“期刊识别符”、“出版日”、“页数”等具有个体值的要素。



12.IDF关于元数据的政策
    DOI注册者可以根据自己的判断选择DOI类型。被DOI注册的资源应具有一种以上DOI类型。任何团体都可以根据需要生成新DOI类型。IDF针对这种申请讨论是否确实需要该新DOI类型。有关新DOI类型的技术、程序、产业性规定的发展是要注册该类型的团体的份内之事,但这种开发过程一定要通过与IDF的合作与对话进行。
    DOI类型元数据模式也应当与INDECS元数据模式的原则及结构保持一致性。IDF负责检查DOI类型元数据模式是否与DOI核心数据和索引元数据具有一致性,如果没有IDF的认可,任何DOI类型元数据都不能发布。另外,有关DOI的所有程序性、产业规定,为了确保与IDF政策的一致性,必需获得IDF的认可。
    必须有至少1个以上的注册机构从事有关DOI类型的业务,否则,IDF不承认该DOI类型为正式类型。虽然IDF采纳了这种开放型的政策,使DOI类型的生成及其应用开发完全在相关利益集团的主导下进行,但为了确保兼容性以及政策上的一贯性,原则上应经过IDF的核查及认可程序。



13.DOI的应用
    目前,西文DOI的发展已经比较成熟。多数西文出版社和全文数据库均采用DOI作为文章的唯一标识,DOI系统已经在许多领域中得到实际应用,越来越多的机构加入这个联盟。其中包括世界信息服务业的巨头,如Elsevier、Springer、John Wiley & Sons,以及国内名列前茅的出版社,如高等教育出版社、中国科学出版社等;也包括小型的,非赢利性的行业协会或学会,如美国计算机协会(ACM),英国的剑桥大学出版社 (CUP),牛津大学出版社(OUP),我国的浙江大学出版社、中国力学学会等;还包括新型的开放出版出版社,如Biomed Central;部分二次文献出版社如CABI Publishing也是联盟成员;另外,还有国家或国际组织,如WHO Press(世界卫生组织出版社)和世界银行以及信息服务机构,如日本科技机构(JST)、德国科技信息所(TIB)等。
  a.在电子期刊的应用
    科技期刊是DOI最早和最成熟的应用领域,也是规模最大的应用。根据DOI主要应用机构CrossRef和中文DOI的统计,截止2012年9月5日,参加CrossRef联盟的出版社和学会有4060个;图书馆1907个;覆盖的刊物27,717个;共发放的DOI数量达到55,876,526个,其中期刊DOI数量46,234,942个,占DOI总量的82.7%。 截止到2012年9月1日,中文DOI注册的期刊数量达1515个,DOI注册总量1,937,528,其中期刊DOI占总量的99%以上。
  b.DOI在电子图书中应用
    随着电子书的蓬勃发展,电子书DOI也成为增长最快的DOI应用。目前电子书DOI方面主要包括以下应用:
  (1)ISBN-A业务
    IDF一直强调,DOI系统无意取代其它标识符,而是希望与其它现存的或新的、作用于各领域的标识符方案(如ISBN, ISSN, ISAN, ISRC等)进行合作,通过将这些标识符集成到DOI系统中,使这些标识符可以利用DOI系统提供网络环境下所需的新的功能支持。ISBN-A就是DOI与其它标识符标准合作的第一个实际应用范例。
    ISBN系统是一个13位数字组成的编码系统,由国际ISBN机构分配和管理。在国际图书贸易中广泛应用了35年。主要应用的范围是物质的图书及相关材料,如:电子书、软件、混合媒体等。
    ISBN-A(“可点击的ISBN”)是由DOI提供技术支持的一项服务,可以将现存的ISBN在DOI系统中进行表达。2010年,DOI标准的管理机构IDF与ISBN标准的管理机构国际ISBN注册中心达成协议,通过将ISBN号集成到DOI编码中的方式,由一个ISBN导出一个DOI,即ISBN-A(可点击的ISBN)。ISBN-A服务利用DOI系统的解析等特性,为ISBN提供了在数字网络环境下所需的支持,为ISBN系统增加了数字网络方面的优势,并且在图书供应链中继续使用ISBN作为唯一标识符而不是增加一个新的标识符,减少了复杂性,增加了兼容性。

    ISBN-A 的语法
    ISBN-A的构成形式是将一个ISBN合并到DOI的语法中,例如:10.97812345/99990,从左至右各部分的语法规则为:
     1.DOI系统前缀 = "10."
    2.ISBN (GS1) Bookland前缀 = "978." or "979."
     3.ISBN 出版者前缀 = 2至 8 位变长数字字符串
     4.前缀/后缀 分隔符 = "/"
     5.ISBN 书序号和校验位= 8至2位变长数字字符串
    注意:
     1."Bookland前缀", "ISBN 出版者前缀" 加上出版序号和校验位的总字符数永远是13位。
     2.ISBN校验位不变;DOI系统不需要该校验位。

     ISBN的应用
    在2010年法兰克福国际书展上, 德国ISBN中心MVB宣布了其ISBN-A应用(通过与DOI RA mEDRA的合作)。相关(德语)信息和到一个样例“图书卡片”的链接(doi:10.978.37657/28839)参见http://bit.ly/ckguHb。
    ISBN-A在电子书产业链管理方面有巨大的应用前景。当一本注册了ISBN-A的图书在互联网上被引用和参照时,出版商可将ISBN-A与一组显示给最终用户的相关信息和服务相关联(可由出版商在任何时刻动态地改变)。使用DOI多重解析特性,ISBN-A可以变成一个能够增强图书体验的一键式连接器,可以附加或关联到无穷无尽的服务种类,在出版服务增值方面为出版社带来了无限的发展空间。

  (2)CrossRef的图书DOI分配与引文链接服务
    2010年,图书DOI注册已成为CrossRef增长最快的业务,注册数量增长5%。这与互联网上电子书业务近年来的迅猛增长是分不开的,特别是有越来越多的学术和专业出版商也都基于网络出版电子图书。为此,CrossRef成立了图书工作组,并发布了一系列指南。
    截止到2012年9月5日,CrossRef有超过550万本书注册的DOI。这意味着有32万个图书标题可用于连接参考。CrossRef的图书工作组已经对现行的图书内容参考文献加工和元数据存储的做法进行了检查,希望能够通过一些最佳实践,实现以下目标:
    • 将书籍,期刊和会议论文集之间的参考链接最大化
    • 增强图书内容的发现,知名度和使用
    • 通过提高功能性加强用户体验
    • 能够建立图书引用的报告机制,这种机制将为图书内容建立知名度和信誉度,并可实现与目前期刊内容类似的图书内容衡量标准。
    在存储、链接和DOI使用方面,CrossRef推荐的最佳实践包括:
    • 在标题、章节或条目级别分配DOI。
    • 尽快在图书中加入从参考文献链出的链接。
    • 将图书中的引文信息存储到CrossRef,以实现CrossRef被引链接。
    • 指导作者使用页码、章节条目的标题和DOI引用具体的章节和条目。虽然一开始作者可能没有DOI或不知道DOI是什么,但要鼓励作者使用DOI以提高认识。在作者指南中添加使用DOI引用的例子。
    • 更新编辑指南,采用新的编辑工具,提高参考文献信息质量:一方面请文字编辑寻找在图书参考文献中列出的页码和章节标题;另一方面将检查参考文献作为生产过程的一部分并在工作中使用CrossRef工具,以便参考文献信息得到校正和补充。

  (3)中文DOI的电子书DOI应用
    2012年9月,中文DOI的电子书DO注册服务正式上线,并与国内领先的高等教育出版社签订了电子书DOI注册服务协议。下面是中文DOI注册的电子书DOI的例子:
    图书DOI: 10.3868/b.isbn.978-7-04-017267-6
    章节DOI:10.3868/b.isbn.978-7-04-017267-6.c03

  c.科学数据DOI
    科学数据DOI应用的主要目标是:
    为科学研究数据在互联网环境下的访问建立便利的途径,以增加人们对研究数据的认可,将其作为对科学记录合法的、可引用的成果支持数据存档,并允许这些数据在未来的研究中被验证以及被重新利用。
    DataCite是IDF的另一个主要的RA,重点开展科学数据DOI方面的注册和服务。其前身是德国科技图书馆(German National Library of Science and Technology,TIB),2009年12月1日TIB联合其它来自欧美等国的领先的研究型图书馆、信息中心等机构,成立了一个国际联合体。目前DataCite提供注册的资源种类包括:数据集、论文、医学案例、科学电影剪辑、3D模型、会议录等。截止到2011年11月底,注册的DOI总量达到1,144,623个。

    中文DOI也将科学数据DOI作为先期重点开展的应用之一,目前注册数量15000个,主要包括国家自然科学平台、中科院寒区旱区环境与工程研究所等注册的数据库和数据集。

    日本科技振兴机构(JST)、韩国科技信息研究所(KISTI)对科学数据DOI都产生了浓厚的兴趣,中日韩三国将基于DOI开展科学数据共享领域的研究与合作。

  d.其他
    DOI所标识的数字对象类型越来越广泛,除上述的期刊、图书、科学数据之外,还包括会议录、学位论文、标准、科技报告等各种文献资源,并且于2010年跨越了出版行业,正式进入影视作品领域。2010年6月,成立于好莱坞的娱乐业标识注册(Entertainment ID Registry,EIDR)服务申请加入IDF,并被批准为RA,2011年11月底,其DOI注册量已超过24万。其他类型的数字对象也将逐步纳入DOI的标识范围内。 应该说西文DOI的发展充分表明了西方各数字出版商在合作中求生存的理念。通过这种理念的实施,在为图书馆和用户带来了最好的服务的同时,也拓展了整个行业的生存空间。



14.DOI给数字出版行业带来了什么
DOI的发展带来了行业共赢。
    出版商:国外的数字出版商使用唯一标识符首先是为了实现持久链接;其次是通过DOI系统实现引文到全文的链接,实现一站式服务,从而提高整个行业的服务数量和服务质量,提升整个行业的产品竞争力。
    图书馆:通过在本地导入DOI并与OpenURL结合,图书馆为它的用户提供了访问更多的图书馆未能收藏的全文文献的机会,并可以更加有效的管理现有资源,开发更为高效的检索和馆藏功能。
    二次文献数据库:实现二次文献数据库与全文数据库的链接,如SCI、EI、CSA、CABI等都通过DOI建立了与全文的链接。
    搜索服务:在学术搜索中引入DOI可以提高搜索质量。例如CrossRef与Google合作的CrossRef Search。与一般的Google搜索不同,CrossRef Search仅在成员所提供的学术内容中进行搜索,因此不像一般的web搜索那样产生很多噪声结果,而且通过DOI保证了检索结果到全文链接的有效性和持久性。