专业数字图书资源与格式
在数字阅读时代,较传统的数字图书格式通常是基于exe、chm、txt或html等,以及适合移动设备的格式如mobi、epub、prc、azw等,它们都倾向于碎片化轻阅读。但当我们在接触艺术、科学和医学等专业阅读时,需要了解更多数字图书资源及格式。
古腾堡工程(Project Gutenberg),肇始于1971年,是最早的数字图书馆。其中的大部分书籍都是公有领域书籍的原本,古腾堡工程确保这些原本自由流通、自由文件格式,有利于长期保存,并可在各种计算机上阅读。截至2012年7月,古腾堡工程声称超过40,000件馆藏。
百万图书项目(The Million Book Project)
百万图书项目(或通用图书馆)是由卡内基梅隆大学计算机科学与大学图书馆学院领导的图书数字化项目。与印度(印度数字图书馆)和中国的政府和研究合作伙伴合作,该项目以多种语言扫描图书,使用OCR启用全文搜索,并提供免费阅读的网页上的图书。截至2007年,他们已经完成了扫描100万本书籍,并可从http://www.ulib.org/和https://archive.org/details/universallibrary访问整个数据库。
2002年,PDF、DjVu和TIFF被Internet Archive的百万书籍计划(Million Book Project)选中,作为公有领域书籍扫描后上线的文件格式。
PDF:便携式文档格式(Portable Document Format,简称PDF),由Adobe专有格式演变而成的开放标准文件格式,包含固定布局的平面文档的完整描述,包括文本、字形、图形及其他需要显示的信息。源生浏览器:Adobe Acrobat
DjVu:DjVu技术最初由AT&T实验室于1996年开发的一种开放文件格式,以较小的空间,存放高质量的可读图像,主要用于存储扫描的文档。源生浏览器:WinDjView
TIFF:标签图像文件格式(Tagged Image File Format,简写为TIFF)是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像。它最初由Aldus公司与微软公司一起为PostScript打印开发,与JPEG和PNG一起成为流行的高位彩色图像格式。
中国的“百万书籍计划”
PDG:北京世纪超星信息技术发展有限责任公司数字图书专有格式,超星宣称拥有全国最大的图书数字化加工中心,是全世界最大的中文电子图书网站,相当于中国的“百万书籍计划”。源生浏览器:超星阅读器(SSReader)
WDL格式是北京华康信息技术有限公司开发研制的一种电子读物文件格式。目前国内很多大型电子出版物都使用这种格式。国内有些图书馆藏书也用该文件格式储存。源生浏览器:DynaDoc Reader
互联网数字图书
虽然存在版权及赢利等障碍,Google图书搜索和互联网档案扫描项目仍旧得到发展。这些资源大多采用PDF通用格式发布。
第三方通用浏览器
UnicornViewer是一款针对扫描版电子文档的浏览器,本意是为大多数PDG、多页TIFF开发的,但也是支持以上所有格式的轻便浏览器。