期刊数字化加工介绍
随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、各类数据库、网络资源、电子杂志、电子图书等新型数字化信息资源的建设。在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化,使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字图书馆供用户使用。
以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。
因此,将图书、期刊、报纸、文档资料等信息资源通过扫描仪,扫描成图像文件,再通过OCR识别成文字,建立目录和全文索引,制作成电子文件,然后用软件进行管理使用,已是当务之急。
东方明德资料数字化解决方案,拟在以东方明德人多年来在图书、报纸、期刊、杂志和档案方面的专业的数字化销售、服务、实施经验,帮助用户建立自己的数字化流水线加工工厂,高效、高质量的实现电子资料的加工,或者利用东方明德的加工工厂为客户提供数字化加工服务。
期刊扫描加工
数字化正在取代纸质本,成为学术期刊传播的主要甚至是唯一渠道。
大型期刊数据库给学术传播带来的最大变化是读者(学者)阅读学术文献的习惯发生了彻底改变:由读纸本的期刊变为读数据库。
这一变化给以传统纸本期刊的影响是致命的:社科期刊这一独立存在的个体已迷失在网络的海洋之中。从传播效果看,读者乐意为这样的数据库而改变自己的阅读方式。
随着期刊数据库的风行,期刊纸本的发行量直线下降,且无可挽回。
与数字化传播相对应,数字化的期刊体系应该具备下列特征:
1)更为开放的公共学术平台。
2)大量学术信息的聚合。
3)学科或问题边界清晰、更加灵活组合的个性化多样性形式。
期刊数字化加工流程
1.图像扫描:
按照客户要对期刊进行扫描。采用高速扫描仪或零边距平板扫描仪进行扫描,生成TIFF、JPG、PDF等图像文件。
2.图像处理:
对扫描后的图像进行处理,包括去黑边、纠偏、去污渍、版心居中、二值化等,有利于提高文字的识别率。
3.文字识别:
东方明德采用国际领先的OCR识别技术,既可以识别常见的简体汉字、繁体汉字、英文,也可以识别日文、韩文、俄文、德文、法文等190多种文字,准确率99.5%以上。
4.格式转换:
格式转换是将其他格式的文件转换为双层PDF。文件格式可以是电子文档,如DOC、S2、S72、PS、WPS等多种文件格式;也可以是经过整理顺序模块整理成册的纸张扫描文件。
5.资源加工:
对文档的元数据进行标引;制作文档目录;在PDF中制作文档内链接;对元数据标引、分类、目录制作等。
6.数据提交:
将制作好的数据安全提交给客户,可刻录光盘,挂接网络等。