档案扫描是档案数字化加工重要的一部分,档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。扫描的工作人员需要掌握一定的操作技术和方法,充分掌握合格图像的标准要求。
1.扫描设备
1.1扫描设备的选择应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。
1.2超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标板等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的三分之一。
1.3 对于极其珍贵且尺寸不规则的档案,为方便直观显示原件大小,可采用标板、标尺等方式标识原件大小等信息。
1.4 应遵循相关设备的使用规律进行定期维护、保养。
2.扫描色彩模式
2.1 为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。
2.2页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。
2.3页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。
2.4 页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。
3.扫描分辨率
3.1 扫描分辨率的选择,应保证扫描后图像清晰、完整,并综合考虑数字图像后期利用方式等因素。
3.2 扫描分辨率应不小于 200 dpi。如文字偏小,密集、清晰度较差时,建议扫描分辨案不小于300 dpi。
3.3 如有计算机输出缩微摄影、仿真复制、印刷出版等其他用途时,可根据需要调整扫描分辨率。需要进行输出的档案,扫描分辨率建议不小于 300 dpi:需要进行高精度仿真复制的档案扫描分辨率建议不小于 600 dpi;需要进行印刷出版的档案,可结合档案幅面、印刷出版幅面、印刷精度要求等选择合适的分辨离。
4.存储格式
4.1 纸质档案数字图像长期保存格式为 TIFF、JPEG 或JPEG2000 等通用格式,图像压缩率的选择可根据实际应用的需求而定。
4.2 纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为 OFD、PIDF 等其他格式。
4.3 同一批档案应采用相同的存储格式。
5.图像命名
5.1 应以档号为基础对数字图像命名。图像命名方式的选择应确保图像命名的唯一性。
5.2建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。
数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。
5.3应科学建立纸质档案数字图像的存储路径,确保数据挂接的准确性。
6.裁边
如需对数字图像进行裁边处理,应在距页边最外延至少 2 mm~3 mm 处裁剪图像
7.去污
如需对数字图像进行去污处理,以去除在扫描过程中产生的污点、污线、黑边等影响图像质量的杂质,应遵循展现档案原貌的原则,处理过程中不得去除档案页面原有的纸张褪变斑点、水遗、污点、装订孔等痕迹。
8.图像质量检查
8.1 数字图像不完整、无法清晰识别或图像失真度较大时,应重新扫描
8.2 对于漏扫、重扫、多扫等情况,应及时改正。
8.3 数字图像的排列顺序与档案原件不一致时,应及时进行调整。
8.4 对数字图像拼接、旋转及纠偏、裁边、去污等处理情况进行检查,发现不符合图像质量要求时应重新进行图像处理。
9.数据挂接
9.1 应借助相关软件对数据库中的目录数据和与其对应的纸质档案数字图像进行挂接,以实现目录数据与数字图像的关联。
9.2 逐条对挂接结果进行检查,包括目录数据与纸质档案数字图像对应的准确性、已挂接数字图像与实际扫描数量的一致性、数字图像是否能正常打开等,发现错误及时进行纠正。
文章参考国家档案局官网,原文章:《纸质档案数字化规范DA/T 31-2017》如有侵权请联系随时进行删除,原文链接如下:https://www.saac.gov.cn/daj/hybz/201806/496cc2b091344843b5b388b744818c65/files/fa10b12908dc47c3b7ccc3aaab746625.pdf