档案数字化加工六大核心步骤
要实现档案数字化加工,提高查询效率,实现信息共享,离不开六个核心步骤:
1、整理档案。
当档案工作者拿到档案后,首先要把档案归类,即:统一编号归档、核对页码、撕开粘页、书写错误的复号、拆掉可拆的,以便在扫描时批量处理。
若发现影响后期扫描质量的文件皱褶不均匀,应作相应的处理;若文件损坏,应先进行技术修补和标记;若文件严重损坏,扫描无法修复,则应区分标签。
2、著录标引。
按照标准《归档记录规范》和用户档案记录的具体要求,将原始数据和文件目录资料及主题资料纳入软件数据库。在对档案中原有实体档案条目进行修改、补充时,应在填写变更信息并将其归档。如果产品目录不完整,请补充完整。
3、扫描档案。
文档扫描是实现纸质文件数字化转换的重要环节。原始文件的扫描、存档格式应完全按照档案管理统一标准进行扫描扫描,登记实际扫描卷数和每卷页数。
4、图像的检查和处理。
在扫描结束后,要逐个检查图像的质量,包括图像的顺序是否与原文件一致,漏扫、重张。有无黑边、折角、图象偏差、清晰度、失真等。如发现有不符合图像质量要求,应及时进行校正,以保证图像顺序正确,质量完美。
5、OCR全文识别。
如果专案需要全文检索,扫描图像处理完成后,需要用专业识别软件对数字图像进行全文OCR。若使用者对识别成功率有严格的要求,就需要手工检查。标定之后,可以还原版式并转换为双层PDF文件格式,实现无障碍全文检索。
6、数据挂接。
在系统软件的帮助下,将数据库中的目录数据与纸质文件数字图像相匹配挂接,对挂接结果进行逐个检查,包括挂接数字图像与纸质文件数字图像对应的准确性、挂接数字图像与实际扫描数量的一致性、数字图像能否正常打开等。达到了目录数据和数字图像的精确关联。挂到档案管理系统后,成品再进行一次验收,提交交还和数据备份。