档案大数据是在大数据背景下衍生出的一个概念,一般可以理解为数据符合档案特别是电子档案的的特点,如信息的非人工识读性、信息存储的高密度性信息与载体之间的可分离性、多种信息媒体的继承性。
同时又具备大数据具有的海量、多样、高速、价值的4个特点,符合这些特征的档案数据既可以理解为档案大数据。档案大数据存在的意义也同时符合档案利用体系、资源体系、安全体系建设的要求,是档案行业发展到一定程度,特别是在大数据技术日益成熟的当下发展产生的。
而智慧型档案的概念来自于智慧档案馆,它们所聚焦的都是数据的智能分析和主动推送,同时是大数据预测的一种表现,是档案大数据在深度分析挖掘后的科学结论。智慧档案是在数字档案基础上发展起来的,是数字档案未来的发展方向,要想达到智慧档案的标准,那就必须将大数据的概念引入到数字档案的管理方式上来,并且将智能化数据分析引入到与数字档案相关的网络建设、资源管理、建筑设施、服务创新等方面,加强大数据与智慧档案的融合,同时要注意两方面的建设。
档案大数据信息的挖掘有利于提高档案信息知识转化能力。档案是人类社会的汇聚和传播的重要场所。帮助利用者运用前人经验解决新问题,必须依靠档案数据所提供的知识服务。大数据与云计算的应用可以提供一种基于“数据仓库”的,能够对档案数据进行搜寻、组织、分析、重组的数据利用方式 ,形成实用性的信息合品有效支持档案利用者知识创新,并将知识转化为生产力服务。同时通过对特定罗据内容的加工、分析、挖掘,形成专业的知识产品,为政府、决策提供智力支持和科研信息素材。
在智慧档案馆的资源建设方面,有利于推动智慧档案馆信息资源建设。档案大数据信息挖能够发现馆藏资源的缺漏,有针对性地补充和丰富档案信息资源或其他文献资料;分析档案资源的利用率,通过对用户每次利用的档案信息进行关联分析,挖掘各类档案信息之间的关联规则和比例关系,进一步优化馆藏:利用路径分析模式挖掘捕捉用户频繁浏览访问的路径,改进数字档案馆站点结构设计。
除此之外稳定安全的“数据仓库”也是大数据档案信息挖掘的重要组成部分。档案工作者可以运用关联、分类、聚类等方法,打破原有的档案整理体系,从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组,构建特色档案信息库及各类专题档案信息库。可以为数字档案起到强力的助推作用。
文章参考国家档案局官网科技成果文章,原文名《大数据时代”环境下数字档案信息挖掘与传播实践之一 》如有侵权请联系随时进行删除,原文链接如下:https://www.saac.gov.cn/daj/kjcgtg/201908/db1bbfad54d841eaaa7e890b75faa733/files/5e6293975c084eaf8a97809d8ebea6aa.pdf