基于深度学习的档案开放智能辅助鉴定系统

- Open Intelligent Assistant Appraisal System for Archives Based -

大幅度提升鉴定效率和正确率,助力档案馆高效、低成本完成馆藏档案对外开放利用。

档案开放鉴定的现状:

01 开放程度低

· 到年限的档案鉴定不及时,大量档案都还未做到鉴定工作。

02 工作水平低

· 到年限的档案鉴定不及时,大量档案都还未做到鉴定工作,档案开放鉴定工作人员数量与业务素质不足,难以胜任政策性、专业性极

03 理念滞后

· “重保管轻利用,重保密轻开放”的思想仍存在于我国档案系统,档案开放鉴定工作也因此侧重于馆藏档案。

档案开放鉴定面临的难题:

01 档案开放鉴定工作

曾广泛采用人力外包、关键词库辅助开放审核等方式,这些都有其难以适应现状的缺陷。

02 开放审核工作

人力外包,鉴定效率、正确率取决于人工经验,难以及时应对理解规则的变换,且多需档案馆 提供独立保密场所作为办公地。

03 基于关键词NLP技术

因“有词无义”导致的误判和“有义无词”导致的漏判常致使结果失真,实际应用效果不佳,也无法满足准确、迅速、高效辅助分析、判断文本

档案开放鉴定的原则遵循

01 安全原则

开放档案既要依法有效保护档案实体不受损毁,又要维护国家和社会的利益不受损害, 即实体安全和政治安全。

02 服务原则

应最大限度满足社会对馆藏档案的利用需求。

03 保护原则

开放档案不得违反国家有关知识产权保护的法律规定,不得有损公民声誉和合法权益。

基于深度学习,档案数据挖掘技术的应用,推进档案划控鉴定工作的智能化。各级综合档案馆可以根据不同历史时期档案形成的历史背景,将涉密、涉政治事件、涉案、涉军、涉外、涉宗教、涉民族、涉边界.涉人事、涉诉讼、涉处分等问题的内容进行主题分析,提炼敏感词,积累生成敏感词库。开发应用基于深度学习的档案开放智能辅助鉴定系统,以提高档案开放鉴定工作的效率和质量。

针对文书档案、声像档案、专业档案等档案门类进行智能辅助鉴定,基于深度学习和数据分析技术,对档案原文数据进行文本分析,提取与对应鉴定标识属性强关联的词生成智能词库。且支持相关档案门类鉴定词库的自定义维护。档案原文属文本类档案可根据档案目录数据及原文数据进行全文关键词匹配提示,完成辅助“开放”、“公开”、“控制”等的智能划控鉴定。声像类档案中,图像类档案通过OCR识别引擎进行档案数据化处理,音视频类档案通过音视频数据化转译系统进行档案数据化处理,并根据关键词对声像档案数据化副本进行比对完成智能辅助开放鉴定。方便快捷的为档案开放鉴定给出相关建议值。档案管理员只需要在档案归档前维护好相关词库,保存档案时系统会默认给出提示,且支持相关数据值的修改。

档案开放智能辅助鉴定原理图:

01 智能鉴定

基于不可开放鉴定数据和利用机器学习技术,智能判断和鉴定不可开放的档案。

02 开放审批

提供开放审批功能,支持多级审批。

03 延期开放

支持申请延期开放,选择延期理由,人工辅助以提升档案鉴定准确性。

系统特点: