云讯数字档案馆智能平台通过信创认证,进驻粤复用 ( 信息技术创新应用综合网 )
发布时间:2024-02-28 16:24:19    发布者: 广东云讯

           采用“AI+档案”,采用微服务和云架构技术,构建基于三网(档案局域网、政务网、互联网)的数字档案馆智能平台,具有OCR文字识别、智能分词和全文检索、人脸检索和汇聚等功能的同时,满足国家档案相关标准和测试办法的要求,形成档案信息强关联、可共享的机制,充分利用档案大数据技术,开创多方式、多渠道的档案利用,形成主动用档、智能用档。推动馆藏档案资源数字化、增量档案电子化,逐步实现对数字档案信息资源的网络化管理以及分层次多渠道提供档案信息资源利用和社会共享服务。

产品简介

一、总体架构

运用理念一致、功能协调、结构统一、资源共享、部件标准化等系统论的方法,从全局视觉出发,以“档案云”的设计框架,各方面、各层次(SaaS应用模式、PaaS集成模式、IaaS支撑模式、DaaS数据模式)、各要素进行统筹规划、顶层设计,以集中有效资源,高效快捷地实现项目的设计目标。

档案信息化云平台集成总线服务、智能服务平台和档案业务应用系统为平台建设的重点,采用超融合和容器云技术,为档案馆信息化平台的建设提供基础架构和数据支撑、基础数据整合、资源服务应用等能力,并将各类应用,以容器云的进行应用部署统一,应用发布统一,在容器云的基础架构下,形成数字档案馆的门户系统、数字档案管理系统、实体档案管理系统、档案查阅应用系统、档案征集系统、档案业务指导系统等业务内容。同时,严格贯彻安全管理体系、运维管理体系和综合管理平台的系统接口的标准规范进行建设,总体架构如下图所示。

图片1.png 

二、应用框架

根据国家档案局发布的《档案信息系统安全等级保护定级工作指南》,对档案信息系统类型的划分做了明确规定,不同类型的信息需要部署在不同的网络环境下。本系统部署在局域网、政务网和互联网三个网络中,分别向相应用的用户对象提供相关的档案服务。

图片2.png 

(1)政务网馆室一体化平台

政务网馆室一体化平台是县数字档案馆连接各立档(移交)单位数字档案室的主干平台,依托全县、镇(办)政务外网纵横向网络连通体系和县电子政务云数据中心等政务外网公共基础设施,实现县档案信息资源共享和资政服务。一是利用云计算等先进技术为县各立档(移交)单位提供统一应用软件服务和存储服务,二是承担县立档(移交)单位电子档案向县档案馆在线报送、移交,三是承载县档案局(馆)内部管理,为政务外网用户提供在线档案查阅利用、档案业务指导或其他档案工作服务。

2)局域网馆藏档案综合管理平台

局域网档案综合管理平台是县数字档案馆建设的核心基础平台。一方面依托其作为档案业务管理部门的性质,设置档案资源总库,对内承担实体档案和电子档案的接收、转码、管理、保存、开发利用和馆藏档案数字化加工、智能馆库电子档案和实体档案一体化管理等工作;另一方面向到馆利用者提供内控档案的检索和查阅利用,同时通过基于物理隔离的跨网传输设备接受 政务网馆室一体化中个立档单位在线移交的电子档案,补充和丰富馆藏档案。

3)互联网公众服务平台

互联网公众服务平台是县档案馆和各立档单位的数字档案室实现公共档案服务和档案信息资源社会共享的有效途径之一,它依托县电子政务外网-互联网安全服务区建立档案信息服务门户、微信号等多种形式,一是建立满足公众查阅档案需求的利用窗口,二是采集具有重要保存价值的各类数字信息,进行资源整合,实现公众档案信息资源的社会最广泛共享,三是实现馆际档案信息交流。

三、业务功能

(1)业务流程

图片3.png 

(2)功能模块

图片4.png 

四、技术特点

图片5.png五、应用亮点

(一)信创+档案

经过兼容性功能测试、性能测试、安全测试,“数字档案馆”满足测试要求,能够实现信创适配,包括但不限于以下信创产品中的一种组合(芯片+操作系统+中间件+数据库):麒麟V10操作系统,统信操作系统,飞腾F2000,龙芯3B4000,3C5000L,鲲鹏等CPU,达梦、人大金仓、海量数据库产品,东方通、宝兰德中间件等。

图片6.png 

(二)AI+档案

人脸识别与汇聚

将提取的人脸图像的特征数据与数据库中存储的特征模板进行搜索匹配,通过设定一个阈值,当相似度超过这一阈值,则把匹配得到的结果输出。

 

OCR文字识别

OCR文字识别是指通过对图片(扫描或拍摄生成的电子文件)中的文字进行识别,将图形翻译成文字和及版面信息的过程。对于档案数字化加工系统,使用OCR识别组件,能够轻松的帮助用户完成创新著录标引、提取档案原文等,主要功能包括影像输入、前期处理、OCR识别参数设置、档案原文提取、比对识别与人工校正、输出保存和目录标引创建等功能。

 

图片7(1).png

智能词和全文检索

智能分词和全文检索,对用户输入的检索词汇进行智能分词,而对分好的关键词组合进行全文检索。全文检索支持对档案进行文本检索和图片检索。

图片8(1).png 

元数据自动提取

各类型档案元数据的自定义和固有元数据的自动提取。例如,系统能够自动捕获声像档案元数据,并可将元数据信息添加进JPG格式照片的IPTC信息中,其他格式的声像档案在后台随元数据的录入自动生成一个TXT格式的文本文件。可著录元数据信息包括:编号、组标题、全宗号、部门、时间、拍摄者等。

图片9(1).png开放鉴定智能辅助判断

针对文书档案、声像档案及专业档案等档案门类进行智能辅助划控,通过大数据分析及文本分析技术,对档案原文数据进行文本分析,提取与对应划控标识属性与主题词库关联分析。进行关键词匹配提示,完成辅助“开放”、“公开”、“控制”等的智能划控辅助。

图片11(1).png

(三)大数据+档案

自定义报表、自定义各种数据可视化图表。

图片12.png

 

一人一档、一事一档。档案具有天然的大数据属性,是数字政府重要的一个数据存储池,结合人工智能技术,智能汇聚一人一档、一事一档、一企一档,形成主动用档、智能用档的模式,为政务辅助决策服务。

图片13.png图片14.png

 

 

决策和场景还原。从资源数据化走向数据场景化、场景网络化,采用大数据技术、人工智能技术,全方位、多维度、多媒体、交互式地真实再现档案原貌,用档案原汁原味的展示方式,让人们了解历史文脉、城区风貌、重要事件等内容。