加工级大中型应用
一. 现况分析
许多企事业单位在工作管理过程中形成许多不同的文件资料,作为文件资料主要组成部分的纸质资料,历史存留量大,且每年不断新增,如何对这些文档进行保存管理、分类归档和调阅查询再利用,这些已成为摆在人们面前的重要课题。让我们先总结探讨一下目前文档管理利用工作存在的问题:
1.文档资料查找困难:由于资料数量庞大,查阅人又往往不能准确提供文件具体内容,所以查找起来费时费力.
2. 文件种类的多样性, 各种文件都有自己的排版格式及索引项,无法采用一般系统去实现根据不同的索引项进行查询.
3. 办公自动化系统的要求:现在很多单位进行办公自动化建设,如何完善和丰富OA系统,使其真正成为包括各种重要信息的自动化系统,就必须考虑如何将纸张的资料和科技资料与OA系统结合,进行计算机管理和调阅。
4. 纸质文档存储空间不足:在我们接触的客户中就有纸质文档量很大,库房不足,但纸质文档又不能销毁的情况。因此,如何解决日益增长的纸质文档数量与储存空间不足的问题已经非常迫切。
5. 文件安全性问题:每份纸质文档都是珍贵的原始资料,特别是对于比较旧的资料,经常调阅会损伤原件,如果遇上自然或人为灾害(如水灾、火灾)将造成无法挽回的损失。
那么对于上面提到的问题,如何解决才能符合现代文档管理的要求呢?其实大家都有了一定的考虑——文档资料电子化,那么怎样将纸张档案变成电子文件呢?又怎样保存、怎样调阅呢?-----DMAS影像文档管理系统引入新一代的文件管理技术,建立原始文档的影像档案库,以达到加强原始文档的管理、提高管理效率、降低管理成本、实现资料的快速查询及共享的目的。
二、Captrue详细的技术方案设计
1.网络结构图
2.软件系统结构
软件系统结构如图所示:
3.软件系统的核心模块:
3.1扫描
扫描模块通过高速扫描仪让您可以把纸质文档转化成电子格式文件。并利用条形码,表格识别等多种技术对文档进行识别自动规划档;此模块拥有实现对实现对文档进行扫描后的合并及分离,实现多种方式的扫描如追加、替换、插入等多种扫描处理。把保存的数据送到[扫描QC]检验工序。
3.2扫描QC检验
扫描QC模块允许您对扫描模块所提交的文档进行质量控制。它防止出现将影像质量有问题的影像上传到系统,并保证系统中所存放的扫描影像文档的具备标准质量。
3.3一次索引录入
一次索引模块根据预先设定的索引模版的索引项进行索引值的逐项录入。 对于使扫描文档变成可供检索的方面,建立索引显然是必要的前提条件;一次索引人员根据系统管理员为每种文档类型(表格类型) 预先定义的索引字段及其在布局模版设置的索引位置进行对照录入。
3.4二次索引录入
二次索引模块跟一次索引处理的功能是一样的,都是根据预先设定的索引模版的索引项项进行索引值的逐项录入,二次索引录入人员完全看不到第一人录入的结果,两次索引录入操作是完全独立的,其录入的结果系统将会进行自动化匹配效验,同时其出现有索引项匹配不一致的文档的BATCH将提交至[索引效验] 检验工序。
3.5索引效验
索引效验实现对一次索引录入及二次索引录入出现有索引项匹配不一致的文档的BATCH进行最后确认。索引效验人员可以选择一次索引人或二次索引录入人员的结果作为正确的索引结果,或自行输入其正确结果,这样便可保证上传到系统的索引项取值的正确性;其操作也将是对索引人员工作统计管理。
3.6资料检索
本系统提供资料影像查询功能,使操作人员可以通过根据索引项或文档名称随时查找需要的影像数据,查询相应的影像文件;影像文件在查看时可以有放大、缩小、旋转、打印、EMAIL,可以实现对查询到的影像及索引资料进行导出。
3.7系统管理
系统管理拥有用户管理、工作流管理、模版管理、批次包管理、报表管理、条形码管理等子模块功能。
3.7.1用户管理:实现了为系统创建系统使用用户及为其分配功能模块,可以根据实际工作需要为其设置。
3.7.2工作流管理:为各种不同的文档设置其所需经过的处理流程(扫描、扫描QC、一次索引、二次索引、索引效验、索引检索、全文识别),标准必经流程是(扫描、一次索引),其它的工序系统管理可根据实际档案加工需要进行自行设置,实现了对加工流程灵活管理。
3.7.3模版管理:此模块还拥有以下核心子模块:
文档类型 字段模板 索引模板 布局模板
3.7.4批次包管理
系统采用“应用和批次”的先进文档管理概念,通过批次管理模块实时的对系统所处理的批次进行跟踪管理(如处理人、批次状态),对无用的批次包进行删除。
3.7.5报表管理
报表管理分为[应用日志] 、[管理日志]及[统计报表]。
3.7.6条形码管理
自行创建条形码并设置其采用的对应规则,条形码的规则可以进行灵活自行设定及组合;系统将在[扫描]模块将根据其设定的条形码进行自动归档及文档命名。
3.8自动制作索引
如果管理员已经为工作流程配置好自动制索引的功能,那么在操作员将批次包提交到QC模块处,根据文档对应的布局模板,自动制索引的操作就会自动或通过手动方式来启动运行。而在索引模板中进行自动制索引的操作完成后,您就可以看到相应文本框已填充好索引值。
3.9全文识别
当批次包提交或关闭后,可以进行全文识别的操作;系统会生成一个图像文件,并会依据配置文件所指定的文件夹里附带上一个包含了该文档的全文识别内容的文本文件。
4.系统特点
4.1强大灵活的建立索引功能
1) 系统可根据用户的需要,灵活地建立索引模板,来对各种格式的文件建立索引。
2) 对于标准格式的文件,其索引内容往往位于文件里固定的位置,当建立索引时,系统能把相应的区域放大,例如档案表需输入姓名索引时,文档中姓名区域会自动放大显示,以便用户准确的输入索引值,为用户提供更好的操作方式,也可以利用OCR和ICR技术实现自动索引。
3) 系统支持树状(多层次)的索引结构,使用户更准确地为文件添加索引。
4) 可根据索引字段实现对影像文档进行快速检索。
4.2支持对扫描进行文件归档,根据所设定的条形码规则实现重新分档、合并及文档命名。
4.3自动索引, 基于多个识别引擎的高效识别模式.
利用OCR(印刷体识别)和ICR(手写体识别)技术自动识别全文内容,用于全文搜索。目前支持英文、简/繁体中文、葡萄牙文和其它西欧语言。
4.4单机\网络化自由组合安装,可以将所有的模块安装在同一台电脑上,也可以在不同电脑选择安装不同的模块,实现了扫描、QC、索引录入、OCR索引自动化、查询、管理不同岗位的自由分配。
4.5容易安装和使用简单
操作接口容易使用,能在短时间内为用户创造效益。目前系统支持简繁体中文、英文。
4.6核心功能完全产品化,保证了系统的稳定性和用户应用软件的投资保护。
4.7开放性设计保证了根据用户的不同需求,实现方便、灵活的配置,并根据各行业的不同特点,进行了相应的功能增强。
4.8分布式扫描
用户可通过互联网把不同地方的工作站连接起来,大大方便了需一起处理的工序,如扫描等集中在同一地点进行,而另一些工序则可在其它地方进行。这样,一些人力要求较高的程序可在劳动成本相对比较低的地方进行,节省了人力开支。
4.9检查日志和统计信息
强大的操作日志管理,记录所有用户对系统的操作,进一步增强系统的安全性。统计信息则提供各岗位的工作量及出错率等信息。
5.硬件设备
5.1、输入设备
采用高、中速扫描仪,用于档案、文档等纸质文件的扫描。
5.2、输出设备
配置打印机,用于档案或文件等档案及目录的打印输出。
5.3、存储设备
5.3.1 PowerFile 光盘库
5.3.2 TaskMaster磁盘阵列
5.3.3 NAS 网络光盘
三、成功案例(部分)
上海邮政影像加工系统
内蒙科技大学
青岛国土资源局
广州市城市建设档案馆数字化工程
北京市城市建设档案馆数字化工程
上海中宏保险公司扫描系统
广州市城市建设档案馆档案管理
三峡工程文档扫描系统
北京宣武区公安分局户口文档影像管理系统
国家外交部影像文档项目
国家专利局档案数字化工程
广州市工商局及各分局五化项目文档数字化项目
广东省外事办办公系统数字化管理
北京国投集团数字化办公项目
国家电力信息中心影像文档处理项目
南宁市电力局影像文档处理中心
中国银行广东省分行本票管理影像处理项目
上海招商银行信用卡资料数字化管理
天津和平房管局图纸处理项目
|