纸质档案数字化加工方式

2024-08-26

34
0

纸质档案的数字化加工方式主要有直接扫描法和缩微转化法两种。

直接扫描法

所谓直接扫描法,是采用扫描仪对纸质档案原件进行光学扫描,将图像信息传送到光电转换器中变为模拟电信号,又将模拟电信号转变为数字电信号,再通过计算机接口传输至计算机存储器中。

直接扫描分为两种方式:

(1)扫描纸质档案后再运用字符识别(OCR)软件进行识别,最终生成文本文件。

这种数字化文件的优点是:占据的空间小,便于计算机全文检索,便于档案利用时进行摘录和编辑。

其缺点是:不能保持档案原件的排版格式,以及签名印章等原始信息;有时OCR字符识别的准确率较低,核对修改较为困难,数字化效率很低,且实际上已经破坏了档案原稿的真实性。

(2)扫描纸质档案后形成数字图像文件。

这种图像文件的优点是:能保持档案的内容和排版的原貌,数字化速度快。

缺点是:不能进行全文检索,不能编辑文字内容,且占据存储空间大。

以上两种方法的优缺点正好互补,现在有一种方法能将两者的优点融合在一个档案中,即制作双层PDF。其制作方法是:将纸质档案原件扫描成数字化图像文件后再转换成文本文件,然后将这两个内容一样的文件置入同一个 PDF 文件将图像文件置于文本文件的上层,图像文件下层隐藏文本文件。查询该文件时我们既能看到上层保持原貌的图像文件,同时也能对隐藏的文本文件进行全文检索。

缩微转换法

所谓缩微转换法,是针对已经缩微复制的档案,采用专用扫描设备(即缩微胶片扫描仪)将缩微胶片上的模拟影像转换成数字影像的方法。

与直接扫描法相比,缩微扫描法更经济、简便、高效。然而这种方法必须建立在已经对纸质档案进行缩微加工的基础上。

值得注意的是,在对缩微胶片进行扫描加工后,原缩微胶片应与纸质档案并保存,不能擅自销毁。由此,该档案形成“三套制”保存状态。虽然缩微胶片不如数字化档案容易保存、复制、查询、传播,但是作为模拟信息,缩微档案具有人工可读、稳定性好等数字化档案不具备的优势,又具有体积小等纸质档案不具备的优势,应当成为档案信息资源的重要补充形式。

文章来源:《档案信息化建设》