本次项目是2024年全国智慧图书馆体系建设项目之一,围绕云南省珍贵古籍70000筒子叶进行数字化和知识标引。需要依据国家图书馆制定的统一标准,对古籍原件开展数字化采集、古籍文献登记、古籍基本元数据著录、古籍结构数据标引、古籍篇目数据标引、古籍全文文本转化、纯文本文件XML封装以及规范提供TIFF、双层PDF、TXT等格式,项目成果提交国家图书馆外需搭建古籍数字化应用平台,同时向下兼容现有平台数据并能正常对外发布使用。
须按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)为标准。数据图像、喷刷及装订的珍贵古籍仿真制作质量应符合国家相关标准《古籍数字化工作手册》(2014年修订本)、《印刷产品质量评价和分等导则》(CY/T2-1999)、《喷墨墨水用水性染料技术条件》(QB/T 4974-2016)、《地理标志产品 宣纸》(GB/T18739-2008)所规定的要求。
(一)服务清单
序号 |
标的名称 |
服务内容 |
数量 |
计量单位 |
是否进口 |
1 |
古籍数字化和知识标引项目 |
为云南省图书馆开展馆藏珍贵古籍数字化和知识标引服务 |
70000 |
筒子叶 |
否 |
(二)完成云南省珍贵古籍70000筒子叶数字化和知识标引任务,项目成果提交国家图书馆后,搭建古籍数字化应用平台,同时向下兼容现有平台数据并能正常对外发布使用。
(三)须对部分古籍制作高仿真复制件,每部古籍一式三份,数量为130册,仿真复制需包括原材料采购、喷印、装订、装具、包装、运输、售后等。
(四)项目完成时限:自合同签定之日起270个日历日内
(五)服务地点:采购方指定地点。
古籍数字化和知识标引项目技术需求以国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)为标准。古籍仿真复制成品与原件高度接近;装帧齐整规范,能够运用于展览展示,能够用于对读者开放借阅;解决珍贵古籍文献藏用矛盾,促进中华优秀传统文化的传承与弘扬。主要包括:
(一)古籍数字化:采用非接触冷光光源专业古籍扫描仪采集数据图像、光学分辨率不低于600PDI、输出TIFF、PDF等格式,完成发布级数据图像校正、裁切、格式转换等处理,同时按照标准进行标尺管理、色彩管理及规范命名和存储。
(二)古籍标引著录:包括《古籍文献整理登记表》《古籍基本元数据著录》《古籍结构数据标引》《古籍卷目篇名数据标引》《古籍外字表标引》的规范著录与标引。
(三)古籍全文文本转换:古籍全文文本采用非结构化文本数据制作,由图像文件逐页进行文本转换,生成单版TXT文件,文件名与对应图像文件名一致。文本数据加工,保持文本源即原典文献,文献版面、文字与文本数据的内容一致,具备唯一标识符,著录标引信息准确,完整有序,各种各类数据无误,综合错误率不过千分之一。
(四)双层PDF输出:经过图像处理和OCR识别,采用图在文上的模式进行双层PDF输出。该文件是双层的,上层是原始图像,下层是识别结果。PDF文件的图像层包括古籍图书从封面到封底的所有叶。根据图像尺寸、颜色、数据存储量,按JPEG2000有损压缩,压缩因子适度动态调整,在确保图像清晰的情况下,尽量压缩图像文件所占空间至最小。PDF文件的文字层所使用的字体以“已嵌入子集”方式嵌入PDF文件。
(五)纯文本文件XML结构封装:纯本文XML由四部分组成,包括文件头、古籍基本元数据、结构数据、卷目篇名数据,使用fileHeader(文件头)、metadata(古籍基本元数据)、structure(结构数据)、catalog(卷目篇名数据)等标签。一部书有一个xml文件。
(六)搭建古籍数字化应用平台,开发相应功能模块,同时向下兼容现有平台数据并能正常对外发布使用。
(七)成果形式
1.XML文件:XML文件内容包括古籍基本元数据、结构数据、卷目篇名。
2.对象数据:长期保存级、发布服务级数据,包括:TIFF格式文件、PDF格式文件、TXT格式文件。
3.文献整理登记表和外字表:文献整理登记表和外字表用EXCEL表提交。
文献整理登记表内容包括:名录号、普查编号、索书号、题名、册数、总叶数、开本尺寸、透字、夹框、夹字、皱褶、残缺叶、重叶、签条、夹纸、登记人员(单位)、登记日期、备注。外字表的内容包括:加工记录标识号、内部序号、外字、描述、位置。
4.数据说明文件
项目各类数据的总体说明文件。用EXCEL表提交。总体说明文件内容包括:
项目建设年、单位名称、记录标识号、题名、TIFF格式文件数量、PDF格式文件数量、TXT格式文件数量、采集分辨率、备注(需要说明的事项)。
5.成果本地运用
项目成果需搭建古籍数字化应用平台,同时向下兼容现有平台数据并能正常对外发布使用。
1.古籍数字化设备要求
加工方必须使用非接触式高清冷光扫描仪,不低于24位彩色扫描,不低于600DPI×600DPI光学分辨率。并成交供应商提供扫描仪进行扫描加工。
(1)扫描幅面≥640mmx420mm;
(2)光学分辨率不低于600dpi*600dpi(真实光学分辨率);
(3)输出模式﹤36-bit(彩色)12-bit(灰度)1-bit(黑白);
(4)嵌入式图像增强处理,包括纠偏,曲线修正,指印消除,等色彩平衡、白平衡、曝光修正;
(5)图像格式:JPEG,非压缩TIFF,TIFFLZW,PNG,TIFFG4(黑白)、PDF、BMP等;
(6)具备实时预览功能,实现扫描文件的扫描效果实时监控,操作前可以看到扫描古籍具体情况,实现一次扫描成功,避免因调教设备而增加扫描次数,减少对古籍的多次伤害。
注:设备必须符合图书馆的主要参数要求,运送到馆后发现设备不符合图书馆要求,且不能及时更换设备者,云南省图书馆有权终止合同。
2.古籍数字化采集要求
以线装书为例,古籍页面可划分为筒子叶、半叶、双半叶等。古籍数字化采集时应根据古籍图书的装帧、版面等实际情况,选择叶面类型进行扫描。
一部古籍图书除封面和封底外,同一部古籍图像采集的页面类型应保持一致。
1)古籍数字图像长期保存级采集参数
以满足古籍数字图像长期保存要求为目的。长期保存级标准如下:
采集方式:古籍原件扫描(拍照)
色彩深度:RGB24位。
扫描分辨率:600DPI
保存格式:TIFF(LZW)
色彩再现:ICC配置文件
说明:若古籍的字体特别小,如小于4号字体,应提高采集分辨率。
2)古籍数字图像发布服务级加工参数
古籍数字图像发布服务级标准,用于中华古籍智慧化服务平台的资源服务。
其加工主要参数及要求如下:
色彩深度:RGB24位。
扫描分辨率:600DPI
保存格式:PDF
文件大小:500KB~1MB
说明:原有分辨率即本手册规定的长期保存级采集参数。通过JPEG2000图像压缩处理和OCR识别,并辅以校对生成。建议单个文件存储量不大于1MB。
1)采集环境
古籍数字化采集环境应注意防护光源,避免透光或反射光的影响。同时,注意光源的合理补充,避免出现图像色彩不均或局部阴影。
2)色卡与标尺管理要求
色卡包含标准色块和灰度色阶,有的还配有标尺。色卡尺寸不宜过大,以能与古籍拍摄在同一个画面当中为宜。
使用色卡时,操作人员应该戴手套以保护色卡的清洁度。色卡出现磨损、划伤或污染时应及时更换。
色卡(含标尺)应与每册古籍封面一同拍摄。色卡位置与古籍左侧书角对齐,距离封面左侧0.1~1厘米位置。如果色卡不含标尺,可以使用矩形直角尺作为标尺,标尺应表面平整、无变形,刻度清晰可读,不应有锈蚀、划伤、崩刃等缺陷,标尺的材质应避免接触光源后产生透光或反射光。拍摄时标尺应放置在距离封面上侧0.1厘米~1厘米,以尺端“0”刻度线作为测量基准,保持尺端与尺边垂直,不要歪斜。
色彩管理工作包括扫描拍照设备的色彩校准工作、色彩空间选择、扫描拍照设备的参数设置、数字化操作流程标准化,以及后期处理软件中的色彩管理、色彩校正、输出色彩转换等工作。此外,应定期评估和审查数字化流程中的色彩管理效果,根据实际情况进行优化和改进。通过对比扫描图像与古籍实物的色彩表现,找出色彩偏差的原因,并采取相应措施进行调整。
1.扫描后的图像清晰,数据文件叶码连续,没有重叶、缺叶,错叶、折叶等情况(原书缺叶、错叶除外)。补扫缺叶图像要与同册图像文件的大小尺寸一致,颜色接近。
2.按1:1比例扫描,图书叶面外围要求留白,宽度不超过1厘米;书叶间距不超过0.1厘米。
3.以原书的上边沿为基准,以中缝为中心线,保持原文献的天头、地脚的尺寸不变,左右两边的尺寸基本不变。图像倾斜角度不大于0.2度。
4.原件表面有其他粘贴物件时,先将原件与粘贴物(即粘贴物覆盖于文献)一起扫描,然后将粘贴物掀开,再次扫描原件。
5.古籍整理完毕后,需根据古籍实际透字状态添加衬纸。如需要衬纸的地方较多,必要时应分次添加衬纸。必须注意的是,加垫衬纸不应对古籍造成损坏。加垫衬纸前应先评估古籍的纸张厚度、纸张强度、折叶空隙等情况,选择适宜的村纸。如果不透字,无需添加衬纸。衬纸应保持整洁,出现污溃、褶皱时要及时更换。
6.分画幅扫描时,各扫描区域边缘必须留有2厘米(含)以上的重复扫描区。
7.采集图像完整清晰,无扭曲、变形现象发生。数字图像文件用图形图像类软件检查清晰度,确保图像不失真(图像放大至实际尺寸100%)
8.数字图像文件与古籍原件颜色不一致时,应对设备进行色彩校正,重新开展扫描或拍照工作。
1)长期保存级(A)处理内容及要求
古籍图像处理应在未改变原扫描或拍照的图像色彩位数、分辨率、像素、格式等情况下进行。
1.纠偏处理。对出现偏斜的图像进行纠偏处理,对方向不正确的图像进行旋转还原,以符合阅读习惯。
2.图像剪裁。只允许处理古籍背景纸与拍摄图书外边缘的空白处。古籍原书与背景纸外边缘距离0.5~1厘米。
3.不能进行锐化或者图像增强处理,不能更改图像的颜色,尽量减少对图像文件的后期处理。
2)发布服务级(D)处理内容及要求
1.格式转换。由长期保存级文件(A)转换为发布服务级(D)文件,即由无损TIFF格式按jpeg2000压缩方法,在评估文献的纸张颜色、文字大小、清晰度、排版方式等基础上,选择适宜的压缩因子,做有损压缩处理后转换为PDF格式文件。
2.图像切分。切分图像分辨率不做任何改变,以书脊中线为切分线,将原有的半叶处理为独立的页面。书脊右侧的半叶为页面A,书脊左侧的半叶为页面B。切分后,包含古籍版框和文字的图像信息应完整无损,并按命名规则对切分文件进行命名。
古籍封面文件处理。古籍封面的TIFF文件带有色卡和标尺。为保持全册古籍图像画面大小一致,须对封面PDF文件进行色卡和标尺的裁切处理,裁切后只保留古籍封面。
3.图像拼接。古籍超大幅面(如地图)分拍采集影像后,按需对古籍图像进行拼接处理,即对PDF格式文件做拼接处理。拼接时对图像分辨率不做任何改变,拼接后图像与古籍的原貌基本一致,无重影,拼接处无明显歪斜变形。按命名规则重新对拼接文件进行命名。
4.双层PDF输出。经过图像处理和OCR识别,采用图在文上的模式进行双层PDF输出。该文件是双层的,上层是原始图像,下层是识别结果。
PDF文件的图像层包括古籍图书从封面到封底的所有叶。根据图像尺寸、颜色、数据存储量,按JPEG2000有损压缩,压缩因子适度动态调整,在确保图像清晰的情况下,尽量压缩图像文件所占空间至最小。
PDF文件的文字层所使用的字体以“已嵌入子集”方式嵌入PDF文件。
PDF单个文件存储容量不超过1MB。
PDF文件格式编码为1.5版本以上,兼容Adobereader6.0及以上版本。
按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)中著录与标引要求为依据进行。分别著录与标引:
标引人员按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)要求,标引信息,客观真实反映文献原貌,准确记录文献状况、揭示古籍蕴含信息,各个数据对应关系。
注:标引过程中发现问题需双方及时协商,与云南省图书馆要求为最终标准,拒不改者,云南省图书馆有权终止合同。
文本转换质量按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)中文本转换要求为依据进行。
工作人员按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)要求,进行文本转换,客观真实反映文献原貌,准确记录文献状况、揭示古籍蕴含信息,文本数据的字符、符号等信息的综合错误率不超过1‰。
注:转换过程中发现问题需双方及时协商,与云南省图书馆要求为最终标准,拒不改者,云南省图书馆有权终止合同。
5.丛书和合函/合订处理
1)著录原则
古籍丛书著录一条古籍基本元数据。
2)著录项目
按《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)6.2.3著录项目古籍基本元数据《表5:古籍基本元数据著录项目列表》所列元素和元素修饰词著录。
1)著录原则
丛书的子目应先进行子目拆分。拆分后,每个子目著录一条古籍基本元数据。
丛书与子目之间通过元素“相关资源”的元素修饰词“丛书链接”或“子目链接”互相连接。
已单独流传、单独编目的丛书零种仅著录一条古籍基本元数据,并在元素“附注”的元素修饰词“丛书附注”项著录其所属的丛书题名。
2)著录项目
按《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)6.2.3著录项目古籍基本元数据《表5:古籍基本元数据著录项目列表》所列元素和元素修饰词著录。
1)著录原则
不同版本合函/合订的古籍在拆分版本前先著录一条合函合订的古籍基本元数据。元素“题名”按几种著作题名卷数的拼接方式著录。元素“版本”著录第一种著作的版本,其他著作版本信息著录在元素“附注”中。
合函/合订古籍按版本不同情况拆分后著录多条古籍基本元数据,即有几种版本就著录几条数据记录,并在元素“附注”的元素修饰词“合订附注”项著录合订情况。
不同版本古籍与合函/合订之间通过元素“相关资源”的元素修饰词“合订链接”字段互相连接。
2)著录项目
按《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)6.2.3著录项目古籍基本元数据《表5:古籍基本元数据著录项目列表》所列元素和元素修饰词著录。
古籍丛书按子目著录、合函合订按不同版本著录后,应继续进行对应PDF文件的拆分和组合整理。
1)每个子目有独立的加工记录标识号。
2)PDF文件拆分整理。
当多部子目出现在同一图书册次中,应将PDF文件拆分至相应的子目文件夹下。数据拆分后,每部子目为独立完整的一部图书。如果丛书子目实体有多册,则应建立多个册次文件目录,即每部子目PDF文件保存在多个册文件目录内。册次文件目录数量与图书子目实体册数相同。
3)PDF文件合并整理。
针对同一子目跨册和跨卷刊刻的情况,应将PDF文件合并到同一子目文件目录下。PDF文件合并后形成独立完整的一部图书。
4)合函合订按不同版本拆分后形成多部图书,应先给每部图书一个独立的加工记录标识号。PDF文件拆分、合并整理,与子目数据整理工作相同。
6.数据与图书安全要求
(1)数据安全要求
采用严格的用户权限控制以保证数据安全,在制作过程中,工作人员只能访问本岗位本任务必须的来源文件和数据库字段以及本人产生的结果文件,不得自带复制设备将数据拷贝、传出。
(2)图书安全要求
中标方不得私自增加采购方规定的喷印数量,未经采购方许可不得私自销售仿真制作的古籍文献。
7.质量要求
古籍数字化成果要确保古籍信息内容的完整和准确,即古籍数据著录字段完整,标引内容准确,图像文件与古籍原版信息、位置保持一致。
古籍数字化加工数据应采用全面检查方式,而非进行数据抽检,必要时应设立数据多检制度。检查范围包括各种类型数据质量和技术指标,并达到以下要求。
1)遵照XML1.0规范,使用UTF-8编码方式、Unicode5.0字符集。
2)著录信息应严格按照文献实际内容进行客观著录,标引词与标引对象文件应正确链接,确保实用性。卷目篇目层级正确,链接正确。文字错误率不超过0.3‰。
1)检查项目
1.将图像文件(各种格式)放大到1:1状态,逐叶检查清晰度、明亮度、色彩还原度,以及图像内容的完整性和准确性。检查事项包括但不限于图像透光、彩点、彩线、黑边、污点、歪斜、模糊(马赛克等);图像有压字、折角、异物、透字、漏字、夹框、夹字和图像倾斜、扭曲变形、图像裁切过度等情况。
2.图像文件有无缺叶、倒叶,文件命名漏号、重号、错号等不规范现象。
3.检查书叶图像的完整度。发现文件漏扫时应及时补扫并在正确位置插入图像文件。
4.检查图像叶码是否连续,不得跳叶。
5.加工数据以文献册次为单位,检查对应的各类标引数据是否齐全,链接准确。
6.检查扫描(拍照)图像的采集技术指标。
7.检查双层PDF文件的图像层和文字层的文字对位准确。
8.按照命名规则,检查目录、文件、数据库、文档、介质等名称是否正确。
9.检查各类说明、统计、验收等文档是否齐全。
10.确保所有文件保存位置正确,可以有效打开和显示。
2)质量标准
1.图像完整性100%正确。不能丢失、错位。
2.图像歪斜、压缩转换等综合错误率不超过1‰。
3.双层PDF文件的图像层和文字层的文字对位准确,反显区域与文字区域相差1毫米以内。
4.双层PDF文件与TXT文件的文字内容保持一致,文字错误率不超过1‰。
1)文本数据的文字、版式、符号、段落顺序等,其字符综合错误率不超过1‰。
2)文本数据文件与发布服务级PDF格式文件一一对应,叶面连续,不得跳号,不丢失文件。错误率为0。
数据命名按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)中数据命名要求为依据进行。
工作人员按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册(暂行)》要求,进行加工记录标识号命名、文件目录命名、文件命名、全文文本文件命名、XML文件命名,准确记录文献状况。
注:项目实施过程中发现问题需双方及时协商,与云南省图书馆要求为最终标准,拒不改者,云南省图书馆有权终止合同。
数据存储结构按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)中数据存储结构要求为依据进行。
工作人员按照国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)要求,进行元数据、对象数据、说明文件的存储,客观真实反映文献原貌,准确记录文献状况、揭示古籍蕴含信息。
注:项目实施过程中发现问题需双方及时协商,与云南省图书馆要求为最终标准,拒不改者,云南省图书馆有权终止合同。
1)XML文件
XML文件内容包括古籍基本元数据、结构数据、卷目篇名。
2)对象数据
长期保存级、发布服务级数据,包括:
TIFF格式文件
PDF格式文件
TXT格式文件
3)文献整理登记表和外字表
文献整理登记表和外字表用EXCEL表填写。
文献整理登记表内容包括:名录号、普查编号、索书号、题名、册数、总叶
数、开本尺寸、透字、夹框、夹字、皱折、缺残叶、重叶、签条、夹纸、登记人
员、登记日期、备注。
外字表的内容包括:加工记录标识号、内部序号、外字、描述、位置。
4)数据说明文件
项目各类数据的总体说明文件。用EXCEL表填写。
总体说明文件内容包括:
项目建设年、单位名称:
记录标识号、题名、TIFF格式文件数量、PDF格式文件数量、TXT格式文件数量、采集分辨率/拍照像素。
备注(需要特别说明事项)
1)送检数据有效,与《数据说明文件》内容和数量一致,不夹杂无关文件。
2)著录、标引文字、符号,标引位置等信息准确,综合错误率不超过0.3‰。
3)双层PDF、全文文本文件的内容编码、文字识别等,综合错误率不超过1‰。
4)数据的采集方式、技术指标、文件格式、文件命名、图像处理等综合错误率不超过1‰。
5)成果数据中古籍图像完整,无缺失;数据类型和文件结构符合规范要求,且无坏死文件、不携带病毒,错误率为0。
6)达到标准的数据视为合格,在规定错误率范围内检查出的数据问题由资源提交单位进行修正;超出错误率、未达到标准的数据由资源提交单位对全部数据进行整改、返工处理。
(3)成果提交要求
数据成果通过移动硬盘提交,一式叁份,包括TIFF(LZW)格式与双层PDF格式数据图像及全文TXT文件,不同格式文件分开存储。
(1)项目列表页面
1)具有新建项目菜单,可选择项目类型、状态,输入项目名称、项目负责人、任务量、开始结束时间、优先级等信息。
2)项目总览页面显示现在执行中的所有项目的基本信息,可显示项目实时进度情况。
(2)权限管理
1)具有账号角色权限分级,至少具备管理员、审核专家、项目成员三级角色权限。
2)对角色权限管理精确到按钮级别,针对不同的项目角色设置不同的权限。
3)管理员可对用户账号可进行新增、禁用、修改、查询操作,对已添加的成员点击角色设置,可设置该成员在项目中的角色,对应不同的项目权限。
(3)项目管理
1)可对项目成员进行管理,添加、删除项目成员,被添加为项目成员的用户登录后即可看到此项目。
2)维护项目中子任务信息,可以⼀次添加或删除多条。
(4)数据录入
1)著录人员可以通过系统动态配置符合标准要求的著录字段生成模板,通过模板著录书籍元数据,并保存到系统数据库。
2)根据标准进行命名规则设置,在服务器上建立对应的文件夹存放扫描完成的书影文件。
3)设置书影存放的位置,可以针对不同的古籍设置不同的文件存储路径。
4)书影上传完毕后,系统自动进行OCR识别,同时由项目成员进行人工校对。
(5)审核流程
每本古籍的所有信息(元数据著录信息、人工校对后的全文数据等相关信息)填写完成后由项目负责人提交到专家组审核,审核的过程中可以修改信息,但原始数据信息保留,同时每个审批过程中的修改均有保留原始痕迹,保证整个流程所有节点都可溯源。
(6)数据导出功能
所有审核通过的数据,可一键导出符合国家图书馆(国家古籍保护中心)关于《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》(暂行)要求的XML文件、PDF 格式文件、TXT 格式文件、EXCEL 表。
(7)其他技术要求
应采用Java开发语言作为主要的后端开发语言,前端界面的开发使用标准的 HTML 语言,支持 SQL Server、MySQL 或者 Oracle,金仓、达梦等主流数据库。
浏览器兼容IE9、10、11,Chrome,firefox等主流浏览器,操作系统兼容Ubantu、Linux、windows10、中标麒麟、银河麒麟、统信UOS等主流操作系统。
投标人应结合本项目特点,按照项目实施流程建立项目小组,小组人员构成合理。包括承担项目团队人员信息(包括项目负责人、项目工程师、项目测试人员、售后服务人员等)。要求配备不少于10人项目服务团队,项目团队成员应该具备相应的古籍数字化、古籍版本、古籍修复装订、纸张喷印等专业能力。
搭建古籍数字化应用平台,同时向下兼容现有平台数据并能正常对外发布使用。
对部分古籍制作高仿真复制件,每部古籍一式三份,数量为130册。
中标人在开始批量高仿真复制件制作前,须提供一份(1册,内容可节选)样品,待采购人确认后方可批量制作。
1.珍贵古籍仿真制作图文处理要求
数据图像处理是在不改变原扫描数据图像的色彩、分辨率、格式、压缩等情况下利用图形处理软件对数字图像进行裁剪、拼接、修复、调色等精加工处理,使其达到与原件一致的效果。
(1)色彩、图像校正
对珍贵古籍数据图像偏色、跳色、光斑、噪点等情况,颜色与原件不一致,对不一致色块进行调补,并生成ICC特性文件,让图像文件在传输、打印中保持色彩的准确。对出现偏斜的图像进行校正处理,对方向不正确的图像进行旋转还原,确保古籍图像端正美观,防止出现颠倒错乱;
(2)数据图像拼接
珍贵古籍在数据图像采集时不能进行拆解采集,完整的筒子叶被进行了两个单页采集,仿真制作必须对其进行图像拼接处理,拼接时版心题名、栏线、鱼尾等必须齐整,还原古籍原件的内容与样貌。将拼接后古籍数据图像进行等比例扩展,四边各扩展0.5CM,保证能够根据古籍原尺寸进行裁切装订。
2.珍贵古籍仿真制作技术要求
(1)纸张选择
珍贵古籍仿真制作可供选择的纸张种类繁多,不同种类的古籍在仿真制作时具体根据其纸质要求进行选择,确保古籍的形神一致。
当原件纸张有多种颜色时,需再根据古籍原件的具体情况,选择合适的输出用纸:若原件纸张由于酸化褪色发黄,且页面只有黑色的文字,可选择对应颜色的相似纸张;原稿纸张褪色发黄且页面印有其他颜色的字迹图画,或纸张颜色为红色、绿色等其他颜色,若再选择与底色接近的纸张,就会出现其字迹图画偏色的情况,故此要选择白色或尽量接近标准白度(如淡黄色)的输出用纸,将偏色程度降到最低。
根据原书书叶的纸质特性,选用质地相同、纤维成分相同或纤维特征相似的纸张进行仿真。珍贵古籍仿真制作用纸张,宣纸有红星、汪六吉、桃记等品牌;皮料纸有雁皮、构皮、楮皮、山桠皮、桑皮等;竹料纸有连史、毛边、玉扣、粉连、竹宣、元书等,需根据古籍原件纸质选用。
(2)图像输出要求
珍贵古籍数据图像的输出是仿真制作的关键,需选用适合的输出设备,把处理好的古籍数字图像输出成为新的纸本古籍,最大限度再现古籍原貌。
3.珍贵古籍仿真制作件的装订
(1)纸张剪裁和齐栏
根据古籍的天头、地角、板框的尺寸对书籍进行裁剪,根据版心及鱼尾的位置进行齐栏,保证书籍形制与原件相同。
(2)压平裁切
将齐栏的仿真古籍使用压书机压平,再打孔上纸捻,并把出血部分和毛边进行裁切,使仿真古籍开本大小与古籍原件一致。
(3)打孔订线
仿真制作古籍的装订按原书的装订方式进行装订,采用手工装订,装订线全部用古籍专用的丝线,细节处理力求完美。
(4)装具制作
古籍装订完成后根据每套书籍的特点进行配套的装具制作,使书籍在藏用过程中得到更好的保护。
云南省图书馆组织专家对提交的项目成果进行验收,针对数据准确性、结构合理性、内容完整性、文件可读性等方面,采取通检和抽样结合的检查方式进行数据验收工作。工作人员应依据提交数据的质量确定抽检样本数,由验收人员随机抽选。完成验收后,国家图书馆(国家古籍保护中心)提交数据验收报告,并交付项目单位。
(1)送检数据与《古籍数字资源提交单》的内容一致,各种格式数据和数据说明文件一一对应,不夹杂无关文件。
(2)各种标引、说明文件的文字、符号、版式、位置等信息准确,综合错误率不超过0.3‰。
(3)图像数据的扫描方式、扫描规格、文件格式、文件命名方式、图像处理、压缩方式等达到要求,综合错误率不超过1‰。
(4)全文文本文件的文件格式、文件命名方式、内容编码、文字识别等达到质量要求,综合错误率不超过1‰。
(5)成品数据中古籍图像完整无缺失,备份数量、保存硬盘命名、数据存放方式、数据内容等符合规范要求,且各类型保存介质内无坏死文件、不携带病毒,错误率为0。
(6)仿制古籍色彩高度接近古籍原件,成品色彩不出现偏色、跳色、光斑、噪点等情况。
(7)所仿制古籍纸张选用适当,材质、厚薄接近古籍原件纸张。
(8)仿制古籍装订按原件的装订方式进行,装订无颠倒、错页、漏页。
(9)装具制作必须根据仿制古籍开本大小进行订制,并确保质量上乘,外形美观。
(10)中标方的送验数据与仿制成品达到验收标准视为合格,在规定错误率范围内检查出的数据与成品问题由中标单位进行修正;超出错误率、未达到验收标准的数据由中标单位对全部提交数据与成品进行整改、重新数字化采集与仿真制作。
搭建古籍数字化应用平台,同时向下兼容现有平台数据并能正常对外发布使用。