为加强丽水市档案局(馆)的数字化建设工作,实现档案查阅利用的高效、便捷,现计划将馆藏全部文书档案进行数字化扫描加工,并导入丽水市档案局(馆)现有的数字档案馆系统管理应用平台运行。主要包括馆藏档案前处理、档案扫描、图像处理、图像存储、条目著录、数据挂接、OCR识别、数据上传、索引建立、RFID标签制作与粘贴、数据验收、数据提交,纸质档案数字化成果转胶片等工作。
(一).招标货物
1.本次档案数字化加工招标采用单价计价中标的方式,计划将7万页左右民国纸质档案和新接收5000卷左右的纸质档案进行前处理、数字化扫描加工、RFID标签制作粘贴、数字化成果转胶片。
2.最终用以结算项目总工程款项的数字化扫描加工的数据量按照工程结束验收后的实际数量来统计,统计方法须经双方确认。
(二).工程期限
自合同签订之日起2019年11月底前完成所有加工任务。如实际加工数量超过招标方预算的数量,则延长相应的工期时间。
交货期:根据项目实施计划表,签订合同1个月内,中标人根据招标文件和投标文件要求,制作分项样品,采购人完成分项样品验收,分项样品验收不合格的,采购人给予15个工作日的整改期;以后每3个月根据项目进度验收一次; 2019年11月25日前完成项目100%,并通过总验收。分项样品验收不合格有整改期的,交货时间可以顺延15个工作日。中期分项验收和总验收不合格的,整改超期时间,由中标人承担违约责任。
(三)、场地、软硬件设备和人员配备要求
1、数字化加工服务公司负责提供服务的内容
一是参加档案数字化工作的人员应具有档案数字化工作经验,人员数量应与工作总量和进度安排相适应,数字化加工服务现场还应配备3名以上技术服务人员,及时解决工作中可能出现的各种软硬件系统故障
二是自备数字化加工器材。
三是自备数字化加工软件的数字化加工成果检测软件、数字化加工安全管理软件。
2、丽水市档案局(馆)负责提供的内容
一是数字化加工场地,符合国家档案局规范要求。
二是提供RFID标签与设备。
三是监督中标单位的内部管理工作。
四是本项目使用的硬盘、光盘等存储介质和办公耗材。
五是数字化成果转胶片设备。
(四)、技术要求
1.档案前处理要求
1.1制订一整套拆卷——扫描——装卷——入库的解决方案。
1.2 根据《丽水市馆藏档案数字化前处理规则》,在市档案局工作人员指导下,对馆藏档案进行前处理。包括档案档号跳号、漏打页码、错打页码、装订质量不符合要求等情况的处理。
1.3严格执行原始档案的交接手续,使用双方项目确认的档案交接清单。
1.4按照扫描处理量明确交接周期和档案交接量。
1.5制订完善的管理体系保证在施工过程中档案不损失、不丢失。
1.6如果发现破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影像扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描,小于A4或16开的纸张要先粘贴到A4或16开纸上再扫描。发现破损严重的档案须立即报知丽水市档案局(馆)相关负责人。
1.7装订案卷应保证装订牢固,案卷整齐,圈内材料不松动、脱落,保持与原案卷一致。
2.档案扫描
2.1扫描方式:根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用专业数码平台进行扫描或者采用图像拼接方式处理。同一页面有两个以上文件,需分别扫描。
2.2纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2.3扫描色彩模式
扫描页面统一使用彩色扫描分辨率标准为300dpi。
2.4清晰度:扫描图像字迹清晰、颜色恰当,不宜过浅和过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原档案存在绣斑变质、颜色过浅或深浅不一致,也应保证扫描图像可读,扫描留下的墨迹宽度不得超过0.5厘米,并且指印和黑线不能覆盖或影响书本正文内容。
2.5 图像内容:扫描的页面内容居中显示,不可出现明显偏左或偏右的现象,正文内容、页眉、页脚、反面印章、附件、手写注释等信息完整;图像内容与书本面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。
2.6 扫描图像必须与经过前处理之后的原图页面一一对应,不得出现颠倒、缺页、重页或错页情况。
2.7扫描登记:认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
3、图像处理
3.1对图像片偏斜度、清晰度、失真度等进行检查,发现不符合图像质量要求时,应重新进行图像处理。发现文件漏扫时,应及时补扫并正确插入图像。发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
3.2纠偏:图像整体倾斜不得超过1度;不得出现图像的一部分倾斜或扭曲而影响阅读的现象。如果档案页面存在部分倾斜的,以页面中标题纠正为准。
3.3去污:应遵循在不改变档案记录信息的前提下,去除数字图像中影响可懂度的杂质,如黑点、黑边、黑线、圈划的标记等以提高图像的整洁度。对黑边的去除不得简单地运用裁边的方法进行。所有扫描留下的黑线、指印、阴影或污点都必须清除干净(在放大50%的情况下)。由于印刷质量或纸张质量等造成的页面上有零星的污点和反面倒映文字污点比较多,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但应尽量保证图像可读。
3.4图像拼接:对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
4、图像存储
4.1 压缩格式:黑白二值扫描形成文件以CCITT4组方式压缩。
4.2 A4幅面档案扫描形成文件不得大于100K;其它幅面档案扫描形成文件在保证影像质量的前提下,尽量缩小文件占用空间。
4.3存储格式:扫描形成文件以TIFF(G4)格式存储。同时转PDF格式。
4.4文件命名:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
4.4.1对立卷改革之前的纸质档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、页(张)号所组成,各字段间用“-”连接,即以xxxx-xxx-xxxxxx-xxx.PDF表示,同一档号两份扫描件的,第二份扫描件用xxxx-xxx-xxxxxx-xxx_(1).PDF表示。数据结构见下表:
字段名称 |
字段类型 |
字段长度 |
全宗号 |
字符 |
4 |
目录号 |
字符 |
3 |
案卷号 |
字符 |
6 |
页(张)号 |
字符 |
3 |
4.4.2立卷改革后形成的纸质档案的扫描,其图像文件命名由全宗号、年度、组织机构或问题、保管期限、档案室编件号等五部分组成,各字段间用“-”连接,即以xxxx-xxxx-xx-x-xxx.PDF表示,同一档号两份扫描件的,第二份扫描件用xxxx-xxxx-xx-x-xxx_(1).PDF表示。数据结构见下表:
字段名称 |
字段类型 |
字段长度 |
字段值 |
全宗号 |
字符 |
4 |
|
年度 |
字符 |
4 |
|
组织机构或问题 |
字符 |
4 |
|
保管期限 |
字符 |
1 |
1、2、3、4、5 |
档案室编件号 |
字符 |
5 |
|
全宗号用四位代码标识,其中第一位用汉语拼音字母标识全宗属性,建国后档案用“J”;后三位用阿拉伯数字标识某一属类全宗的顺序号。如“J002”表示建国后2号全宗。年度以四位阿拉伯数字标注公元纪年,如“2012”表示 2012年。组织机构或问题是指作为分类方案的组织机构或问题名称的规范化简称。用两到四位字母标识,可以用简称中的汉语拼音第一个字母表示,其中“ZZ”表示无该项内容。
保管期限用一位阿拉伯数字标识。其中,“1”表示短期、“2”表示长期、“3”表示永久、“4”表示30年,“5”表示10年。档案室编件号是归档文件的流水号,用5位阿拉伯数字标识,如“00034”表示第34个文件。
5.条目著录
5.1按照《浙江省综合档案馆电子目录数据库结构与交换格式》、《民国档案文件及目录数据采集操作办法》、《丽水市纸质档案数字化规范》、《丽水市档案局(馆)档案条目著录标准》以及相关的行业标准与规范进行著录,建立档案目录数据库,民国档案目录著入使用专用采集工具。发现档号有重复必须按相关规范进行修改,确保档号的唯一性。
5.2条目著录采用双机校对的著录方式,应开发相应的校对软件,对双机录入的数据实现机器校对、人工修改,保证目录数据库的正确性。
5.3如发现录入信息存在有分歧的地方,必须与丽水市档案局(馆)沟通确定。
5.4 立卷改革之后档案的条目必需包括本件档案盒号。
6.数据挂接
6.1可通过丽水市档案局(馆)现有的数字档案馆系统管理应用平台中的档案采集模块实现逐条或批量挂接。
6.2条目与对应影像文件挂接正确率要求达到100%。
6.3认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
7、RFID标签制作与粘贴
7.1 利用“丽水市数字档案馆系统,打印RFID标签,并粘贴到档案实体上。
7.2 立卷改革之前RFID标签粘贴到卷。
7.3立卷改革之后的RFID标签粘贴到盒和件。
8.安全保密要求
8.1建立并严格落实安全保密制度,保证档案资料的安全保密性,做到绝对不外泄任何信息。
8.2提供组成扫描加工服务中心的组织机构表(包括多少管理人员及多少操作人员等),所有管理人员及操作人员必须签订安全保密协议。
8.3所有进入加工场地的工作人员实行挂牌制度。杜绝工作人员对档案及档案信息的私自复制行为。
8.4加工的电脑和扫描仪与互联网物理隔离,用专用移动介质保存和转移数字化成果。电脑的无线网卡必须禁用,手机不能带入前处理和数字化加工场所。
8.5本项目制作的数字化产品的所有权归丽水市档案局(馆)所有。
8.6在未经丽水市档案局(馆)同意、授权的情况下,不得擅自将产品转让给第三方使用及用于样本展示,否则将承担一切经济和法律责任。
8.7进行数据移交时,工作站上的数据必须在丽水市档案局(馆)工作人员的现场监督下销毁,同时移交该批次数字化加工的监管记录。
8.8 馆藏档案数字化加工完成后,所有涉及数字化成品的存贮介质,不论其所有权归属,均移交市档案局(馆)封存。
9.全文识别(OCR)
9.1 1995年之后档案识别准确率要求达到90%以上。1995年之前档案文件所涉人名正确率90%以上。
9.2涉及人事等重要的全宗一律全文识别,人名识别率达到100%。
9.3 OCR识别的图像生成双层PDF格式保存,文本层在上,图像层在下。
10.数据验收
10.1加工单位必须建立严格的质量检测体系,对加工的数据进行自检,自检达标的数据才能递交丽水档案馆验收。
10.2目录数据验收:以全宗为单位,随机抽查5%的数据,对条目数量及其著录项目内容的准确性进行逐条检查。其中,档号的合格率要求达到100%,其他项目抽检合格率要求达到95%以上(含95%),民国档案目录需报省局目录数据中心验收合格。
10.3图像数据验收:以全宗为单位,随机抽查5%的条目数据相对应的图像数据,对图像数量及其图像内容的准确性进行检查。图像应符合本规范中所规定的分辨率、文件格式及色彩模式。图像文件的命名必须与条目档号相一致,一致率要100%;扫描图像完整性要求100%正确,完整性包括不准缺页、漏页。图像的倾斜度、清晰度、整洁度等技术指标,要求抽检合格率达到95%以上(含95%)。
10.4 OCR识别正确率,全宗内某一年度为单位,随机抽取20%页面,用计算机软件复制文本层进行比对。抽检合格率90%(含90%)。
11.数据备份提交
11.1除了将数据导入数据服务器之外,还需将数字化扫描加工的所有数据利用光盘刻录备份(刻录DVD)、备份到移动硬盘和服务器存储各一套,目录应与其相应的扫描档案保存在同一文件夹内。光盘表面标示光盘片编号及光盘内目录索引信息。
11.2备份数据也应进行检验,备份数据的检验内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。检测软件为省档案局发放的软件,检测对象为案卷目录、卷内目录、归档文件目录、TIFF格式影像件。
11.3 提供已进行数字化扫描加工档案的明细清单一份以及电子文件。
11.4完成所有数字化扫描加工任务,挂接到丽水市数字档案馆系统试运行一个月后,若未出现问题,由双方共同进行验收;若出现问题,试运行期将顺延一个月,并依此类推,直至运行正常。
12.售后服务
12.1 提供三年免费的质量保证期及售后服务,保修期满后,有义务向采购单位提供有偿的后续技术支持。
12.2保修期内服务方式一般采用现场维护,中标单位24小时热线响应,在接到电话要求后48小时之内到达维护地点,以保证数据的安全运行。特殊情况双方协商。
12.3保修期内如因丽水市丽水市档案局(馆)自身系统升级而需要进行档案扫描数据的迁移,需要配合系统开发商提供免费数据迁移服务。
12.4 保修期内为故障光盘提供免费补充刻录服务。
附件 1、丽水市档案局(馆)馆藏档案扫描补充标准
2、丽水市档案局(馆)馆藏档案目录著录标准
3、民国档案文件级目录数据采集操作办法
4、文件级目录数据结构表
1、本项目结算总额达到标的额度时,合同终止。
2、签订合同后5天内预付合同价的20%;合同签订后的第3个月根据进度表进行一次分项验收,并支付实际金额;合同履行到50%时,支付至合同价的75%;项目验收合格且由招标人确认实际数量后15天内支付至合同价的90%,质保期一年满后15天内根据保修情况支付余款。
3、实际加工数量超出招标文件规定的数量的,增加的数量按照工程结束验收后的实际数量来统计,该部分款项于验收合格且由招标人确认实际增加数量后15天内支付。
附件 1
丽水市档案局(馆)馆藏档案扫描补充标准
1、被确定扫描的全宗有正式文件和底稿的,扫描正式文件,其他不扫描;所有标密级的文件,不论是否解密,都不扫描。如果是具有国家秘密载体印制资质企业中标的,对涉密文件可以扫描,扫描设备和存储介质根据国家保密规定管理。
2、各部门、各乡镇全宗中保管期限为短期、10年的不扫描;
3、各全宗中,本单位形成的文件全部扫描,上级单位除与本全宗有直接关系的国家部委、省级业务部门来文,其他上级来文不扫描;同级来文只扫描与本部门相关的人事任免、职称职务、人事调动、工资管理、经费、业务商洽文件。下级来文只扫描重要信访件、领导批示批办件。
4、附着在文件上的处理单等小纸片不扫描,本全宗形成的会议记录不扫描(包括市委常委会会议记录、政府办公室会议记录、组织部部务会议记录等;
5、扩大会议记录、电话会议(汇报)记录的手写稿不扫描,打印稿要扫描;
6、必须按照案卷内标明的页码顺序进行扫描;
7、扫描影像以TIF格式保存,黑白二值,扫描分辨率不低于300dpi;图像与案卷目录、卷内目录进行数据挂接检测合格后,转PDF格式利用。
8、保证影像页面的端正,允许的倾斜度不得大于1°(以大标题为水平);
9、保证影像的干净,清除污点(做到放大50%看不到污点);
10、扫描参数以一份文件为单位进行设置,确保所有图像的清晰。
11、一卷案卷中有一份或多份涉密文件,在数字化加工前处理时,将该份文件抽出,另行装订存放,并在案卷目录或卷内目录中标注明确。
12、其他未尽事宜,见招标文件或向局方相关人员咨询,由双方协商决定。
附件 2
丽水市档案局(馆)馆藏档案条目著录标准
案卷级著录
一、档号著录:
1、由全宗号、目录号、案卷号、页(张)号所组成,各字段间用“-”连接,即以xxxx-xxx-xxxxxx-xxx.PDF表示,数据结构见下表:
字段名称 |
字段类型 |
字段长度 |
全宗号 |
字符 |
4 |
目录号 |
字符 |
3 |
案卷号 |
字符 |
6 |
页(张)号 |
字符 |
3 |
2、当案卷有之一、之二卷时,加();如123(2)表示123号卷的第二卷。
二、题名著录:
1、一般情况下,按照案卷封面进行著录。
2、当案卷题名不能揭示案卷内容或者过于冗长时,将案卷交于档案局人员重新拟写,把原题名修改好后再著录。
3、案卷题名由档案局人员修改后,著录时直接著录,不用()或者[]等表示。
三、文件起始时间、文件终止时间著录:
1、著录格式:199802,表示1998年2月。
2、文件时间不完整或部分时间字迹不清时,起码应考证出年份,其次考证出月。月考证不出,以“0”补之。考证不出准确年份,可著录大致年份。如50年代的,起始时间著录为“195001”;终止时间著录为“195912”。
四、责任者著录:
1、著录时必须著录全称或不发生误解的通用简称。(如“中国共产党丽水市委”可简写为“中共丽水市委”,但不可简写为“市委”)
2、文件有多名作者的,可同时著录两个责任者,多余用等字代替。
五、“控制符”著录:开放档案著录为*,控制档案不著录。
六、“卷内文件份数”、“页数”著录:统一用三位数字表示,不足三位加0。
七、档案馆代码著录:必须著录433150。
八、“保管期限”、“密级”著录:以档案原件标记为准,以卷内文件密级最高的文件作为该案卷的密集。
九、文字模糊不清难以辨认时,交由档案局人员辨认,最终确定不能辨认时,用“□”代替。文字不能用输入法输入时,能分开的,用分开的两个字代替(如“女当”代表一个字使用),又不能分开的,用“□”代替。
十、案卷级条目必须著录项每个字段都不能为空。
文件级著录
一、档号著录:
由全宗号、年度、组织机构或问题、保管期限、档案室编件号等五部分组成,各字段间用“-”连接,即以xxxx-xxxx-xx-x-xxx.PDF表示,遭遇一档号多份文件用xxxx-xxxx-xx-x-xxx_(1).PDF表示,数据结构见下表:
字段名称 |
字段类型 |
字段长度 |
字段值 |
全宗号 |
字符 |
4 |
|
年度 |
字符 |
4 |
|
组织机构或问题 |
字符 |
4 |
|
保管期限 |
字符 |
1 |
1、2、3、4、5 |
档案室编件号 |
字符 |
5 |
|
全宗号用四位代码标识,其中第一位用汉语拼音字母标识全宗属性,建国后档案用“J”;后三位用阿拉伯数字标识某一属类全宗的顺序号。如“J002”表示建国后2号全宗。年度以四位阿拉伯数字标注公元纪年,如“2012”表示 2012年。组织机构或问题是指作为分类方案的组织机构或问题名称的规范化简称。用两到四位字母标识,可以用简称中的汉语拼音第一个字母表示,其中“ZZ”表示无该项内容。
保管期限用一位阿拉伯数字标识。其中,“1”表示短期、“2”表示长期、“3”表示永久、“4”表示30年,“5”表示10年。档案室编件号是归档文件的流水号,用5位阿拉伯数字标识,如“00034”表示第34个文件。
二、正题名著录:
1、正题名著录需按照档案原件上题名进行,卷内目录仅供参考,不得照抄。
2、当正题名不能揭示文件内容时,其范围包括:协议(合同书)、报告(公告)、政府令(任免)、简报(政务信息)、会议记要(抄告单)、通告(通知)、提案(答复)、法院判决(裁决)书、调解书、信访件等相类似档案,著录必须采用概括全文基本内容的方法进行扩充,概括出 “时间、人物、地点、经过”四要素。格式为:原题名[扩充内容]。
因扫描图片不清晰难以进行全文识别以及手写稿档案条目的著录也需要扩充。
2、当扩充内容为结婚申请书的两个人名时,两个人名间用“与”。一条条目一份申请书。
说明:结婚申请书名字确认,先以身份证为准,再以手写稿为准,最后以章为准。
3、当一份文件后有相关文件时,题名著录格式为:第一份文件正题名+第二份文件正题名+……,依次类推。
相关文件有如下情况:
(1)文件后有明显“附”或“附件”字样的标题;
(2)文件附件后的附件内容;
(3)批复与申请;函与复函;批复与报告的题名都需要著录;
(4)转发文件后的被转发文件;
(5)其他相关文件;
4、如同时出现2和3两种情况,格式为:
第一份文件正题名[扩充内容] +第二份文件正题名[扩充内容],依次类推。
5、若发现卷内目录与实际档案原件目录不符合时,交由档案局人员处理。
6、文字模糊不清难以辨认时,交由档案局人员辨认,最终确定不能辨认时,用“□”代替。文字不能用输入法输入时,能分开的,用分开的两个字代替(如“女当”代表一个字使用),又不能分开的,用“□”代替。
对于特殊符号:(1)年代久远的文件正题名中“﹃﹄”符号,用双引号替换。
(2)正题名两个并列的单位,原文用空格分开,在著录时加顿号。
7、当著录迁移证等相类似档案时,除扩充著录人名外,还需要扩充著录迁出地及迁入地。一条条目对应一张迁移证。
8、著录基建基地申请表、自留山使用证、土地房产所有证存根、大地(大田)承包合同等相类似档案时,除扩充著录人名外,还需要扩充著录地名。
9、当著录干部调动介绍信、招工录用通知书等相类似档案时,除扩充著录人名外,还需要扩充著录所涉及到的工作单位名称。
10、标题或正文中涉及到人名,条目著录必须概括文件中重要人员的名字。例如:干部任免文件、职称评定、先进表彰、学生学籍档案等类似文件。责任者单位须输入文件涉及的所有姓名。表彰集体,依照处理个人名字的标准处理。
说明:(1)介绍信、干部调令等类似文件,一条条目一个人名。
(2)各级下发的文件,只著录与本地有关的人名,若不能确认是否属于本地,交由档案局人员确认,若还是不能确认,则著录。省下发文,本地为本市,市下发文,本地为本区。
(3)相关文件重复出现人名,只需著录一次,录入在最前面一份文件的后面。
(4)非责任者单位只需著录与本单位有关信息。若不能确认归属,全部著录。
(5)增加文件所涉人名著录项。
11、在著录山林承包责任制情况统计表时,需要扩充,例:[港和公社第二生产队张三、李四责任山]。
12、正题名中的繁体字需要简写,错别字需要更改。
13、政协提案、人大建议、信访档案:输入文件中所有姓名。如“关于城市建设的意见及市建设局的答复(张×、王×、应×)”。
14、正题名长度若超过字段最大长度限制需拆分为多条著录,依次顺延排序,并在原案卷目录中做记录。
15、统计年报档案:以事件(年度)为单位,一个事件(年度)输一条数据。
16、责任书需扩充录入甲乙双方。
17、机构变动、基建项目:责任者单位输入文件中所有建设单位和基建项目名称,非责任者单位输入与本单位有关信息。如“关于×等基建项目的批复(丽水市×公司×项目、丽水市×公司×项目、丽水市×厂×项目)”。
18、简报、统战工作等类似文件,题目扩充如:简报第*期[扩充标题]
三、文号编号著录:
1、多个文件编号著录时,用“;”隔开。
2、文件编号的括号原文可能采用各种符号,在著录中,一律用“[]”。
3、除第一份文件需著录文号,后面相关文件一律不需著录文号。
四、责任者著录:
1、著录时必须著录全称或不发生误解的通用简称,不得著录简称或者省略。(如“中国共产党丽水市委”可简写为“中共丽水市委”,但不可简写为“市委”)以印章上的责任者为准。
2、个人责任者一般只著录姓名,必要时(如为重要领导人)在姓名后著录职务、职称或其它职责,并加“( )”号。
3、除第一份文件需著录责任者,后面相关文件一律不著录责任者。
4、若文字有两个责任者,而章只有一个,两个责任者均需著录。
5、文件后面无明显责任者,发文单位为责任者。
6、文件后无章,只有个人名字,但文件由某单位发文,发文单位为责任者。
7、责任书的双方都为责任者。
五、文件形成时间著录:
1、著录格式:19890102,表示1989年1月2日。
2、文件时间不完整或部分时间字迹不清时:月日缺少或不清部分以“0”补之。年缺少或不清,应考证出年份,加“[ ]”号。考证不出年份,应考证出大致年份,著录该年代的起始年份,月日用“0”表示,加“[ ]”号。如五十年代的文件,著录为“[19500000]”;如果是几月几日不清楚的:例19890000;如果是几日不清楚的:例19891100。
3、文件上为一段时间,以终止时间作为文件形成时间。
4、简报的形成时间以文件头上时间为准。
5、若同时有形成时间和分发时间,录入形成时间,若只有分发时间,录入分发时间。
六、张页号著录:
1、著录格式:023,表示该档案第一页在案卷中页号。
2、统一用三位表示,不足三位加0。
3、最后一条条目的著录格式:056-059,表示该档案起始页和终止页。
七、主题词著录:
1、格式为:档案;经费;请示,即多个主题词之间用“;”隔开。
2、除第一份文件需著录主题词,后面相关文件一律不著录主题词。
八、档案馆代码著录:必须著录433150。
九、“控制符”著录:已经开放档案著录为1,其它档案暂时不著录。
十、顺序号著录:
1、统一用五位阿拉伯数字著录,不足三位的用“0”补足。
十一、“密级”著录:以档案原件标记为准。抽出另行存放的涉密文件央案卷目录备注项中注明。
十二、所有标点符号都用半角著录。
十三、条目处理
重要的会议记录需要分条扩充著录。
需减少或增加原案卷目录条目,用铅笔在原案卷目录中做好记录。
以上规定中未表明事项,必须请示档案局人员。
附件3
民国档案文件级目录数据采集操作办法
为推进国家重点档案目录体系建设,实现民国档案文件级目录著录规范化,根据《文献著录总则》(GB/T3792.1)、《档案著录规则》(DA/T18)、《民国档案目录中心数据采集标准 民国档案著录细则》(DA/T20.1),特制定本办法。
一、适用范围
本办法适用于全国各级综合档案馆馆藏民国档案文件级目录的著录,规定了文件级目录的著录项目、著录要求、标识符号和著录文字。
二、著录项目
(一)著录项目:揭示档案内容和形式特征的记录事项。
(二)著录项目分为必要项目(Δ)和选择项目。必要项目必须著录,选择项目可视具体情况选择著录。
1.必要项目:档案馆代码、档案馆名称、全宗名称、档号[全宗号、目录号、案卷号(含宗号)、文件(序)号]、文件题名、责任者、时间、页数、控制使用标识、语种、载体形态、政权标识、附注。
2.选择项目:受文者、文种、起止页码、文本、分类号、缩微号、电子文档号、主题词或关键词(人物、机构、会议、事件等)、电子画幅数。
三、著录项目要求
(一)档案馆代码Δ
依据《全国档案馆名称代码》著录。
(二)档案馆名称Δ
保存档案的机构全称。
(三)全宗名称Δ
全宗名称:档案全宗(一个国家机构、社会组织或个人形成的具有有机联系的档案整体)的全称。
(四)档号Δ
档号:以字符形式赋予档案实体的用以固定和反映档案排列顺序的一组代码。文件级档号由全宗号、目录号、案卷号(含宗号)、文件号(卷内文件的顺序号)组成。
(五)文件题名Δ
1.文件题名:又称文件标题,用来表达单份或一组文件内容特征和中心主题。
2.文件题名著录应能揭示文件主要内容,一般要揭示责任者、事由、文种,表述力求精准。
3.单份文件原题名准确表达文件内容可照录;没有题名、题名不完整或不能揭示主要内容的则依据内容重新拟写题名。
4.一组文件的题名依据该组内文件的内容拟写。
5.文件题名中的地名,县级及县级以下的应写明所属省份。
6.文件题名中的人名、机构名参照“三(六)责任者”对应要求规范著录。
7.文件题名中的标点符号须规范使用。
(六)责任者Δ
1.责任者:形成文件内容并对其负有责任的机构或个人。
2.机关、企业、团体等机构责任者应著录准确全称。
3.内设机构或基层机构责任者应标明完整全称。
4.以长官署名发出的机关公文,责任者著录官署全称。
5.文件中明确标明职务的个人责任者须在姓名前著录职务。
6.外国或少数民族责任者照录原文,并在“()”中标明现规范译名。
7.两个或两个以上责任者时,最多著录三个,中间以“、”相隔,被省略的责任者用 “等”表示。
8.附件责任者以附件落款为准。
(七)时间Δ
1.时间:文件的形成时间。
2.时间应著录年、月、日,用8位阿拉伯数字表示。年份4位、月份2位、日期2位,年、月、日都没有的不著录。
例: 民国23年5月4日,著录为19340504
民国35年,著录为19460000
民国 年11月12日,著录为00001112
3.时间分起始时间和终止时间两列著录。公私文书在起始时间项著文件制发时间,没有制发时间著录收文时间。
4.文件针对时间及具有特定意义的时间须在题名或关键词中表述,如计划、报告、预决算、公债等,时间项著录文件内显示的最早和最迟的时间。
5.时间以公元纪年,其他特殊纪年一律换算成公元纪年。千字文代年、地支纪月、韵目代日等应换算成相对应的年、月、日著录。
6.档案上时间记载有误,仍照原文著录,将考证得出的时间著录于后,并加“[ ]”号。
(八)页数Δ
该份文件的实际页数。用阿拉伯数字著录。
(九)控制使用标识Δ
控制使用的文件著录控制符“k”。
(十)语种Δ
档案的书写文字。汉字文件不著录,非汉字文件须依据实际语种著录;汉字和其它文字并存的文件著录“汉蒙”、“汉英”等;不能识别的外国文字著录“外文”字样,不能识别的少数民族文字著录 “少数民族文”字样。
(十一)载体形态Δ
1.载体形态:档案信息载体物质形态的种类。
2.非纸质档案载体类型须著录,例:印章、胶片、标本等。
3.非档案原件需著录“仿真复制”、“静电复印”字样。
(十二)政权标识Δ
特殊政权机构(以文件的制发机构为准)用汉字著录政权全称。例:汪伪政权、伪维新政府、伪华北政务委员会等。
(十三)附注Δ
本条目录中需要特别解释和补充说明的事项。
(十四)受文者
文件主送机构或个人的全称。
(十五)文种
按性质和用途确定的文件种类的名称。
(十六)起止页码
文件起始和终止页码,用“~”连接著录,不连续的页码分段标注,每段之间用“、”。
(十七)文本
文件稿本的名称。依据实际情况著录副本、草稿、定稿、手稿、草图、蓝图等。
(十八)分类号
依据DA/T 20.3——1999及《民国档案分类表》著录。
(十九)缩微号
档案缩微品的编号。
(二十)电子文档号
电子文档号:电子文件的一组符号代码。
(二十一)关键词(人物、机构、会议、事件等)
关键词:反映文件内容,用以表达档案主题并具有检索意义的名词或词组(包括人物、机构、会议、事件等)。
(二十二)电子画幅数
电子档案的实际画幅数。
四、标识符号
(一)()解释或说明性内容, 外国或少数民族责任者现规范译名。
(二) [ ]表示考证得出的著录内容。
(三) ? 用于不能确定的著录内容,一般与 “[ ]”号配合使用。
(四) □ 表示每一个残缺的文字,难以计数的残缺文字用三个 “□”表示。
(五) 、两个或两个以上责任者、关键词、附注栏中的解释和说明词及不连续页码分段标注的间隔符号。
(六) ~ 时间起止之间连接。
(七) + 附件前冠“+”号
(八)k 文件控制符,表示文件不对外开放。
五、著录文字
(一)著录文字为简体汉字。
(二)著录数字除文件题名和全宗号外一律使用阿拉伯数字。
(三)著录外文与少数民族文字时,可依照外文和少数民族文字书写规则著录,亦可根据实际需要翻译成汉字著录。
附件4:
文件级目录数据库结构表
|
||||
序 号 |
数据字段名 |
字段类型 |
文字类别 |
字段长度 |
1 |
档案馆代码△ |
c |
字符 |
6 |
2 |
档案馆名称△ |
c |
汉字 |
80 |
3 |
全宗名称△ |
c |
汉字和字符 |
50 |
4 |
档号△ |
c |
汉字和字符 |
200 |
5 |
文件题名△ |
c |
汉字和字符 |
200 |
6 |
责任者△ |
c |
汉字和字符 |
60 |
7 |
起始时间△ |
c |
字符 |
18 |
8 |
终止时间△ |
c |
字符 |
18 |
9 |
页数△ |
c |
字符 |
4 |
10 |
控制使用标识△ |
c |
字符 |
1 |
11 |
语种△ |
c |
汉字 |
40 |
12 |
载体形态△ |
c |
汉字 |
40 |
13 |
政权标识△ |
c |
汉字 |
60 |
14 |
附注△ |
c |
汉字和字符 |
100 |
15 |
受文者 |
c |
汉字和字符 |
60 |
16 |
文种 |
c |
汉字 |
40 |
17 |
起止页码 |
c |
字符 |
60 |
18 |
文本 |
c |
汉字 |
40 |
19 |
分类号 |
c |
汉字和字符 |
40 |
20 |
缩微号 |
c |
汉字和字符 |
18 |
21 |
电子文档号 |
c |
汉字和字符 |
18 |
22 |
主题词或关键词 |
c |
汉字和字符 |
60 |
23 |
电子画幅数 |
c |
字符 |
4 |
注:△为必要项目 |