近年来,城市建设步伐加快,相应地每年都会增加大量的规划纸质档案,各地市城乡规划管理部门对规划档案的数字化工作重视程度亦不断加强。但这些纸质档案本身的利用价值比较有限,还需进行数字化,并从数字化成果走向数据化,通过数字化处理将纸质档案转换为数字的图片,进一步整理为可供分析利用的档案数据,使其发挥更大的作用。
档案数字化是数据化的前提,城乡规划档案数据化是规划大数据分析的基础。目前,国内数字化技术不断提升,无论是字符、声音、语言和图像等信息,都能够使用数字0和1编码来表达、传输和处理,并通过数据库技术将其转换为可用于分析挖掘的高质量数据,大大提高了数据的直接和间接价值[1].要实现规划档案数据化,需要信息化平台和档案数据化流程,并在实践过程中总结相关的管理经验[2].各地市城乡规划管理部门分别组建了适用于自己的档案信息化平台,影响力也不尽相同。
长沙市规划信息服务中心研发的一站式规划管理服务平台下属城乡规划档案数据化模块(下称档案数据化模块)在实践应用中取得了良好的效果,极大的提高了城乡规划档案数据化工作效率。
1 城乡规划档案特点分析
1.1 图纸数量大、种类多
城乡规划档案最大的特点,就是图纸的幅面、种类和数量多样。不同项目、不同建设单位归档的纸质档案幅面、种类和数量存在差异。图纸幅面主要为A2到A0,种类主要包括了规划依据图、施工图、总平面图等,这无疑增加了档案整理及数据化的难度。根据实际的档案整理过程中得到的数据,不同规划审批阶段归档的档案亦存在图幅数量的差别。
1.2 档案结构复杂
规划档案主要包括建设项目选址、建设用地规划许可、建设工程规划许可、建设单体的放线、验线、建设工程管线、道路工程等规划管理过程中形成的具有利用和保存价值的技术资料、文本、图册等数据,涉及的内容广泛、类型复杂。不同的业务归档不同的内容,每个审批过程对应的就是一个档案类别。每个档案类别下属的档案材料结构复杂多样,以建设工程规划许可证档案材料为例,就包括了建设工程规划审批单、国土证、日照分析报告等近百个小类。档案整理时,需要将材料对应分配到每个小类;在档案著录和数据化时,也要进行对应的归类处理,增大了档案整理及数据化的难度。
2 城乡规划档案数据化模块
根据城乡规划档案特点和档案数据化要求,档案数据化模块包括以下功能模块:著录模块、数字化扫描模块、图面质检模块、数据化提取模块、数据质检模块、入库模块和查询分析等七大模块,如图1所示。
2.1 著录模块
著录模块,主要是对城乡规划档案的基本数据进行录入,形成所需的数据表。包括对著录表格的定义、字段的定义及手动著录的功能。著录是档案数据化工作开始的第一个环节,贯穿于整个流程的始终。在数据化的阶段,著录模块还起到了接受数据填表所产生数据的功能,是档案数据标准化的关键入口。
2.2 数字化模块数字化模块能识别到连接好的扫描设备,设置扫描的相关参数,自动识别空白页进行纸质文件单面或双面的扫描及命名。扫描完成之后,会对图面的偏斜进行修正。数字化模块快速建立了扫描成果与档案条目之间的关系。文件名可以批量命名,也可以单独命名,扫描前也可设置好标准命名格式。
2.3 图面质检模块
数字化完成后的电子文件,需要进行三个部分的质检。首先,是页码校验,提供人眼识别文件页码的功能;其次,是图面校验,对偏斜、不规则的图纸进行修正,对超大幅面的图纸提供多幅面拼合功能;第三,是文件类别校验,用于打包PDF文件。质检模块还提供了数据格式的转换,批量图面处理的功能。
2.4 档案数据化模块
数据化最重要的部分,就是数字化文件中文字的提取和编辑。档案数据化模块使用图文识别技术,将文字进行提取及叠加分析,对未能提取识别的文字进行手动纠错。数字化文件中的图片和部分表格存在提取失真的情况,模块提供了图片截取功能来获取图片或表格的原貌[3,4].
2.5 数据质检模块
数据质检模块,可以对提取的数据进行语法校核,并叠加原件比对。质检完成后,如果数据质量达到了要求,可以将提取后的文字、图片组成的数据化成果与扫描的数字化成果结合转换为双层PDF,同时,导出word等格式的文本。
2.6 入库模块
入库模块可以将数据化成果、数字化成果、PDF成果同时入库到城乡规划档案数据库中。将档案与GIS地图上的地物进行关联,或者与其他审批数据关联。
2.7 查询分析模块
查询分析模块提供了档案编号、名称的模糊查询功能,也可以按照年份、档案类别进行查询并导出查询列表。其分析功能对各年份、各类别的档案进行了数量上的统计,并且对数据化时提取的数据进行挖掘分析。
3 城乡规划档案数据化流程
依据《归档文件整理规则DAT 22-2015》等相关文件,结合城乡规划档案特点,通过对档案数据化环节的梳理,提出了城乡规划档案数据化流程。该流程具备两个特点:一是,统筹兼顾,流程上各个阶段可以同时开展工作,较好的节约了时间和人力;二是,环环相扣,质检工作贯穿整个流程的始终,在各阶段检核和图面、数据全检的基础上,进行巡检和抽检,以确保工作质量,如图2所示。
3.1 档案调取
对档案资料的完整性进行检查,标记好档案号和箱号,调取过程中保证档案不离箱,同时做到档案防水、防压、运输安全,防止档案的破损和丢失。对档案实体内容按移交清单逐一进行清点,对下架接收的档案资料进行两人以上交叉核对、检查,将电子/纸质的接收清单在档案数据化模块中进行比对和勘误。
3.2 材料分类及页码编辑
根据规划档案类别和结构的不同制定档案标准目录,该目录用于指导档案材料分类及页码编辑。该目录在分类阶段由人工填写,在著录阶段输入档案数据化模块并打印装盒。目录上应记录每类文件的份数、起始和终止页码、形成时间、案卷编号等信息;在档案盒脊上注明项目名称,档案号等信息。
3.3 图纸整理
图纸整理阶段包括档案图纸的拆分、修边、装裱及折叠等工作。在档案盒脊上注明项目名称、档案号、图纸份数、责任人等信息。
3.4 信息著录
图纸整理完成后,将档案信息和材料信息录入到档案数据化模块。档案信息与材料信息通过档案编号彼此对应。著录阶段需要使用档案数据化模块制作并打印档案目录表和备考表,同时对档案的类别、数量、作废件等信息进行核实。信息著录完成后,手写目录仍需要保留并随档案盒继续流转。
3.5 数字化及图面质检
数字化过程中需保证图纸扫描质量,并将图纸正确命名。图面质检的目的,是为了保证纸质档案和数字化成果的一致性,主要包括三个方面:页码一致性、图面一致性和文件夹归类与目录类别的一致性。图面质检保证了规划档案数字化成果的质量,为数据化工作的开展打下基础。
3.6 数据化及数据质检
档案数据化模块采用图文识别技术,结合人工编辑,将规划档案数字化成果转换为数据化成果。数据化质检首先对数字化的成果再次进行核对,确保档案材料完整;然后,再对数据化成果的进行语法检查、原件比对,确保数据化成果忠于档案本身。数据化成果质检完成,将数据化成果和数字化成果整合为双层PDF文件。上层为数字化成果,展示档案原貌;下层是数据化成果,提供档案快速检索的数据基础。
3.7 数据化成果入库及纸质档案装盒上架
依托档案数据化模块,可以将档案数据化成果、数字化成果、双层PDF成果分别或打包入库并调阅。成果入库后,将档案信息与地物信息关联,并由此将档案与行政审批等其他数据关联,实现历史数据与现实数据、档案数据与GIS数据的结合。纸质档案在数字化完成之后,将纸质档案装盒并将其放置的位置记录在档案数据化模块中。档案密集架的规划一般是按照类别---年份的顺序展开。至此完成了城乡规划档案数据化的全部流程。
4 城乡规划档案数据化经验
城乡规划档案数据化工作所面临的风险,主要来自三个方面:人员缺失风险、设备故障风险和其他风险。人员缺失风险,主要是指开展城乡档案数据化工作的人员技能不高、人员流动性大,带来对项目进度、档案泄密和损坏的风险。预防该类风险,主要依靠完善的人员培训和管理机制,选择较为稳定的人力来源,强化绩效考核机制和人员聘用制度,并对数据化流程进行监控。设备故障风险,主要是数据化工作对设备的使用强度高,设备损耗大,故障不能快速解决带来的风险。该类风险的预防主要是加强对设备的日常养护,添置备用设备。其他风险包括工作量估算偏差、档案库房搬迁,场地限制等带来的一系列风险。该类风险管控主要是做好风险评估并制定应对策略,预留出工作时间和资源。
5 结语
城乡规划档案图纸幅面多样、档案类型复杂,数据化难度较大。通过不断实践与改善,长沙市规划信息服务中心搭建了一个档案数据化的专业平台,形成一套行之有效的档案数据化标准流程。其中,平台包括著录模块、数字化模块、图面质检模块、档案数据化模块、入库模块、查询分析模块等;流程分为档案调取、材料分类及页码编辑、图纸整理、信息著录、数字化及图面质检、数据化及数据质检、数据化成果入库及纸质档案装盒上架等多个步骤,实现了城乡规划档案的高效数据化。同时提出城乡规划档案数据化工作的相关经验,以期为规划档案大数据未来的应用研究提供参考。
参考文献:
[1] 金波。论档案信息的数字化建设[J].档案学通讯,2005,(3):67-70.
[2] 鲁冰莹。聚焦:“智慧档案”建设的前瞻构想[J].浙江档案,2014,(3):14-17.
[3] 傅荣校,翁敏曦。档案数字化扫描与存储格式比较研究[J].档案学通讯,2007,(2):61-64.
[4] 李敬媛。档案管理工作现代化问题浅析[J].黑龙江科技信息,2009,(13):172,264.
TAG标签:
城乡规划
信息
数据