统一信息资源库秘笈(二):与内容发布系统对接实战经验
2018-09-17 09:40:32 来源: 开普云 作者:

伴随着我国电子政务的深入发展,政府网站逐步转向为民服务与创新发展并重的新集约时代,这种功能定位的转变也倒逼着网站底层数据管理模式的变革,网站内容管理系统必须脱离过去单一的专有模式,向更灵活、互操作性更强的平台化体系结构转变。统一信息资源库,就是顺应时代潮流的产物,支撑实现了全平台跨网站、跨系统、跨层级的资源相互调用和信息共享互认。

统一信息资源库的主要目的之一,是打破“信息孤岛”和“信息烟囱”,实现资源汇聚,从而实现资源的统一管理和调用。这就要求信息资源库能够提供一套标准的业务和技术规范,快速实现与应用系统的对接及资源入库。本文以网站集约化平台中最核心的内容发布系统为例,介绍信息资源库与应用系统对接的流程、注意事项以及经验技巧。

信息资源库与内容发布系统的对接,主要包括两方面内容:一是信息资源的统一存储,资源汇聚融合;二是信息资源的共享共用,为网站供血输氧。

信息资源的统一存储

信息资源库出现之前,内容发布系统中的相关信息,主要存储于系统私有标准的数据库及文件系统中,资源的监管及再利用依赖于发布系统厂商的配合。信息资源库建成后,内容发布系统中的信息将以开放标准的统一数据格式存储于资源库中,使信息资源独立于应用管理。

实现内容发布系统资源的统一存储,必须处理好全量历史数据迁移及增量更新数据同步两大问题:

1、全量历史数据迁移

全量历史数据迁移是将内容发布系统已有资源迁移至信息资源库,并以统一数据格式存储。迁移过程的难点是保证资源的完整性、兼容性、有效性、格式的一致性,这要求资源库所提供的适配器集功能具备如下能力:快速实现与内容发布系统的对接,历史数据迁移进度及状态可见,迁移资源明细可随时监控查询,迁移完成后的信息总量可统计对比,迁移失败的资源可批量重试等。用户可以精确地定义资源入库后的分类、元数据、关键字等信息,也可以由资源库智能识别匹配。除此之外,对可疑、无效数据的清洗,数据按主题的自动关联、聚合,数据排重及自动标引,数据内容的安全检查等一系列智能化处理,保证资源入库后的质量。适配器集中内置的自动格式转换实现了迁移的同时将资源按统一格式存储。

2、增量更新数据同步

在完成历史数据迁移工作后,网站日常的内容运营涉及增量数据的同步,考虑到学习成本最低,内容更新时间的不均匀分布,系统的并发稳定性及数据同步的及时性等因素,理想的方案是,编辑人员无需改变现有工作流程和习惯,也无需进行额外操作,对内容发布系统中资源的更新将触发定时自动同步,资料库以消息队列模式进行数据同步处理,根据更新量大小,自动估算消息队列的规模,匹配相应资源。

需要注意的是,信息资源库作为资源存储仓库,定位于保留信息资源并有效进行管理、分类、资源描述,而不保存或处理各应用系统的业务逻辑信息。

信息资源的共享共用

信息资源的共享共用分为“按需订阅”和“主动自取”两种模式:

1、“按需订阅”模式

由负责资源库的业务人员向内容发布系统提供信息资源,他们按业务需求在资源库中选择合适的信息资源,推送到内容发布系统。也可以配置信息筛选规则,由资源库按规则自动选择并推送资源到内容发布系统。为保险起见,建议暂存为草稿备用。

2、“主动自取”模式

由内容发布系统的编辑人员主动寻找资源加以利用。编辑人员在新闻编辑过程中,从信息资源库查询合适的文字、图片、文档等素材,组合使用。对于一些特定的政策文件、领导信息等栏目,则可以通过设置素材聚合的条件,将资源库中符合条件的资源自动聚合到指定目录下,只需要对聚合资源进行审核及选择发布,极大地减轻了工作量。

实际工作过程中,若信息资源库和内容发布系统的信息维护工作由同一团队完成,则两种模式可以灵活组合使用。

总结

通过以上示例介绍,我们了解了信息资源库与内容发布系统对接的过程,以及对接后资源管理及共享使用发生的变化。其他应用系统,如互动系统、办事系统、信息公开的对接,也可效仿此示例开展。