打开微信扫一扫
近年来,高校信息建设以数据为驱动的师生服务优化、辅助决策、教学科研增效等智慧应用都已经进入发展规划中,数据中心作为基础设施发挥着重要的作用。当前的高校数据中心建设有两个化趋势,一是数据精细化、二是数据全面化。精细化体现在高校都很重视数据治理,逐步建立和推进数据管理制度。数据全面化表现在,除了对基础的主数据进行交换共享,高校普遍重视师生在各种活动中产生的过程性数据,比如学生在校行为数据、教育教学过程数据、科研过程数据等。
高校信息化的发展趋势要求数据管理的工作要做的更精细,数据平台建设要做得更全面,制度保障要更给力,不仅要解决数据有无问题,还要能支撑数据的持续、全面的治理。只有在坚实的数据基础平台之上才能支撑其上的各种应用和服务,并用数据作为驱动对高校各项业务进行优化提升,对高校决策管理提供辅助,助力高校的管理与治理。目前,大多数高校都已经完成了至少一轮数字信息化建设(学校信息中心老师自己建设或者花钱找其它厂商建设),但是很多高校都面临大致相同的现状和问题。
高校信息化现状
究其原因,总结来说有这几点:
大部分前期建设的数字化校园信息标准已无法满足用户日益膨胀的数据资源规范化需求,无法及时将数据按照统一的数据服务标准统一进行管理,导致数据收集困难并形成了大量的脏数据,学校再次面临信息孤岛的问题;建立规范、标准、符合学校实际情况的数据标准迫在眉睫,这是所有后续数据工作的基石。
很多学校数据中心由于数据标准不规范或者没有完全按照数据标准来建设数据中心,导致数据中心数据不完整。有的由于建成之后没有定时的维护,也没有好的机制去定时检查数据质量的变化,导致数据中心的数据质量越来越差。
大部分学校的数据中心并没有过程数据,只有结果数据(即只是完全和源数据保持一致),导致历史数据和过程数据无法追溯并无法在其上进行大数据的分析、挖掘。
数据中心的ETL过程、数据源、数据标准、数据接口提供等没有管理界面。不方便老师后期进行维护和二次开发。有的学校数据清洗处理抽取甚至是管理员通过SQL语句处理,没有图形化的ETL工具,对老师的技术要求比较高同时在做工作交接的时候会比较困难,因为缺乏文档和方便可上手操作的工具。
为了达到上述目标,需要构建相应的全量数据治理平台与工具,数据治理相关人使用ETL工具(康赛DCI)将分散至各个业务系统中的数据集中到高校数据中心,通过相应的主题标准映射规则对数据进行分类统计,在此过程中由于数据质量不佳,可能会导致DCI作业阻塞;所以我们需要对学院数据质量进行分析,以保证个流程正常运作。