本平台以数据智能为核心理念,借助人工智能技术深入挖掘数据价值,释放数据智能力量。支持多源异构数据的接入;支持统一跨业务构建数据模型和数据对象,实现基于标准数据对象的数据服务;统一数据标准,实现互联互通、信息共享、业务协同;提供数据资产目录,实时掌握数据资产状况;提供统一数据融合平台,实现数据融合;支持数据质量评估,提升数据质量,夯实数据应用基础,发挥数据价值。
图1 工业大数据架构图
产品优势
数据接入:主流数据源、异构跨源、文件支持断点与分片上传、插件化扩展。
数据融合:调度作业数1万+、PB级海量数据查询分析。
数据治理:数据落库开始的数据安全、数据质量等数据治理。
对现有系统影响:侵入性低,不改变原有技术栈、不涉及原有系统改造、与企业未来业务系统建设不冲突。
主要功能
资产目录:提供统一的数据资产共享目录,通过资产分类、资产标签统一管理接入的结构化及非结构化数据资产,支持数据订阅、查看、API接口、资源下载等多种数据共享方式,能够对数据资产的数据内容、元数据信息进行查看。
数据接入:统一的数据源端注册和管理能力,支持对所注册数据源的连通性进行有效性验证;可以基于已注册且连通的数据源,构建虚拟视图;提供可扩展的共享文件存储服务,支持多格式文件的上传、下载和管理,具备非结构化数据存储和管理能力。
数据建模:构建包含数据内容以及数据实体和属性之间关系的数据模型,支持对模型属性、对象进行灵活定义,支持模型,帮助用户规范快捷实现数据建模,进而支持数据对象的实例化构建。
数据融合:提供强大的统一融合平台,实现对多源异构的原始数据按照规则进行标注、清洗、过滤、转换、加工、同步等操作,输出满足业务需求的高质量数据,支持数据建模,支持企业决策、支持业务创新。
数据服务:支持以数据对象方式快速构建数据服务,涉及数据资产、参考数据、主数据、数据标准规范等公共数据资源,通过API方式对外提供以支持整个企业核心数据共享与统一进而提升数据质量。
数据标准:支持业务术语标准化、枚举项标准化、数据元标准化、标准文档可管理以及标准可检索,实现互联互通、信息共享、业务协同,为建立数据标准体系奠定基础。
数据血缘:"血缘分析",直观的展示了目标对象的产生过程,帮助用户推测出产生过程中被赋予的含义,以及会受到的潜在影响;"影响分析",反映当前对象在平台中参与了哪些元数据的形成,帮助用户观察该对象的影响能力。
数据质量:借助质量计划、质量规则、质量评估等提升质量的手段,提升数据质量的完整性、一致性、规范性、准确性、唯一性等指标,夯实数据应用基础,发挥数据价值,进而更好地推进数据决策的落地。