面向数据分析人员,专注大数据挖掘与执行预测性分析的可视化全流程开发平台,模型开发的各个环节,包括数据处理、模型训练、模型管理、模型部署等都可以在本平台上完成。例如,探查处理数据;建立物理实体数据模型;构建机器学习模型;执行预测性分析;业务数据可视化。
让工业数据分析工作变得轻松:借助其中的功能,您可以访问和预处理数据、构建机器学习和预测模型,并将模型部署到专项业务应用系统。
支持丰富的数据源:支持对接多种不同类型的数据源,将数据抽象成可直接被分析的数据对象,支持海量数据的数据准备、数据处理。支持海量数据的全流程分析。开“箱”即用,涵盖模型开发的全流程,包含数据准备、训练模型、部署任务、模型下发、可视化应用等功能,可灵活使用一个或多个功能。
云边端多场景模型部署:边为“边缘一体机”,端为“设备”,云为“服务器或者公有/私有云”,创建的模型可直接下发或导入导出进行模型高效应用。
操作简单,分析结果可视化:整个建模流程设计基于拖拽式布局、连线式流程编排和教程式参数配置,使用者根据业务需要快速完成建模分析,并且每步的计算结果支持可视化显示,理解内在趋势并发现数据质量问题。
组件可扩展,支持团队协作:用户可上传自定义组件,也可订阅其他用户公开的组件进行建模分析。
帮助工业企业深化大数据分析与创新能力的企业级软件平台,秉承敏捷分析方法论,支持工业工程师以业务视角的数据视图,自主进行数据探查和分析建模,低代码开发并运行可持续迭代的数智化创新应用,加速数据驱动的业务创新。
平台拥有灵活可扩缩的云原生微服务架构,提供成熟的工业大数据管理工具和AI分析模板,联接并管理所有数据源,支撑PB级增长的数据量,为全球超过百万套高价值装备及复杂产线提供高效分析建模与研运一体技术栈,实现基于实时与历史数据的预警及优化建议。
面向工业人的产品体验
提供统一的工业大数据管理服务,屏蔽复杂的大数据管理技术,支持海量、多源、异构的数据汇集管理,支持与主流的大数据平台无缝对接;通过以工业物理系统为核心的数据建模,提供业务视角的数据视图,方便工业专家理解和使用与业务相关的多源数据。
基于多年工业数据分析项目经验总结形成的敏捷分析方法论,为工业人进行数据分析建模提供指导;提供拖拽式的数据分析建模和应用开发环境,内置开箱即用的分析模板,降低数据分析建模和应用开发的技术门槛。
工业人可掌握的数据分析。
工业人能运营的数据产线。
一站式数据产线,支撑企业级数智化应用的快速设计、开发、测试、部署、运行及持续迭代;支持企业数据创新中心(云)与工业现场(边/端)协同,实现模型分发和应用分层管理。
图1 AI算法平台技术架构
主要功能
快速对接数据源:平台本身不承担大量数据存储的任务(尽管支持本地文件上传到DA做离线分析),但可以对接已有的数据源。可以对接的数据源包括:文件、Hive, HBase, PG, MySQL 、MongoDB等多种数据源。
丰富的分析组件:提供数百种数据分析组件,并且持续更新迭代,组件类型包括工业数据预处理、统计、机器学习算法、深度学习、NLP、模型评估器、建模(训练、验证、应用)。针对工业场景提供特定工业组件,包括SPC、数据平滑、PCA、FIR滤波、IIR滤波、FFT、平稳性检验、Apriori、WignerVill分布、Pearson相关系数、方差分析等。可视化开发降低了建模难度,提高了建模效率。
可视化的分析工作流:通过拖放式对选择的组件进行连接以构建可视化的分析工作流,分步骤运行,每一步都能及时地查看执行结果,从而方便地尝试不同算法组合,快速实现流程化、定制化的数据分析。
自定义算法组件:支持上传算法代码生成自定义的算法组件,组件发布后支持跨团队的订阅和共享。另外,平台提供常用的分析模型模板助力企业快速地模型开发,包括统计过程控制(SPC),自动根因分析(RCA),多元异常检测,虚拟量测(VM)等等。
多种任务部署:平台支持模型实例发布为API任务、定时任务、实时任务、交互式任务等模式。分析模型支持发布到数据管理系统、边缘系统以及云端,实现基于模型的实时计算、边缘计算和云端计算。
数据可视化:支持组件执行结果实时展示及绘图,包括:柱状图、折线图、雷达图等图形,同时提供钻取、联动、缩放、筛选、链接等交互操作。另外,可视化场景可直接生成链接,提供其它应用系统使用。