跳到主要内容

错误数据存储

介绍

错误数据存储引擎是用于存储数据质量检查中不符合规则的数据,便于用户可以查看有问题的数据来进行下一步的修复或者剔除操作,Datavines 目前支持写入至外部存储引擎和写入至检查数据源两种方式。

外部存储引擎目前只支持MySQL、写入至检查数据源支持MySQL、Doris、StarRocks。

使用方法

写入外部存储引擎

  • 在错误数据管理页面创建存储引擎,填写上引擎的配置参数,点击测试连接,测试成功则保存存储引擎。 错误数据存储引擎管理
  • 在作业配置页面进行配置,在错误数据存储配置里选择你所创建的引擎 错误数据存储引擎配置

写入外部存储引擎需要进行数据的读取和写入,为了保证系统的稳定,目前只支持前10000条错误数据的存储。

写入检查数据源

  • 无需进行额外的配置
  • 在作业配置页面进行配置,在错误数据存储配置里, 开启 是否输出至源数据源 配置,并且输入用于存储错误数据的数据库名。 错误数据存储引擎配置2

错误数据的查看

点击数据质量检查作业的 查看执行记录,在执行记录中点击 错误数据 即可查看错误数据。 错误数据查看