不一致的结果,取决于你是用原始的还是复制的、修改过的数据集,如果数据包含不同的信息,会有不同的结果,包括不同的匹配率、运营失败,也许糟糕的是导致糟糕的客户体验。
不准确的结果,如果数据集是过时的,不完整的,或包含错误的信息,输出也会是这样。
隐私问题,包含任何敏感信息的无人管理的数据副本是有风险的,因为可能不符合监管的要求,而这种风险往往是高层管理人员所不知道的,直到严重的问题发生,为时已晚。
信息安全,在任何可以创建垃圾数据的环境中,都存在着安全问题。这个问题类别的严重程度将根据数据的类型而有所不同。常见的例子包括不遵循内部程序,违反许可证或知识产权,以及数据被黑客攻击,因为它被储存在公司的安全操作之外。
财务成本,由于上述任何一个原因,创建和使用垃圾数据是低效的。