数据散乱不一致

传统企业的数据具有多样性,包括结构化、半结构化以及非结构化的数据。数据来源上包含数据库数据、日志数据、对象数据以及已有数仓上的存量数据等。这些不同来源、不同格式的数据,各自又有不同的访问和分析方式,而大量传统企业基于关系数据库构建自己的业务系统,已经非常熟悉按SQL的方式去使用数据,这无疑增加了企业存储和使用数据的成本。

分析不实时

企业运营的形式越来越多样化,例如,实时推荐、精准营销、广告投放效果、实时物流、风控等。数据时效性在企业运营中的重要性日益凸现,数据的实时处理能力成为企业提升竞争力的重要因素。越来越多的企业大数据分析已不再局限于传统的T+1场景,对数据的实时性分析和处理要求提出了更高要求。传统的批处理模式往往有数小时甚至数天的延迟,不能满足T+0的业务需要,用户要求在秒级,甚至毫秒级完成对海量数据分析。

系统极复杂

大数据平台普遍存在使用复杂的问题。用户希望专注于核心业务,而非底层技术。用户希望使用的是“开箱即用”的方案,而不是陷入到高昂的学习成本、繁复的技术细节之中。用户渴望拥有一个简单易用的平台。此外,大数据平台的组合方案在细粒度的访问权限控制、高可靠性方面,特别对于金融等行业客户的数据容灾、高可用的需求无法很好支持。

使用成本高

数据在企业中的使用,具有明显的周期性和不确定性。一方面,业务发展变化很快,其数据规模体量也变化很大;另一方面,有些业务具备很强的时间周期特点,平时空闲,高峰明显。这些特点对底层基础能力提出了很高的资源弹性要求。这里所说的弹性,既包括存储能力的弹性,也包括计算能力的弹性。用户可以根据自身的需求,灵活选择资源方式,并根据发展需要,随时变更资源配置,达到投入资源收益最大化。