搜索
大数据平台开源工具集锦:这些你都了解吗?
大数据平台处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据仓库工具无法处理完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的各类技术
数据仓库EB级应用下的算子级血缘主动治理方案
一、主动数据治理,数据治理新范式 1、新治理范式探索的背景 大多数管理过数仓的同学应该都有一个普遍共识是数据仓库建设时间越长,管理复杂度会越大。一是引入的数据技术越来越多,管理的集群会越来越多;二是参与数据生产和使用的角色和人员会越来越多;三是业务需要引入的数据会越来越多。最后会形成一个特别复杂的数据依赖网络,而数据管理的目标是要不断满足业务的效率、性能、质量、成本、安全等方面不断增长的需求...
京东EB级全域大数据平台的演进历程与治理实践
大家好,我是来自京东的包勇军,今天主要跟大家分享一下京东全域大数据平台的建设历程。在分享前,我想先重申一下数据的价值。 一、数据的价值 The Economist(经济学人期刊),2017年,5月版 众所周知,数据正如石油一样深刻改变着我们的信息化社会,为整个行业,更为我们的社会创造了越来越大的价值...
姓名不为空
手机不正确
公司不为空