过去可知却不可控,未来可控却不可知
01
28
24
大数据处理方案 大数据处理方案
背景¶ 所谓的海量数据是指海量数据的存储、处理和操作。正是因为数据量太大,所以导致要么无法在短时间迅速完成,要么无法一次性载入内存。 数据去重(data deduplication)是大数据领域司空见惯的问题了。除了统计UV等传统用法之外,
2022-01-24
23
23
23
21
Presto实战与演练 Presto实战与演练
背景¶ Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工具。在以前,Facebook的科学家和分析师一直依靠Hive来做数据分析。但Hive使用Map
2022-01-21
16
16
16
16
Leetcode算法题1801-1900 Leetcode算法题1801-1900
1801-1810¶ 1811-1820¶ 1821-1830¶ 1828.统计一个圆中点的数目¶ 直接使用两点间距离公式就可以解决,需要注意的是迭代时使用auto &,节省了很多内存和时间。 class Solution { pu
2022-01-16
16
16
16
16
16
16
16
16
1 / 2