|
|
MR前言Apache Hive 经过多年的发展,目前基本已经成了业界构建超大规模数据仓库的事实标准和数据处理工具,Hive已经不单单是一个技术组件,而是一种设计理念。Hive有JDBC客户端,...【详细内容】 |
2022-02-24 百科 |
|
|
引言Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。对于Spark...【详细内容】 |
2021-04-12 百科 |
|
|
在阅读该文之前,我已经假设你已经对kafka的broker、topic、partition、consumer等概念已经有了一定的了解。流处理流数据是一组顺序、大量、快速、连续到达的数据序列,一般情...【详细内容】 |
2020-08-07 大数据 |
|
|
|