Hive 配置 MySQL 作为 metastore

为什么要使用 MySQL 来存储元数据

Hive 默认使用内嵌的 Derby 数据库存储元数据。Derby 只支持一个会话连接,而且元数据存储路径取决于执行 hive 的当前路径,只适合用来做测试,不适用于生产环境。

使用 MySQL 可以支持多个会话同时连接,可以在多个服务实例中共享元数据。

阅读更多

数据库范式理解

数据库范式是什么

数据库范式(Normal Form, NF)指的是设计数据库关系模型时应该要满足的标准规范要求。

为什么要遵守数据库范式

使表结构更合理,避免数据冗余,节省存储空间,便于插入、删除和更新。

但是范式越高意味着表的划分更细,用户不得不把原本相关联的数据分解到多个表中,当需要这些数据时只能采用连接表的方式将数据重新合并在一起,影响查询性能。所以,对于更新频率不高、查询频率高的数据库系统来说,有时会故意保留部分冗余方便数据查询。

阅读更多