当前位置:网站首页>OLAP ——Druid简介
OLAP ——Druid简介
2022-06-22 21:24:00 【IT_心如止水】
目录
背景
Druid是一个分布式的支持实时分析的数据存储系统。通俗点说:就是一个高性能实时分析数据库。2011年,由美国广告技术公司MetaMarkets创建,并于2012年开源。官网地址是:http://druid.io/。目前Druid已基于Apache License 2.0协议开源,正在由Apache孵化,代码托管于Github。最新官网地址为:https://druid.apache.org/
(注意:阿里曾开源过一个项目叫做Druid是一个数据库连接池。与这里讲的Driud仅仅是名字一样而已,并没有什么关联。)
特性
1.快速查询
内存化的数据存储提高了druid的查询速度,提供了快速的聚合能力以及快速OLAP查询能力,多租户的设计,是面向用户分析应用最理想的方式。druid的数据聚合粒度可以是1分钟,5分钟,1小时或者1天等。
2.实时数据注入
druid支持实时流式数据的注入,并提供了数据的事件驱动,保证在实时和离线环境下事件的时效性和统一性。典型的 Lambda 架构,不改变历史数据,实时接入实时数据。
3.可扩展的PB级存储
可扩展的分布式架构,druid集群可以很方便的扩容到PB的数据量,每秒百万级别的数据注入。即便在加大数据规模的情况下,也能保证其时效性。druid可以按照时间范围把聚合数据进行分区处理。
4.云原生架构,高容错性:
druid既可以运行在商业的硬件上,也可以运行在云上。它可以从多种数据系统中注入数据,包括hadoop,spark,kafka,storm和samza等。
基本概念
设计原则
1.快速查询(Fast Query) : 部分数据聚合(Partial Aggregate) + 内存化(In-Memory) + 索引(Index)
2.水平拓展能力(Horizontal Scalability):分布式数据(Distributed data)+并行化查询(Parallelizable Query)
3.实时分析(Realtime Analytics):Immutable Past , Append-Only Future
数据格式
druid在数据摄入之前,首先需要定义一个数据源也就是Datasource,这个dataSource的结构是 时间列(TimeStamp),维度列(Dimension)和指标列(Metric)。
时间列:druid会将时间相近的一些数据聚合在一起,查询的时候指定时间范围。
维度列:作为标识一些统计的维度,比如各种类型。
指标列:就是用于聚合和计算的列,包括count,sum等等。
数据摄入
druid提供了两种数据摄入方式,实时和批处理。

数据查询
druid支持两种查询,原生和sql
适用场景
根据Druid的特性可知,druid适合的数据场景:
查询多修改很少
查询以聚合或分组为主
快速查询
需要支持离线和实时的数据源·
具体的业务场景:
用户行为分析
服务性能指标实时监测
数字营销
商业智能/ OLAP
边栏推荐
- swagger2 使用方法
- 剑指 Offer 07. 重建二叉树
- Considerations for using redisson to operate distributed queues
- 对 cookie 的添加/获取和删除
- Using the hbuilder x editor to install a solution for terminal window plug-ins that are not responding
- [STM32 skill] use the hardware I2C of STM32 Hal library to drive rx8025t real-time clock chip
- 14. 最长公共前缀
- Spark SQL Start(2.4.3)
- Safe and reliable! Tianyi cloud data security management platform passed the evaluation
- 事物系统的几种异常场景
猜你喜欢

【ARM】讯为rk3568开发板lvds屏设置横屏显示

Enterprise digitalization is not a separate development, but a comprehensive SaaS promotion

10 Super VIM plug-ins, I can't put them down

Introduction to database access tools

Is it difficult to turn weak current into professional network worker? Huawei pre-sales engineers share their own experience

KunlunDB查询优化(三)排序下推

Future alternatives to IPv4! Read the advantages, features and address types of IPv6

OJ daily practice - filter extra spaces

企业数字化不是各自发展,而是全面SaaS化推进

three.js模拟驾驶游览艺术展厅---打造超级相机控制器
随机推荐
After passing the hcip exam, I still failed to change my career. What do professional network workers value most
C sqlsugar, hisql, FreeSQL ORM framework all-round performance test vs. sqlserver performance test
three.js模拟驾驶游览艺术展厅---打造超级相机控制器
js防止PC端复制正确的链接
js判断浏览器是否打开了控制台
阻止别人使用浏览器调试
Safe and reliable! Tianyi cloud data security management platform passed the evaluation
flink同步mysql数据到ES
'dare not doubt the code, but have to doubt the code 'a network request timeout analysis
OJ每日一练——过滤多余的空格
防抖&节流 加强版
Use the find command
JSBridge
OJ每日一练——单词的长度
Learning the interpretable representation of quantum entanglement, the depth generation model can be directly applied to other physical systems
斐波那契数列合集
DML:Data Manipulation Language 数据操纵语言
OJ每日一练——删除单词后缀
别再用 System.currentTimeMillis() 统计耗时了,太 Low,StopWatch 好用到爆!
Spark SQL accessing JSON and JDBC data sources