当前位置:网站首页>当 TiDB 与 Flink 相结合:高效、易用的实时数仓
当 TiDB 与 Flink 相结合:高效、易用的实时数仓
2020-11-07 20:15:00 【InfoQ】
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。以维表 Join 为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的 Join 操作,降低性能。如果在数据清洗导入过程中就能流式的完成 Join,那么分析时就无需再次 Join,从而提升查询性能。
利用实时数仓,企业可以实现实时 OLAP 分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。而得益于新版 Flink 对 SQL 的支持,以及 TiDB HTAP 的特性,我们探索了一个高效、易用的 Flink+TiDB 实时数仓解决方案。
本文将首先介绍实时数仓的概念,然后介绍 Flink+TiDB 实时数仓的架构与优势,接着给出一些已经在使用中的用户场景,最后给出在 docker-compose 环境下的 Demo,用于读者进行尝试。
实时数仓的概念
数据仓库的概念在 90 年代由 Bill Inmon 提出,是指一个面向主题的、集成的、相对稳定的、反映历史变化的集合,用于支持管理决策。当时的数据仓库通过消息队列收集来自数据源的数据,通过每天或每周进行一次计算以供报表使用,也称为离线数仓。
原文链接:【https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh】。未经作者许可,禁止转载。
版权声明
本文为[InfoQ]所创,转载请带上原文链接,感谢
https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh?utm_source=rss&utm_medium=article
边栏推荐
- 大数据算法——布隆过滤器
- C語言重點——指標篇(一文讓你完全搞懂指標)| 從記憶體理解指標 | 指標完全解析
- 如何应对事关业务生死的数据泄露和删改?
- yum [Errno 256] No more mirrors to try 解决方法
- CI / CD of gitlab continuous integrated development environment
- Web API系列(三)统一异常处理
- Advanced concurrent programming series 9 (lock interface analysis)
- 工作1-3年的程序员,应该具备怎么样的技术能力?该如何提升?
- 抽絲剝繭——門面和調停者設計模式
- Key points of C language -- index article (let you fully understand indicators) | understand indicators from memory | complete analysis of indicators
猜你喜欢

HMS Core推送服务,助力电商App开展精细化运营

PHP backdoor hiding skills

Knowledge competition of garbage classification

A kind of super parameter optimization technology hyperopt

Vscode configuration

REM: the solution of PC and mobile

使用RabbitMQ实现分布式事务

After pulling four message queues into a group, they quarreled

带你深入了解 GitLab CI/CD 原理及流程

awk实现类sql的join操作
随机推荐
8. Swarm creates maintenance and horizontal extension service
2018中国云厂商TOP5:阿里云、腾讯云、AWS、电信、联通 ...
Vscode configuration
Tips for Mac novices
Vue: Axios uses this pointer
模型预测准确率高达94%!利用机器学习完美解决2000亿美元库存难题
11. Service update
想要忘记以前连接到Mac的WiFi网络,试试这个方法!
Using thread communication to solve the problem of cache penetrating database avalanche
一文详解微服务架构
Design pattern of facade and mediator
嘉宾介绍|2020 PostgreSQL亚洲大会中文分论坛:潘娟
[漫谈] 软件设计的目标和途径
If you want to forget the WiFi network you used to connect to your Mac, try this!
全网最硬核讲解计算机启动流程
k-vim安装及The ycmd server SHUT DOWN (restart with ':YcmRestartServer')这种错误的解决方法
Knowledge competition of garbage classification
.NETCore3.1+Vue.js打造的低代码工作流引擎
我们为什么需要软件工程——从一个简单的项目进行观察
MongoDB下,启动服务时,出现“服务没有响应控制功能”解决方法