当前位置:网站首页>当 TiDB 与 Flink 相结合:高效、易用的实时数仓
当 TiDB 与 Flink 相结合:高效、易用的实时数仓
2020-11-07 20:15:00 【InfoQ】
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。以维表 Join 为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的 Join 操作,降低性能。如果在数据清洗导入过程中就能流式的完成 Join,那么分析时就无需再次 Join,从而提升查询性能。
利用实时数仓,企业可以实现实时 OLAP 分析、实时数据看板、实时业务监控、实时数据接口服务等用途。但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。而得益于新版 Flink 对 SQL 的支持,以及 TiDB HTAP 的特性,我们探索了一个高效、易用的 Flink+TiDB 实时数仓解决方案。
本文将首先介绍实时数仓的概念,然后介绍 Flink+TiDB 实时数仓的架构与优势,接着给出一些已经在使用中的用户场景,最后给出在 docker-compose 环境下的 Demo,用于读者进行尝试。
实时数仓的概念
数据仓库的概念在 90 年代由 Bill Inmon 提出,是指一个面向主题的、集成的、相对稳定的、反映历史变化的集合,用于支持管理决策。当时的数据仓库通过消息队列收集来自数据源的数据,通过每天或每周进行一次计算以供报表使用,也称为离线数仓。
原文链接:【https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh】。未经作者许可,禁止转载。
版权声明
本文为[InfoQ]所创,转载请带上原文链接,感谢
https://www.infoq.cn/article/IoD228mbbr7wylDEQKkh?utm_source=rss&utm_medium=article
边栏推荐
- 垃圾分类知识竞赛
- Analysis of the original code of [QT] qthread
- Advanced concurrent programming series 9 (lock interface analysis)
- graph generation model
- 11. Service update
- Vscode configuration
- Exclusive interview with Yue Caibo
- 我们为什么需要软件工程——从一个简单的项目进行观察
- K-vim installation and the ycmd server shut down (restart with ': ycmrestartserver')
- 失眠一个整晚上
猜你喜欢
From technology to management, the technology of system optimization is applied to enterprise management
Advanced concurrent programming series 9 (lock interface analysis)
yum [Errno 256] No more mirrors to try 解决方法
Python 3 operates the Jenkins module API
C# 枚举权限 |和||,&和&&的区别
8. Swarm creates maintenance and horizontal extension service
垃圾分类知识竞赛
C语言Ⅰ博客作业03
Talk about sharing before paying
Huawei HCIA notes
随机推荐
How to solve the problem of blank page in Google Chrome browser
我们为什么需要软件工程——从一个简单的项目进行观察
STlink下载出现st-link usb communication error解决方法
From technology to management, the technology of system optimization is applied to enterprise management
深入浅出大前端框架Angular6实战教程(Angular6、node.js、keystonejs、
屏读时代,我们患上了注意力缺失候群症
vscode 配置
What kind of technical ability should a programmer who has worked for 1-3 years? How to improve?
Didi's distributed ID generator (tinyid), easy to use
Business Facade 与 Business Rule
Talk about sharing before paying
11.Service更新
使用RabbitMQ实现分布式事务
Yum [errno 256] no more mirrors to try solution
Classroom exercises
Advanced concurrent programming series 9 (lock interface analysis)
[note] error while loading pyv8 binary: exit code 1 solution
idea 激活到 2089 失效
Come on in! Take a few minutes to see how reentrantreadwritelock works!
DOM节点操作