DIY编程器网

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1034|回复: 0
打印 上一主题 下一主题

[待整理] 商业智能发动机—数据仓库引擎

[复制链接]
跳转到指定楼层
楼主
发表于 2014-10-13 15:20:48 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
这里的数据展现主要作用是以图表、Dashboard等形式将结果呈现给用户;ETL负责将原始数据进行抽取、转化、清洗、装载进数据仓库;数据仓库负责执行数据的存储和管理,并执行前端展现工具提交的各种查询分析任务。

  在BI应用中,数据仓库类似于汽车的引擎,居于核心地位,它的性能高低直接决定了BI应用的响应速度。而在大型BI应用中,性能是一个非常关键的问题,特别是那些有着海量数据、需要完成复杂查询任务的系统,数据仓库引擎的选择就更为关键。

  综观目前的数据仓库市场,能提供这一个工具的供应商并不多,一线的厂商主要有Teradata、IBM、甲骨文、Sybase、微软等。尽管同为数据仓库引擎,但是这些供应商各自所走的技术路线也并不同,不同的技术也导致了它们的产品具有完全不同的特点。

  Teradata应该算最为特立独行的一个,Teradata数据仓库主要运行在NCR WorldMark SMP硬件的Unix操作系统平台上,它的高性能主要通过Teradata与NCR硬件平台海量并行处理服务器结合,以及采用特有BYNET协议和查询优化等技术实现并行等机制。由于采用一些专有的硬件和技术,因此价格较高,是数据仓库中的“贵族”。

  IBM、甲骨文和微软的数据仓库引擎属于同一类,它们都提供数据库产品,其数据仓库引擎和数据库引擎从技术上说有很多相似之处。这种技术路线给它们带来的好处是,其数据仓库解决方案很自然地是从数据库技术拓展和延伸而来的,集成性和延续性比较突出。

  与IBM、甲骨文和微软相比,Sybase也同时提供数据库和数据仓库产品,但是,Sybase的数据仓库引擎却走了一条与IBM、甲骨文完全不同的技术路线。其中最大的不同就是在Sybase数据仓库引擎(即Sybase IQ)中采用列存储架构,而所有关系型数据库引擎广泛采用的则是行式存储。

  基于列存储所带来的一个直接好处是,在压缩方面比传统的关系型数据更加有效,这是因为同一列的所有数据域有相同的类型,因而每一列都可以为优化的效率和检索进行压缩; 列存储的另一个好处是性能上的提高,特别是在处理大数据量、复杂的跨多表查询时,列存储在性能上的提升非常明显。在保证数据压缩的目标下,能够同时提高查询性能,这正是Sybase IQ提倡的绿色数据库的概念。

  而目前,上述三种不同的数据仓库技术到底哪种更好,各家都有自己的说法。不过,用户倒是可以乐观其成,毕竟竞争可以带给用户更好的技术和产品。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享 支持支持 反对反对
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|文字版|手机版|DIY编程器网 ( 桂ICP备14005565号-1 )

GMT+8, 2024-11-15 09:41 , 耗时 0.097828 秒, 18 个查询请求 , Gzip 开启.

各位嘉宾言论仅代表个人观点,非属DIY编程器网立场。

桂公网安备 45031202000115号

DIY编程器群(超员):41210778 DIY编程器

DIY编程器群1(满员):3044634 DIY编程器1

diy编程器群2:551025008 diy编程器群2

QQ:28000622;Email:libyoufer@sina.com

本站由桂林市临桂区技兴电子商务经营部独家赞助。旨在技术交流,请自觉遵守国家法律法规,一旦发现将做封号删号处理。

快速回复 返回顶部 返回列表