-
Notifications
You must be signed in to change notification settings - Fork 2
/
Copy pathdata_warehouse_quick2.html
314 lines (306 loc) · 14.9 KB
/
data_warehouse_quick2.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
<!DOCTYPE html>
<html lang="cn">
<head>
<meta charset="utf-8" />
<title>数据仓库快速入门教程2数据库与数据仓库的差异</title>
<link rel="stylesheet" href="/theme/css/main.css" />
</head>
<body id="index" class="home">
<header id="banner" class="body">
<h1><a href="/">python自动化测试人工智能 </a></h1>
<nav><ul>
<li><a href="/category/ba-zi.html">八字</a></li>
<li><a href="/category/ce-shi.html">测试</a></li>
<li><a href="/category/ce-shi-kuang-jia.html">测试框架</a></li>
<li><a href="/category/common.html">common</a></li>
<li class="active"><a href="/category/da-shu-ju.html">大数据</a></li>
<li><a href="/category/feng-shui.html">风水</a></li>
<li><a href="/category/ji-qi-xue-xi.html">机器学习</a></li>
<li><a href="/category/jie-meng.html">解梦</a></li>
<li><a href="/category/linux.html">linux</a></li>
<li><a href="/category/python.html">python</a></li>
<li><a href="/category/shu-ji.html">书籍</a></li>
<li><a href="/category/shu-ju-fen-xi.html">数据分析</a></li>
<li><a href="/category/zhong-cao-yao.html">中草药</a></li>
<li><a href="/category/zhong-yi.html">中医</a></li>
</ul></nav>
</header><!-- /#banner -->
<section id="content" class="body">
<article>
<header>
<h1 class="entry-title">
<a href="/data_warehouse_quick2.html" rel="bookmark"
title="Permalink to 数据仓库快速入门教程2数据库与数据仓库的差异">数据仓库快速入门教程2数据库与数据仓库的差异</a></h1>
</header>
<div class="entry-content">
<footer class="post-info">
<abbr class="published" title="2019-04-29T08:32:00+08:00">
Published: 一 29 四月 2019
</abbr>
<address class="vcard author">
By <a class="url fn" href="/author/andrew.html">andrew</a>
</address>
<p>In <a href="/category/da-shu-ju.html">大数据</a>.</p>
</footer><!-- /.post-info --> <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="_1">什么是数据库?</h2>
<p>数据库是相关数据的集合,代表现实世界的一些元素。 它旨在构建和填充特定任务的数据。 它也是数据解决方案的构建块。</p>
<h2 id="_2">什么是数据仓库?</h2>
<p>数据仓库是一种信息系统,用于存储来自单个或多个来源的历史和可交换数据。 它旨在分析,报告,整合来自不同来源的交易数据。</p>
<p>数据仓库简化了组织的分析和报告流程。 它也是组织决策和预测过程的单一版本。</p>
<h2 id="_3">为什么要使用数据库?</h2>
<p>这里是使用数据库系统的主要原因:</p>
<ul>
<li>它提供数据及其访问的安全性</li>
<li>数据库提供了各种存储和检索数据的技术。</li>
<li>数据库充当有效的处理程序,以使用相同的数据平衡多个应用程序的需求</li>
<li>DBMS提供完整性约束以获得高级别的保护,以防止访问禁止的数据。</li>
<li>数据库允许您以这样的方式访问并发数据,即一次只有一个用户可以访问相同的数据。</li>
</ul>
<h2 id="_4">为何使用数据仓库?</h2>
<p>这里是使用数据仓库的重要原因:</p>
<ul>
<li>数据仓库可帮助业务用户在一个位置访问来自某些来源的关键数据。</li>
<li>它提供有关各种跨职能活动的一致信息</li>
<li>帮助您集成许多数据源,以减轻生产系统的压力。</li>
<li>数据仓库可帮助您减少分析和报告的TAT(总周转时间)。</li>
<li>数据仓库可以帮助用户在一个地方访问来自不同来源的关键数据,从而节省用户从多个来源检索数据信息的时间。 您还可以轻松地从云访问数据。</li>
<li>数据仓库允许您存储大量历史数据,以分析不同的时段和趋势,以便进行未来预测。</li>
<li>增强运营业务应用程序和客户关系管理系统的价值</li>
<li>将分析处理与事务数据库分开,从而提高两个系统的性能</li>
<li>利益相关者和用户可能过高估计源系统中的数据质量。 数据仓库提供更准确的报告。</li>
</ul>
<h2 id="_5">数据库的特征</h2>
<ul>
<li>提供安全性并消除冗余</li>
<li>允许多个数据视图</li>
<li>数据库系统遵循ACID合规性(原子性,一致性,隔离性和持久性)。</li>
<li>允许程序和数据之间的绝缘</li>
<li>共享数据和多用户事务处理</li>
<li>关系数据库支持多用户环境</li>
</ul>
<h2 id="_6">数据仓库的特征</h2>
<ul>
<li>数据仓库以主题为导向,因为它提供与主题相关的信息,而不是公司正在进行的操作。</li>
<li>数据还需要以通用且一致可接受的方式存储在Datawarehouse中。</li>
<li>与其他操作系统相比,数据仓库的时间范围相对较大。</li>
<li>数据仓库是非易失性的,这意味着在输入新信息时不会擦除先前的数据。</li>
</ul>
<h2 id="_7">数据库和数据仓库之间的区别</h2>
<p><img alt="图片.png" src="https://upload-images.jianshu.io/upload_images/12713060-ac0435e8b7623b90.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<table>
<thead>
<tr>
<th align="center"><strong>参数</strong></th>
<th align="center"><strong>数据库</strong></th>
<th align="center"><strong>数据仓库</strong></th>
</tr>
</thead>
<tbody>
<tr>
<td align="center">目的</td>
<td align="center">旨在记录</td>
<td align="center">旨在分析</td>
</tr>
<tr>
<td align="center">处理方法</td>
<td align="center">数据库使用在线事务处理(OLTP Online Transactional Processing )</td>
<td align="center">数据仓库使用在线分析处理(OLAP)。</td>
</tr>
<tr>
<td align="center">用法</td>
<td align="center">该数据库有助于为您的企业执行基本操作</td>
<td align="center">数据仓库允许您分析您的业务。</td>
</tr>
<tr>
<td align="center">表和连接</td>
<td align="center">数据库的表和连接很复杂,因为它们是标准化的。</td>
<td align="center">表和联接在数据仓库中很简单,因为它们是非规范化的。</td>
</tr>
<tr>
<td align="center">取向</td>
<td align="center">是面向应用程序的数据集合</td>
<td align="center">它是面向主题的数据集合</td>
</tr>
<tr>
<td align="center">存储限制</td>
<td align="center">通常仅限于单个应用程序</td>
<td align="center">存储来自任意数量应用程序的数据</td>
</tr>
<tr>
<td align="center">可用性</td>
<td align="center">数据是实时可用的</td>
<td align="center">数据在需要时从源系统刷新</td>
</tr>
<tr>
<td align="center">用法</td>
<td align="center">ER建模技术用于设计。</td>
<td align="center">数据建模技术用于设计。</td>
</tr>
<tr>
<td align="center">技术</td>
<td align="center">捕获数据</td>
<td align="center">分析数据</td>
</tr>
<tr>
<td align="center">数据类型</td>
<td align="center">存储在数据库中的数据是最新的。</td>
<td align="center">当前和历史数据存储在数据仓库中。 可能不是最新的。</td>
</tr>
<tr>
<td align="center">存储数据</td>
<td align="center">Flat Relational Approach方法用于数据存储。</td>
<td align="center">Data Ware House对数据结构使用维度和规范化方法。 示例:星型和雪花模式。</td>
</tr>
<tr>
<td align="center">查询类型</td>
<td align="center">使用简单的事务查询。</td>
<td align="center">复杂查询用于分析目的。</td>
</tr>
<tr>
<td align="center">数据摘要</td>
<td align="center">详细数据存储在数据库中。</td>
<td align="center">它存储高度概括的数据。</td>
</tr>
</tbody>
</table>
<h2 id="_8">参考资料</h2>
<ul>
<li>下载:<a href="https://itbooks.pipipan.com/fs/18113597-368513654">https://itbooks.pipipan.com/fs/18113597-368513654</a></li>
<li>讨论qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞!</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a> </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li><a href="https://www.jianshu.com/p/35262e4cc65a">软件测试专家工具包3移动端</a></li>
<li><a href="https://www.jianshu.com/p/ab75be06ebb7">软件测试专家工具包2性能测试</a></li>
<li><a href="https://www.jianshu.com/p/be4da27b3260">软件测试专家工具包1web测试</a></li>
</ul>
<h2 id="_9">数据库的应用</h2>
<table>
<thead>
<tr>
<th align="center"><strong>场景</strong></th>
<th align="center"><strong>用法</strong></th>
</tr>
</thead>
<tbody>
<tr>
<td align="center">银行业</td>
<td align="center">在银行部门用于客户信息,账户相关活动,付款,存款,贷款,信用卡等。</td>
</tr>
<tr>
<td align="center">航空公司</td>
<td align="center">用于预订和日程安排信息。</td>
</tr>
<tr>
<td align="center">高校</td>
<td align="center">存储学生信息,课程注册,学院和结果。</td>
</tr>
<tr>
<td align="center">电信</td>
<td align="center">它有助于存储通话记录,每月账单,余额维护等。</td>
</tr>
<tr>
<td align="center">金融</td>
<td align="center">帮助您存储与股票和债券相关的股票,销售和购买信息。</td>
</tr>
<tr>
<td align="center">销售与生产</td>
<td align="center">用于存储客户,产品和销售详细信息。</td>
</tr>
<tr>
<td align="center">制造业</td>
<td align="center">它用于供应链的数据管理和跟踪物品的生产,库存状态。</td>
</tr>
<tr>
<td align="center">人事管理</td>
<td align="center">关于员工工资,扣除,薪水生成等的详细信息</td>
</tr>
</tbody>
</table>
<h2 id="_10">数据仓库的应用</h2>
<table>
<thead>
<tr>
<th align="center"><strong>场景</strong></th>
<th align="center"><strong>用法</strong></th>
</tr>
</thead>
<tbody>
<tr>
<td align="center">航空公司</td>
<td align="center">它用于航空公司系统管理操作,如船员分配,路线分析,乘客常旅客计划折扣计划等。</td>
</tr>
<tr>
<td align="center">银行业</td>
<td align="center">它被用于银行业,有效地管理桌面上可用的资源。</td>
</tr>
<tr>
<td align="center">医疗保健业</td>
<td align="center">数据仓库用于策略和预测结果,创建患者的治疗报告等。先进的机器学习,大数据使数据仓库系统可以预测疾病。</td>
</tr>
<tr>
<td align="center">保险业</td>
<td align="center">数据仓库广泛用于分析数据模式,客户趋势以及快速跟踪市场变动。</td>
</tr>
<tr>
<td align="center">保留链</td>
<td align="center">它可以帮助您跟踪项目,识别客户的购买模式,促销以及用于确定定价政策。</td>
</tr>
<tr>
<td align="center">电信</td>
<td align="center">在这个领域,数据仓库用于产品促销,销售决策和制定分销决策。</td>
</tr>
</tbody>
</table>
<h2 id="_11">数据库的缺点</h2>
<ul>
<li>实施数据库系统的硬件和软件成本很高,可以增加组织的预算。</li>
<li>许多DBMS系统通常是复杂的系统,因此需要对用户使用DBMS进行培训。</li>
<li>DBMS无法执行复杂的计算</li>
<li>系统兼容的问题</li>
<li>数据所有者可能会失去对其数据的控制,从而引发安全性,所有权和隐私问题。</li>
</ul>
<h2 id="_12">数据仓库的缺点</h2>
<ul>
<li>添加新数据源需要时间,并且与高成本相关。</li>
<li>有时与数据仓库相关的问题可能多年未被发现。</li>
<li>数据仓库是高维护系统。 提取,加载和清理数据可能非常耗时。</li>
<li>数据仓库可能看起来很简单,但实际上,它对于普通用户来说太复杂了。 您需要为最终用户提供培训,最终用户不会使用数据挖掘和仓库。</li>
<li>尽管在项目管理方面做出了最大努力,但数据仓库的范围总是会增加。</li>
</ul>
<h2 id="_13">什么最适合你?</h2>
<p>总而言之,我们可以说数据库有助于执行业务的基本操作,而数据仓库可以帮助您分析业务。 您可以根据业务目标选择其中一个。</p>
<h3 id="_14">参考资料</h3>
<ul>
<li>工作日技术支持QQ群 630011153 144081101</li>
<li><a href="https://china-testing.github.io/data_warehouse_quick2.html">本文最新版本地址</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞!</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a></li>
<li>道家技术-手相手诊看相中医等钉钉群21734177 qq群:391441566 184175668 338228106 看八字、风水、手相、面相、舌相、抽签、体质识别。服务费50元每人次起。请联系钉钉或者微信pythontesting</li>
<li><a href="https://china-testing.github.io/testing_training.html">接口自动化性能测试线上培训大纲</a></li>
</ul>
</div><!-- /.entry-content -->
</article>
</section>
<section id="extras" class="body">
<div class="blogroll">
<h2>links</h2>
<ul>
<li><a href="https://china-testing.github.io/testing_training.html">自动化性能接口测试线上及深圳培训与项目实战 qq群:144081101 591302926</a></li>
<li><a href="http://blog.sciencenet.cn/blog-2604609-1112306.html">pandas数据分析scrapy爬虫 521070358 Py人工智能pandas-opencv 6089740</a></li>
<li><a href="http://blog.sciencenet.cn/blog-2604609-1112306.html">中医解梦看相八字算命qq群 391441566 csdn书籍下载-python爬虫 437355848</a></li>
</ul>
</div><!-- /.blogroll -->
</section><!-- /#extras -->
<footer id="contentinfo" class="body">
<address id="about" class="vcard body">
Proudly powered by <a href="http://getpelican.com/">Pelican</a>, which takes great advantage of <a href="http://python.org">Python</a>.
</address><!-- /#about -->
<p>The theme is by <a href="http://coding.smashingmagazine.com/2009/08/04/designing-a-html-5-layout-from-scratch/">Smashing Magazine</a>, thanks!</p>
</footer><!-- /#contentinfo -->
</body>
</html>