Browse Source

add da process

Fengda HUANG 9 years ago
parent
commit
2f8d099b2a
3 changed files with 31 additions and 1 deletions
  1. 9 0
      chapters/5.1.1-da.md
  2. 9 0
      growth.md
  3. 13 1
      index.html

+ 9 - 0
chapters/5.1.1-da.md

@@ -3,6 +3,11 @@
 
 数据分析是一个很有意思的过程,也是一个非常重要的过程。
 
+###识别需求
+
+> 识别信息需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。
+
+###收集数据
 
 ####Hadoop分析数据
 
@@ -14,4 +19,8 @@ HDF是一个分布式文件系统(Hadoop Distributed File System)。它有
 
 MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归纳)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。
 
+###可视化数据
+
+###改进
+
 参考来源: **精益数据分析**。

+ 9 - 0
growth.md

@@ -3643,6 +3643,11 @@ application cahce是将大部分图片资源、js、css等静态资源放在mani
 
 数据分析是一个很有意思的过程,也是一个非常重要的过程。
 
+###识别需求
+
+> 识别信息需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。
+
+###收集数据
 
 ####Hadoop分析数据
 
@@ -3654,6 +3659,10 @@ HDF是一个分布式文件系统(Hadoop Distributed File System)。它有
 
 MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归纳)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。
 
+###可视化数据
+
+###改进
+
 参考来源: **精益数据分析**。
 
 用户数据分析:Google Analytics

+ 13 - 1
index.html

@@ -254,7 +254,12 @@ code > span.in { color: #60a0b0; font-weight: bold; font-style: italic; } /* Inf
 </ul></li>
 <li><a href="#数据分析">数据分析</a><ul>
 <li><a href="#构建-衡量-学习">构建-衡量-学习</a></li>
-<li><a href="#数据分析-1">数据分析</a></li>
+<li><a href="#数据分析-1">数据分析</a><ul>
+<li><a href="#识别需求">识别需求</a></li>
+<li><a href="#收集数据">收集数据</a></li>
+<li><a href="#可视化数据">可视化数据</a></li>
+<li><a href="#改进">改进</a></li>
+</ul></li>
 <li><a href="#用户数据分析google-analytics">用户数据分析:Google Analytics</a><ul>
 <li><a href="#受众群体">受众群体</a></li>
 <li><a href="#流量获取">流量获取</a></li>
@@ -2855,6 +2860,11 @@ System.<span class="fu">out</span>.<span class="fu">println</span>(<span class="
 <h4 id="数据-学习">数据-学习</h4>
 <h2 id="数据分析-1">数据分析</h2>
 <p>数据分析是一个很有意思的过程,也是一个非常重要的过程。</p>
+<h3 id="识别需求">识别需求</h3>
+<blockquote>
+<p>识别信息需求是确保数据分析过程有效性的首要条件,可以为收集数据、分析数据提供清晰的目标。</p>
+</blockquote>
+<h3 id="收集数据">收集数据</h3>
 <h4 id="hadoop分析数据">Hadoop分析数据</h4>
 <blockquote>
 <p>Hadoop是一个由Apache基金会所开发的分布式系统基础架构。它可以让用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。</p>
@@ -2862,6 +2872,8 @@ System.<span class="fu">out</span>.<span class="fu">println</span>(<span class="
 <p>Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。</p>
 <p>HDF是一个分布式文件系统(Hadoop Distributed File System)。它有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。同时,HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。</p>
 <p>MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(归纳)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。</p>
+<h3 id="可视化数据">可视化数据</h3>
+<h3 id="改进">改进</h3>
 <p>参考来源: <strong>精益数据分析</strong>。</p>
 <h2 id="用户数据分析google-analytics">用户数据分析:Google Analytics</h2>
 <p>Google Analytics是一个非常赞的分析工具,而且它不仅仅可以用于Web应用,也可以用于移动应用。</p>