大数据技术原理与应用第11讲：流计算-白红宇

大数据技术原理与应用第11讲：流计算

阅读量：4106 次

发布时间：2019-05-25

本文共 612 字，大约阅读时间需要 2 分钟。

流计算秉承一个基本理念，即数据的价值随着时间的流逝而，如用户点击流。

A.不确定

B.不变

C.降低

D.升高

Hadoop运行的是MapReduce任务，类似地，Storm运行的任务叫做。

A.Topology

B.Tuple

C.Spout

D.Bolt

对于一个流计算系统来说，它应达到如下哪些需求

A.海量式

B.高性能

C.可靠性

D.分布式

数据采集系统的基本架构包括哪些部分

A.Controller

B.Agent

C.Store

D.Collector

以下哪些是开源的流计算框架

A.Yahoo! S4

B.IBM InfoSphere Streams

C.Twitter Storm

D.Facebook Puma

Storm中的Stream Groupings有哪几种方式

A.直接分组

B.广播发送

C.按照字段分组

D.全局分组

Spark Streaming和Storm最大的区别在于：Spark Streaming无法实现毫秒级的流计算，而Storm可以实现毫秒级响应。

对

流计算处理过程一般包含三个阶段：数据实时采集，数据实时计算和实时查询服务。

Spark Streaming最主要的抽象是DStream，中文全称是离散化数据流，表示连续不断的数据流。

Storm的流数据单位是 Tuple，Spark Streaming的流数据单位是DStream，Samza的流数据单位是消息。

转载地址：http://ppssi.baihongyu.com/

你可能感兴趣的文章

《融入动画技术的交互应用》主题博文推荐

查看>>

链睿和家乐福合作推出下一代零售业隐私保护技术

查看>>

Unifrax宣布新建SiFAB™生产线

查看>>

艾默生纪念谷轮™在空调和制冷领域的百年创新成就

查看>>

NEXO代币持有者获得20,428,359.89美元股息

查看>>

Piper Sandler为EverArc收购Perimeter Solutions提供咨询服务

查看>>

RMRK筹集600万美元，用于在Polkadot上建立先进的NFT系统标准

查看>>

JavaSE_day12 集合

查看>>

JavaSE_day14 集合中的Map集合_键值映射关系

day-22 mysql_SQL 结构化查询语言