[翻译][Spark In Action 中文版][Spark 实战 ]1.6 总结

1.6 总结

■  Apache Spark是一种令人兴奋的新技术,它迅速取代Hadoop的MapReduce作为首选大数据处理平台。
■  Spark程序的速度可以比MapReduce快100倍。
■  Spark支持Java,Scala,Python和R语言。
■  使用Sp[……]

[yol出品] 全文阅读 >>

[翻译][Spark In Action 中文版][Spark 实战 ]1.5 启动spark-in-action的虚拟机

1.5 启动spark-in-action的虚拟机

为了方便您设置Spark学习环境,我们准备了一个虚拟机(VM),您将在本书中使用它。 它将允许您运行所有的例子从书中没有惊喜,由于不同版本的Java,Spark或您的操作系统。 例如,在Windows上运行Spark示例时可能会遇到问[……]

[yol出品] 全文阅读 >>

[翻译][Spark In Action 中文版][Spark 实战 ]1.4 Spark 生态

1.4 Spark 生态

我们已经提到了Hadoop生态系统,包括接口,分析,集群管理和基础设施工具。 一些最重要的如图1.6所示。
图1.6不是完整的7你可能会说我们没有添加一个工具,但是一个完整的工具列表将很难适应这一节。 但我们认为,这个列表代表了Hadoop生态系统中最突出的[……]

[yol出品] 全文阅读 >>

[翻译][Spark In Action 中文版][Spark 实战 ]1.3 Spark 程序流

1.3 Spark 程序流

让我们看看一个典型的Spark程序是什么样子。 假设一个300 MB的日志文件存储在一个三节点HDFS集群中。 HDFS自动将文件拆分为128 MB部分(Hadoop术语中的块),并将每个部分放在集群的单独节点上(见图1.3)。 让我们假设Spark在YAR[……]

[yol出品] 全文阅读 >>

[翻译][Spark In Action 中文版][Spark 实战 ]1.2 Spark 组件

1.2 Spark 组件

Spark由多个专用组件组成。 这些是Spark Core,Spark SQL,Spark Streaming,Spark GraphX和Spark MLlib,如图1.2所示。
这些组件使Spark成为一个功能齐全的统一平台:它可以用于以前必须使用几个不同框架[……]

[yol出品] 全文阅读 >>

Java通过Jackson操作json的通用类JsonUtil

Jackson操作Json是公认性能最好的,于是手写了操作Json的公共类,使用jackson 2.0以上版本

最主要的用法是把任何对象转化为String的方法

然后是再反序列化的方法

这个方法有重构,一个参数是返回Map,两个参数是返回的List,注意泛型是可以传参数

详细代码如下


本文http://www.paymoon.com:8001/index.php/2016/12/27/operate-json-by-jackson-on-java/

如果转载请联系 龙遥Yol  i@paymoon.com


这个类可以结合RedisUtilSimple做缓存的操作,会使序列化和缓存非常方便。

[……]

[yol出品] 全文阅读 >>

Java操作Redis 缓存公共类 RedisUtil 和 RedisUtilSimple

写了一个Redis的公共类,包含两个,一个是Redis 申请和关闭的工具,一个是存取的工具。当然写一个也可以,分开了而已。

main方法里面有简单使用,直接获取和使用完关闭即可。注意关闭的时候,可以多次close,
[crayo[……]

[yol出品] 全文阅读 >>