[翻译][Spark In Action][Spark 实战 ]1.1 Spark是什么

1.1  Spark 是什么

Apache Spark 是一种令人兴奋的新技术,它迅速取代Hadoop 的MapReduce 作为首选大数据处理平台。

Hadoop 是一个开源的,分布式的Java 计算框架,由Hadoop 分布式文件系统(HDFS)和MapReduce 的执行引擎组成。[……]

[yol出品] 全文阅读 >>

Spark体系架构/内存分配/集群模式JVM分配/Partition

最近看到一篇关于Spark架构的博文,作者是 Alexey Grishchenko。看过Alexey博文的同学应该都知道,他对Spark理解地非常深入,读完他的 “spark-architecture” 这篇博文,有种醍醐灌顶的感觉,从JVM内存分配到Spark集群的资源管理,步步深入,感触颇多。因[……]

[yol出品] 全文阅读 >>