大家好,今天小编关注到一个比较有意思的话题,就是关于大数据 spark的问题,于是小编就整理了1个相关介绍大数据 spark的解答,让我们一起看看吧。
Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。 优势应该在于分布式架构比较相似能快速上手吧
到此,以上就是小编对于大数据 spark的问题就介绍到这了,希望介绍关于大数据 spark的1点解答对大家有用。