自慰套教室～女子全员妊娠,精品无码国产自产拍在线观看蜜桃,亚洲国产精品成人精品无码区,久别的草原在线看视频免费

<table id="gg82g"><noscript id="gg82g"></noscript></table>

微信
電話

復制成功

微信號:togogoi

添加微信好友, 詳細了解課程

已復制成功，如果自動跳轉微信失敗，請前往微信添加好友

打開微信

新聞資訊

開始學習

業界新聞

當前位置：首頁 > >業界新聞 > >

Spark框架

發布時間： 2022-03-09 16:08:53

Spark框架是一個快速且API豐富的內存計算框架。Spark采用Scala語言編寫，Scala是基于JVM的語言，性能開銷小。

在Spark，一切計算都是基于RDD句柄來進行操作的。RDD就像一個數據容器，可以有輸入口，可以有輸出口。在內存中，Spark使用Tachyon——一種類似于內存中的HDFS的內存分布式存儲框架，這樣使得讀寫速度有了極大的提高(官方說是100倍)。

Spark提供了大量的應用程序接口，如Python、Scala、Java以及SQL接口，還可以使用HDFS、Hive、Cassandra等作為數據源，它的外部接口非常豐富，而且自身支持了很多組件，主要組件如圖所示。

Spark的組件

1.Spark Core

Spark Core是指Spark的核心功能，包括任務調度、內存分配回收、RDD(彈性分布式數據集，Resilient Distributed Dataset)操作、API處理等，是Spark的核心組件。

2.Spark SQL

Spark SQL最早采用了Apache Hive的SQL版本，當時被稱作Shark，它可以讓用戶通過SQL來操作RDD，，而且能夠支持交互方式的數據訪問。但是因為效率不高，在1.0版本重新編寫了Spark SQL來取代HQL(Hive版本的SQL，也有的資料上會寫作HiveQL)，使用SQL操作Spark RDD大大降低了Spark編程的難度。

3.Spark Streaming

Spark Streaming是流式計算組件。在Spark Streaming里，流處理實際用的是Micro-Batch的方式，即微批處理。什么是Micro-Batch?Batch是批處理的意思，就是一次性處理需要的事務，中間不需要和人進行交互。而Micro-Batch處理的對象是以毫秒為單位的微小的批處理。

可以在內存里把輸入的流數據“攢”夠1秒、2秒或者其他時間長度，然后把攢起來的數據當做一個RDD塊。一個RDD塊上能夠進行什么計算和操作，那么這個Micro-Batch上就能夠進行同樣的計算和操作。為了避免提交作業過于頻繁而導致開銷占比過大的問題，通常不推薦去做毫秒級別的Micro-Batch，請大家注意這點。

4.MLlib

MLlib是Spark的機器學習(ML)組件，提供了大量的可集群化的算法，包括聚類、分類、邏輯回歸、協同過濾等。

5.GraphX

GraphX是可以進行集群化的圖形計算和圖形挖掘組件。這種組件非常適合用于微信、微博等各種社交網絡產品的用戶關系或者產品關系計算，這比用笛卡兒積的方式去做還是輕量很多。

這些封裝好的組件都為使用Spark提供了很大的便利，再加上友好的API、比Hadoop更快的處理速度，使Spark逐漸搶占Hadoop的市場份額，在開源大數據計算中出現的頻率越來越高。接下來安裝Spark并用Spark來演示如何進行單詞統計(WordCount)。

您可能也喜歡：

QQ空間新浪微博騰訊微博人人網微信更多

上一篇：怎么安裝Spark

下一篇：如何安裝Hadoop

客服熱線

18922156670

微信咨詢：togogoi

全國校區

廣州總校區：廣州市天河區科韻路棠安路188號樂天大廈2樓整層
深圳分校區：深圳市南山區南油第四工業區2棟602室
其他城市校區為流動地址,請聯系網站客服獲取校區地址

關注我們

Copyright © 2018-2023 廣州騰科網絡技術有限公司 All rights reserved 粵ICP備12042194號

點擊QQ咨詢
聯系電話：18922156670
在線咨詢

在線咨詢 ×

您好，請問有什么可以幫您？我們將竭誠提供最優質服務！

QQ咨詢下次再說

<蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>