实战IT培训机构_IT培训班选大学生IT技术培训中心_中公优就业

400-650-7353
您所在的位置:首頁 > IT干貨資料 > 大數據 > 【大數據基礎知識】Spark算子介紹及map算子的使用

【大數據基礎知識】Spark算子介紹及map算子的使用

  • 發布: 大數據培訓
  • 來源:大數據干貨資料
  • 2021-07-07 18:48:01
  • 閱讀()
  • 分享
  • 手機端入口

進入到大數據圈的朋友們都對Spark的強大功能有所了解,那么提到Spark,我們就想到了其中的算子,Spark的強大功能如何實現,自然離不開其中的算子了。怎么理解這些算子呢,我們可以簡單把它理解為方法或函數,Spark已經定義好了很多功能強大的方法或函數,在這里稱為算子。

Spark中的算子分為兩類:一是轉換類算子(Transformation),二是行動類算子(Action)。轉換類算子執行后得到新的RDD,并且不會立即執行,需要有行動類算子觸發才能執行。行動類算子是立即執行的,并且執行后得到的不再是RDD。

這次,我們用命令行的方式先來看看這些算子如何使用。

首先,我們進入spark-shell命令行方式:

[root@node2 ~]# spark-shell --master spark://node1:7077

執行上面命令后,就進入了命令行方式:

此時,我們就可以測試使用Spark中的算子了。

有一點我們要注意的 ,這些算子都是作用在RDD上,所以我們首先要得到RDD。

map算子

map算子實現的是一一映射。

對某一個rdd執行map,rdd中每一條數據都會執行操作。也就是說rdd中有幾條數據,就會被迭代幾次。

執行map算子后返回值的數據類型,取決于給map傳遞的函數的返回值類型。

scala> val rdd=sc.makeRDD(List(1,2,3,4,5,6,7),3)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[3] at makeRDD at :24

首先,我們通過makeRDD,將一個list轉換成RDD,并且指定分區數為3。

scala> val rdd1=rdd.map(_>5)

rdd1: org.apache.spark.rdd.RDD[Boolean] = MapPartitionsRDD[4] at map at :26

執行map算子,傳遞的函數是判斷元素是否大于5,結果得到一個新的的RDD,并且元素類型是Boolean類型。由此我們也可以看到,結果RDD的元素類型就是由傳入map算子的函數決定的。

此時,實際上還沒有真正執行,我們需要使用一個Action算子觸發執行。

scala> rdd1.collect

[Stage 0:===================> res0: Array[Boolean] = Array(false, false, false, false, false, true, true)

我們使用collect算子觸發執行,得到結果。Collect算子是Action類算子,是將結果回收到客戶端。在生產環境中,要慎用此算子。我們測試中因為數據量非常小,用此算子是沒有問題的。

文章“【大數據基礎知識】Spark算子介紹及map算子的使用”已幫助

>>本文地址:http://www.jecan.cn/zhuanye/2021/69184.html

THE END  

聲明:本站稿件版權均屬中公教育優就業所有,未經許可不得擅自轉載。

1 您的年齡

2 您的學歷

3 您更想做哪個方向的工作?

獲取測試結果
  • 大前端大前端
  • 大數據大數據
  • 互聯網營銷互聯網營銷
  • JavaJava
  • Linux云計算Linux
  • Python+人工智能Python
  • 嵌入式物聯網嵌入式
  • 全域電商運營全域電商運營
  • 軟件測試軟件測試
  • 室內設計室內設計
  • 平面設計平面設計
  • 電商設計電商設計
  • 網頁設計網頁設計
  • 全鏈路UI/UE設計UI設計
  • VR/AR游戲開發VR/AR
  • 網絡安全網絡安全
  • 新媒體與短視頻運營新媒體
  • 直播帶貨直播帶貨
  • 智能機器人軟件開發智能機器人
 

快速通道fast track

近期開班時間TIME

主站蜘蛛池模板: 万烁建筑设计院-建筑设计公司加盟,设计院加盟分公司,市政设计加盟 | 环氧铁红防锈漆_环氧漆_无溶剂环氧涂料_环氧防腐漆-华川涂料 | 武汉高温老化房,恒温恒湿试验箱,冷热冲击试验箱-武汉安德信检测设备有限公司 | 螺旋丝杆升降机-SWL蜗轮-滚珠丝杆升降机厂家-山东明泰传动机械有限公司 | 贵州水玻璃_-贵阳花溪闽兴水玻璃厂 | 软膜天花_软膜灯箱_首选乐创品牌_一站式天花软膜材料供应商! | 齿轮减速电机一体机_蜗轮蜗杆减速马达-德国BOSERL齿轮减速机带电机生产厂家 | 石家庄小程序开发_小程序开发公司_APP开发_网站制作-石家庄乘航网络科技有限公司 | 点焊机-缝焊机-闪光对焊机-电阻焊设备生产厂家-上海骏腾发智能设备有限公司 | 微信聊天记录恢复_手机短信删除怎么恢复_通讯录恢复软件下载-快易数据恢复 | 气力输送设备_料封泵_仓泵_散装机_气化板_压力释放阀-河南锐驰机械设备有限公司 | 中开泵,中开泵厂家,双吸中开泵-山东博二泵业有限公司 | 档案密集架_电动密集架_移动密集架_辽宁档案密集架-盛隆柜业厂家现货批发销售价格公道 | 上海瑶恒实业有限公司|消防泵泵|离心泵|官网 | 环境模拟实验室_液体-气体控温机_气体控温箱_无锡双润冷却科技有限公司 | 扫地车厂家-山西洗地机-太原电动扫地车「大同朔州吕梁晋中忻州长治晋城洗地机」山西锦力环保科技有限公司 | 深圳市超时尚职业培训学校,培训:月嫂,育婴,养老,家政;化妆,美容,美发,美甲. | 工业制氮机_psa制氮机厂家-宏骁智能装备科技江苏有限公司 | 不锈钢拉手厂家|浴室门拉手厂家|江门市蓬江区金志翔五金制品有限公司 | 百度关键词优化_网站优化_SEO价格 - 云无限好排名 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 | 磁力轮,磁力联轴器,磁齿轮,钕铁硼磁铁-北京磁运达厂家 | 高低温万能试验机_拉力试验机_拉伸试验机-馥勒仪器科技(上海)有限公司 | 单电机制砂机,BHS制砂机,制沙机设备,制砂机价格-正升制砂机厂家 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 温室大棚建设|水肥一体化|物联网系统 | 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 硫酸钡厂家_高光沉淀硫酸钡价格-河南钡丰化工有限公司 | 二手注塑机回收_旧注塑机回收_二手注塑机买卖 - 大鑫二手注塑机 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 断桥铝破碎机_发动机破碎机_杂铝破碎机厂家价格-皓星机械 | 北京浩云律师事务所-法律顾问_企业法务_律师顾问_公司顾问 | 加中寰球移民官网-美国移民公司,移民机构,移民中介,移民咨询,投资移民 | 山东彩钢板房,山东彩钢活动房,临沂彩钢房-临沂市贵通钢结构工程有限公司 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 电液推杆生产厂家|电动推杆|液压推杆-扬州唯升机械有限公司 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 郑州水质检测中心_井水检测_河南废气检测_河南中环嘉创检测 | 优考试_免费在线考试系统_培训考试系统_题库系统_组卷答题系统_匡优考试 | 定制/定做衬衫厂家/公司-衬衫订做/订制价格/费用-北京圣达信 | 真空吸污车_高压清洗车厂家-程力专用汽车股份有限公司官网 | 中国玩具展_玩具展|幼教用品展|幼教展|幼教装备展 |