亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 學院 > 操作系統 > 正文

Spark經典案例2-數據去重

2024-06-28 16:00:59
字體:
來源:轉載
供稿:網友

/** * 業務場景:數據去重問題 * Created by YJ on 2017/2/7. * 統計數據,盡量用reduceByKey,不要用groupByKey,優化點 * reduceByKey,在本機suffle后,再發送一個總map,發送到一個總機器上匯總,(匯總要壓力?。? * groupByKey,發送本機所有的map,在一個機器上匯總(匯總壓力大) */ /*

數據格式 flie1: 2012-3-1 a 2012-3-2 b 2012-3-3 c 2012-3-4 d 2012-3-5 a 2012-3-6 b 2012-3-7 c 2012-3-3 c flie2: 2012-3-1 b 2012-3-2 a 2012-3-3 b 2012-3-4 d 2012-3-5 a 2012-3-6 c 2012-3-7 d 2012-3-3 c */

package ClassicCaseimport org.apache.spark.{SparkConf, SparkContext}object case2 { def main(args: Array[String]): Unit = { val conf = new SparkConf().setMaster("local").setAppName("reduce") val sc = new SparkContext(conf) sc.setLogLevel("ERROR") //獲取數據 val two = sc.textFile("hdfs://192.168.109.130:8020//user/flume/ClassicCase/case2/*") two.filter(_.trim().length>0) //需要有空格。 .map(line=>(line.trim,""))//全部值當key,(key value,"") .groupByKey()//groupByKey,過濾重復的key value ,發送到總機器上匯總 .sortByKey() //按key value的自然順序排序 .keys.collect().foreach(PRintln) //所有的keys變成數組再輸出 //第二種有風險 two.filter(_.trim().length>0) .map(line=>(line.trim,"1")) .distinct() .reduceByKey(_+_) .sortByKey() .foreach(println) //reduceByKey,在本機suffle后,再發送一個總map,發送到一個總機器上匯總,(匯總要壓力?。? //groupByKey,發送本機所有的map,在一個機器上匯總(匯總壓力大) //如果數據在不同的機器上,則會出現先重復數據,distinct,reduceBykey,只是在本機上去重,謹慎一點的話,在reduceByKey后面需要加多一個distinct }}

輸出結果 2012-3-1 a 2012-3-1 b 2012-3-2 a 2012-3-2 b 2012-3-3 b 2012-3-3 c 2012-3-4 d 2012-3-5 a 2012-3-6 b 2012-3-6 c 2012-3-7 c 2012-3-7 d (2012-3-1 a,1) (2012-3-1 b,1) (2012-3-2 a,1) (2012-3-2 b,1) (2012-3-3 b,1) (2012-3-3 c,1) (2012-3-4 d,1) (2012-3-5 a,1) (2012-3-6 b,1) (2012-3-6 c,1) (2012-3-7 c,1) (2012-3-7 d,1)

reduceByKey和groupByKey區別與用法

(1)當采用reduceByKeyt時,Spark可以在每個分區移動數據之前將待輸出數據與一個共用的key結合。借助下圖可以理解在reduceByKey里究竟發生了什么。 注意在數據對被搬移前同一機器上同樣的key是怎樣被組合的(reduceByKey中的lamdba函數)。然后lamdba函數在每個區上被再次調用來將所有值reduce成一個最終結果。整個過程如下: 這里寫圖片描述

(2)當采用groupByKey時,由于它不接收函數,spark只能先將所有的鍵值對(key-value pair)都移動,這樣的后果是集群節點之間的開銷很大,導致傳輸延時。整個過程如下: 這里寫圖片描述

( 3 )區別 reduceByKey,在本機suffle后,再發送一個總map,發送到一個總機器上suffle匯總map,(匯總要壓力小) groupByKey,發送本機所有的map,在一個機器上suffle匯總map(匯總壓力大)

因此,在對大數據進行復雜計算時,reduceByKey優于groupByKey。 另外,如果僅僅是group處理,那么以下函數應該優先于 groupByKey :   (1)、combineByKey 組合數據,但是組合之后的數據類型與輸入時值的類型不一樣。  ?。?)、foldByKey合并每一個 key 的所有值,在級聯函數和“零值”中使用。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
色爱av美腿丝袜综合粉嫩av| 日韩电影免费观看中文字幕| 国产噜噜噜噜久久久久久久久| 久久777国产线看观看精品| 亚洲精品电影网在线观看| 国产高清在线不卡| 亚洲а∨天堂久久精品喷水| 欧美成人免费在线视频| 国产欧美一区二区三区视频| 国产成人精品电影久久久| 7m精品福利视频导航| 久久99热精品这里久久精品| 免费91麻豆精品国产自产在线观看| 中文字幕日本欧美| 国产日韩精品综合网站| 国产啪精品视频网站| 欧美性xxxx极品hd欧美风情| 欧美黑人一级爽快片淫片高清| 久久精品国产清自在天天线| 国产69精品久久久久久| 亚洲国产精品视频在线观看| 午夜剧场成人观在线视频免费观看| 欧美成人精品在线播放| 国内精品视频久久| 亚洲精品国产精品久久清纯直播| 亚洲人永久免费| 欧美一级大胆视频| 精品福利在线视频| 欧美精品久久久久久久久| 青青a在线精品免费观看| 日本高清视频精品| 日韩最新中文字幕电影免费看| 亚洲国产小视频| 精品调教chinesegay| 91精品免费视频| 91久久嫩草影院一区二区| 久久天天躁狠狠躁老女人| 久久久久久久久久久网站| 国产91网红主播在线观看| 一本大道久久加勒比香蕉| 国产一区二区三区中文| 久久久久久九九九| 久久综合国产精品台湾中文娱乐网| 亚洲精品美女在线观看播放| 亚洲精品免费网站| 欧美色视频日本高清在线观看| 日韩av片免费在线观看| 国产亚洲欧美日韩精品| 一区二区三区国产视频| 亚洲一区美女视频在线观看免费| 亚洲精品国产精品久久清纯直播| 精品国产精品三级精品av网址| 国产精品美女免费看| 中文字幕日韩有码| 欧美在线亚洲一区| 国产精品电影观看| 欧美一级高清免费播放| 成人国产精品色哟哟| 久久精品91久久香蕉加勒比| 亚洲国产成人爱av在线播放| 91在线免费网站| 欧美电影在线免费观看网站| 日韩欧美在线观看视频| 91亚洲va在线va天堂va国| 欧美日韩在线第一页| 国产精品av电影| 欧美wwwxxxx| 97avcom| 97视频人免费观看| 成人午夜黄色影院| 国产精品爱久久久久久久| 日本精品va在线观看| 色视频www在线播放国产成人| 欧美激情一区二区三区成人| 欧美日韩国产中文字幕| 亚洲级视频在线观看免费1级| 亚洲成人久久一区| 国产丝袜一区二区三区| 亚洲自拍偷拍区| 国产剧情久久久久久| 亚洲欧美制服中文字幕| 操日韩av在线电影| 国产精品∨欧美精品v日韩精品| 欧美在线一级视频| 91欧美激情另类亚洲| 亚洲国产精品美女| 日韩欧美在线网址| 欧美日韩电影在线观看| 美女扒开尿口让男人操亚洲视频网站| 久久精品久久久久| 久久久久久久久久婷婷| 亚洲国产精品系列| 日韩在线www| 成人做爰www免费看视频网站| 国产高清视频一区三区| 久久影视免费观看| 国产精品欧美久久久| 午夜精品蜜臀一区二区三区免费| 精品无人区太爽高潮在线播放| 亚洲精品www久久久| 日韩av电影国产| 欧美一级成年大片在线观看| 国产精品久在线观看| 国产亚洲免费的视频看| 97婷婷大伊香蕉精品视频| 一区国产精品视频| 日韩欧美在线国产| 亚洲日本中文字幕免费在线不卡| 成人av在线亚洲| 91亚洲国产精品| 国产精品免费小视频| 精品亚洲永久免费精品| 欧美一级视频在线观看| 中文字幕在线看视频国产欧美在线看完整| 欧美性色视频在线| 亚洲激情视频在线观看| 成人动漫网站在线观看| 国产激情久久久| 欧美亚洲激情在线| 国产精品日日做人人爱| 黑人巨大精品欧美一区二区免费| 午夜精品一区二区三区视频免费看| 精品五月天久久| 成人黄色激情网| 日韩在线视频播放| 欧美国产日韩一区| 91po在线观看91精品国产性色| 国产精品美女免费| 欧美性猛交xxxx乱大交蜜桃| 热99精品只有里视频精品| 久久久亚洲网站| 国产精品一区二区久久国产| 欧美国产亚洲精品久久久8v| 国模精品一区二区三区色天香| 精品国产一区av| 欧美日韩国产999| 久久久中文字幕| 成人福利在线观看| 欧美一区二区.| 亚洲精品天天看| 成人乱人伦精品视频在线观看| 国产伊人精品在线| 精品久久久久久中文字幕大豆网| 久久久国产精彩视频美女艺术照福利| 日本中文字幕久久看| 日韩视频欧美视频| 国产精品日韩在线播放| 久久久久久中文字幕| 欧美日韩成人精品| 日韩中文字幕免费视频| 91啪国产在线| 色多多国产成人永久免费网站| 青青草99啪国产免费| 91香蕉亚洲精品| 中文字幕日韩高清| 久久久久久噜噜噜久久久精品| 久操成人在线视频| 91国内免费在线视频| 日韩视频亚洲视频| 欧美亚洲国产日韩2020| 国产精品99久久99久久久二8| 国产在线高清精品| 国产日本欧美一区二区三区在线| 亚洲国产成人91精品|