近年來大數據技術人才層出不窮,但無論如何求職者只有經過層層面試才能獲得施展才華的機會,而面試的首關就是一套技術面試題,所以中公優就業小編整理了一些常見的大數據面試題,希望對大家有幫助。
1、舉一個簡單的例子說明mapreduce是怎么來運行的 ?
2、secondarynamenode的主要職責是什么?簡述其工作機制
3、Sqoop用起來感覺怎樣?
4、kafka 數據高可用的原理是什么
5、MapReduce 中排序發生在哪幾個階段?這些排序是否可以避免?為什么?
6、100w 個數中找出最大的 100 個數。
7、一個文本文件,大約有一萬行,每行一個詞,要求統計出其中最頻繁出現的前10個詞,請給出思想,給出時間復雜度分析。
8、已知某個文件內包含一些電話號碼,每個號碼為8位數字,統計不同號碼的個數。
9、有一千萬條短信,有重復,以文本文件的形式保存,一行一條,有重復。 請用 5 分鐘時間,找出重復出現最多的前 10 條。
10、每個文件至少有1000萬行,請用程序完成以下工作,
1)每個文件的個子的IP
2)出現在b.text而沒有出現在a.text的IP
3)每個user出現的次數以及每個user對應的IP的個數
相關推薦:
更多內容
>>本文地址:http://www.jecan.cn/jiuye/2018/45570.html
聲明:本站稿件版權均屬中公教育優就業所有,未經許可不得擅自轉載。
1 您的年齡
2 您的學歷
3 您更想做哪個方向的工作?