亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > Linux Shell > 正文

shell兩個文件去重的多種姿勢

2020-07-27 18:59:50

字體：大中小

來源：轉載

供稿：網友

前言

大家都知道shell在文本處理上確有極大優勢，比如多文本合并、去重等，但是最近遇到了一個難搞的問題，即兩個大數據量文件去重。下面來看看詳細的介紹吧。

要求

有txt文件A.txt和B.txt。

其中A為關鍵詞和搜索量，以逗號分隔，約90萬行。

B為關鍵詞，約400萬行。

需要從A中找出與B重復的關鍵詞。

我試了N種姿勢，但結果都不盡人意，最奇怪的是有些方法對小數據量的測試文件有用，一旦用在A與B上就會失敗，真叫人百思不得其解。

姿勢一：

awk -F, '{print $1}' A >keywords.txtcat keywords.txt B.txt | sort | uniq -d #先從A.txt種取出關鍵詞，然后與B.txt一起打開，用sort排序，uniq -d 取出重復的行

姿勢二：

awk -F, '{print $1}' A >keywords.txt#照例先取出關鍵詞 comm -1 -2 keywords.txt B.txt#利用comm命令，顯示兩個文件都存在的行

姿勢三：

awk -F, '{print $1}' A >keywords.txtfor i in `cat keywords.txt`do  A=`egrep -c "^$i$" B.txt`  if [ $A != 0 ]  then    echo $i >>重復關鍵詞.txt  fidone #這種姿勢就稍微復雜點#首先取出關鍵詞，然后利用for循環逐個去B.txt里面匹配（注意正則寫法^$i$），如果匹配到的結果數不為0，說明這個關鍵詞是重復的，然后輸出#這種方法的優點是穩妥，缺點是效率太TM低了，90萬個詞逐一與400萬詞匹配，shell默認又沒有多線程，耗時太長。

姿勢四：

awk -F, '{print $1}' A >keywords.txtcat keywords.txt B.txt | awk '!a[$1]++' #這個方法的原理其實我不太懂，awk命令實在太強大太高深了，但是這種方法又簡潔又快速

其實還有一種grep -v 、grep -f 的方法，但是我沒有試過，所以不在這里列出了。

總結

以上就是這篇文章的全部內容了，希望本文的內容對大家的學習或者工作能帶來一定的幫助，如果有疑問大家可以留言交流。

上一篇：Shell交互批量更改主機名的方法

下一篇：用Shell判斷字符串包含關系的方法小結

學習交流

選擇筆記本處理器（CPU）需避免那些誤區和基

選擇筆記本處理器（CPU）需避免那些誤區和基本常識...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

中國移動6月凈增5G套餐用戶1459萬戶累計達7019.9萬戶

2020-07-20 18:48:56

螞蟻集團計劃在科創板和港交所同步上市估值超2000億美元

2020-07-20 18:46:41

傳滴滴最快年內在香港IPO 目標估值800億美元

2020-07-20 18:43:20

小鵬汽車宣布C+輪融資近5億美元高瓴紅杉等為主要投資者

2020-07-20 18:35:48

微博內測熱搜定制功能你可以愉快地吃瓜了嗎？

2020-07-17 23:29:31

Twitter證實：黑客一共瞄準130個名人賬號

2020-07-17 23:24:56

疑難解答

圖片精選

網友關注

亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

久久精品这里热有精品| 国产v综合v亚洲欧美久久| 国产一区玩具在线观看| 中文字幕日韩av电影| 亚洲国产私拍精品国模在线观看| 国产成人亚洲综合青青| 国产精品中文久久久久久久| 国产精品日韩专区| 海角国产乱辈乱精品视频| 色偷偷av亚洲男人的天堂| 亚洲国产欧美一区二区丝袜黑人| 91高潮精品免费porn| 欧美国产在线电影| 日韩精品有码在线观看| 国产精品久久久久久久电影| 欧美激情视频免费观看| 18一19gay欧美视频网站| 欧美丰满老妇厨房牲生活| 亚洲一级一级97网| 精品国产一区二区三区四区在线观看| 国产成人精品a视频一区www| 精品久久久久久中文字幕| 国产九九精品视频| 欲色天天网综合久久| 国产精品一区二区久久国产| 亚洲男人天堂2019| 国产日韩欧美视频| 69精品小视频| 欧美极品xxxx| 亚洲毛片在线免费观看| 美女啪啪无遮挡免费久久网站| 久久久久久久久久久免费精品| 日韩h在线观看| 久久久97精品| 国内精品久久久久伊人av| 亚洲综合小说区| 久久久久久69| 国产精品久久久久不卡| 国产精品稀缺呦系列在线| 欧美国产日韩中文字幕在线| 成人午夜两性视频| 日韩在线欧美在线| 日本精品一区二区三区在线播放视频| 欧美一级黄色网| 韩国精品久久久999| 91香蕉嫩草神马影院在线观看| www.日韩视频| 欧美成人免费全部观看天天性色| 久久久久亚洲精品成人网小说| 欧美一区二区三区精品电影| 国产欧美日韩精品丝袜高跟鞋| 成人免费淫片视频软件| 欧美日韩国产丝袜美女| 国产精品直播网红| 国产精品欧美日韩久久| 国产激情999| 国产精品美女久久久久久免费| 中文字幕久热精品在线视频| 欧美精品电影在线| 日韩欧美极品在线观看| 欧美在线视频a| 日韩欧美国产中文字幕| 性色av一区二区三区在线观看| 国产精品va在线播放我和闺蜜| 7m精品福利视频导航| 欧美在线观看www| 亚洲一区精品电影| 97**国产露脸精品国产| 欧美激情免费视频| 久久亚洲国产精品成人av秋霞| 亚洲乱码一区av黑人高潮| 久久激情五月丁香伊人| 国产噜噜噜噜久久久久久久久| 全色精品综合影院| 国产精品网址在线| 992tv成人免费影院| 亚洲综合中文字幕在线| 欧美成人一区在线| 国产亚洲欧美另类中文| 69av视频在线播放| 成人黄色午夜影院| 亚洲欧美精品在线| 国产精品成人v| 欧美成人午夜影院| 久久亚洲国产精品成人av秋霞| 欧美在线观看www| 国产日韩精品入口| 欧美猛男性生活免费| 国产日韩综合一区二区性色av| 国产精品久久久久久久av大片| 2021久久精品国产99国产精品| 欧美性猛交xxxx乱大交| 国产精品久久久久77777| 亚洲欧美精品伊人久久| 国产日产久久高清欧美一区| 成人黄色免费看| 欧美伊久线香蕉线新在线| 久久91超碰青草是什么| 国产有码在线一区二区视频| 色噜噜狠狠狠综合曰曰曰88av| 亚洲电影第1页| 668精品在线视频| 色综合天天狠天天透天天伊人| 狠狠综合久久av一区二区小说| 亚洲电影在线观看| 日韩在线视频观看正片免费网站| 国产精品久久久久免费a∨大胸| 亚洲视频在线观看视频| 日韩视频亚洲视频| 日韩欧美综合在线视频| 午夜精品一区二区三区在线| 欧美专区在线视频| 久久久久久欧美| 色一情一乱一区二区| 最新69国产成人精品视频免费| 久久精品中文字幕免费mv| 精品久久久久久久久久久久| 91精品久久久久久综合乱菊| 欧美日韩国产色| 亚洲最大在线视频| 国产成人aa精品一区在线播放| 亚洲free性xxxx护士hd| 亚洲色图在线观看| 国产一区二区丝袜| 国产精品视频地址| 国产91网红主播在线观看| 久久中文久久字幕| 97在线视频免费看| 亚洲精品综合久久中文字幕| 日韩在线视频免费观看高清中文| 国产福利精品在线| 成人av在线网址| 国产网站欧美日韩免费精品在线观看| 亚洲韩国欧洲国产日产av| 日韩精品高清在线观看| 亚洲一区二区福利| 国产视频福利一区| 欧美日韩精品在线视频| 欧美乱大交xxxxx| www.亚洲一二| 中文字幕欧美日韩| 亚洲精品国产综合久久| 久久久精品国产| 欧美日韩国产精品专区| 成人午夜两性视频| 国产精品欧美风情| 亚洲综合色激情五月| 国产日产欧美a一级在线| 亚洲欧美激情四射在线日| 国产丝袜一区二区三区| 精品福利免费观看| 久久久久久久91| 成人福利网站在线观看11| 久热精品视频在线免费观看| 亚洲国产精品视频在线观看| 亚洲一二三在线| 亚洲丁香婷深爱综合| 北条麻妃久久精品| 欧美老女人性生活| 午夜免费久久久久| 久久伊人精品天天| 成人情趣片在线观看免费| 欧美国产日韩在线| 91免费在线视频|