Ubuntu如何实现词频统计 linux词频统计

主机教程 建站分享 2年前 (2022-10-10) 195次浏览

文章摘要:Ubuntu如何实现词频统计 linux词频统计

Ubuntu实现词频统计的示例: 使用shell实现简单的词频统计,例如:统计如下中第二列单词出现的次数。 1 […]

Ubuntu实现词频统计的示例:

使用shell实现简单的词频统计,例如:统计如下中第二列单词出现的次数。

1,huabingood,100

2,haha,200

3,huabingood,300

4,haha,100

5,haha,200

实现代码命令:

cat a.txt | awk -F "," '{print $2}' | sort | uniq -c | sort -nrk 1

代码解释:

awk -F "," '{print $2}' # 将数据按照逗号进行分割,并取出第二列的内容

sort  # 将取出的内容进行排序。因为uniq统计时,如果重复的数据不连续,就会被认为时两个不同内容的行

uniq -c  # 统计重复行出现的次数

sort -nrk 1  # 按照第一列重复的次数,按照数字顺序进行降序排列


声明:
若非注明,本站文章源于互联网收集整理和网友分享发布,如有侵权,请联系站长处理。
文章名称:Ubuntu如何实现词频统计 linux词频统计
文章链接:http://www.7966.org/post/14439.html
转载请注明出处

喜欢 (0)