shellで重複行の件数を調べるワンライナー

March 03, 2032 (最終更新: March 03, 2023)

expr $(cat <対象ファイル> | sort | wc -l) - $(cat <対象ファイル> | sort | uniq | wc -l)

<対象ファイル>部分を置き換えて使う。

やってることは単純、expr (ファイルの内容をソートして行数をカウントしたもの) - (ファイルの内容をソートして重複行を省いた行数をカウントしたもの)

これで、重複している行数を計算できる。

duplinecount() {
  expr $(cat "$1" | sort | wc -l) - $(cat "$1" | sort | uniq | wc -l)
}

などと.bash_profileや.zshrcに書いておくと便利