shellで重複行の件数を調べるワンライナー
expr $(cat <対象ファイル> | sort | wc -l) - $(cat <対象ファイル> | sort | uniq | wc -l)
<対象ファイル>
部分を置き換えて使う。
やってることは単純、expr (ファイルの内容をソートして行数をカウントしたもの) - (ファイルの内容をソートして重複行を省いた行数をカウントしたもの)
これで、重複している行数を計算できる。
duplinecount() {
expr $(cat "$1" | sort | wc -l) - $(cat "$1" | sort | uniq | wc -l)
}
などと.bash_profile
や.zshrc
に書いておくと便利