テキストデータファイルの各データの頻度を数える
あらかじめソート済みのデータに対応
BEGIN {
PREV = "";
PREV_COUNT = 0;
}
{
if ( ( $0 != PREV ) && ( PREV != "" ) ) {
printf( "%s\t%d\n", PREV, PREV_COUNT );
PREV_COUNT = 0;
}
PREV_COUNT++;
PREV = $0;
}
END {
printf( "%s\t%d\n", PREV, PREV_COUNT );
}
というファイルが dat7.txt として存在しています。 このままではソートが済んでいないので鈴木 佐藤 田中 佐藤 鈴木 田中 佐藤 鈴木 鈴木
として ソート済みデータ を用意してください。c:\awk> sort dat7.txt > dat8.txt
とタイプします。c:\awk> gawk -f c_freq2.awk dat8.txt
と出力されるはずです。佐藤 3 田中 2 鈴木 4
Copyright © 2004 TKEN