Поскольку ваши данные представлены в формате CSV, вы можете использовать csvsql
из csvkit
, см.https://csvkit.readthedocs.io/en/1.0.3/scripts/csvsql.html#
Предположим, что у вашего файла есть имяdata.csv
csvsql -H --query 'SELECT a,c,d FROM data GROUP BY c,d' data.csv
печатает
a,c,d
[02/Dec/2011:24:33:04 +0900],20.663.65.61,2.123.91.100
[01/Dec/2011:22:20:01 +0900],90.663.65.61,21.123.31.100