Оказалось, что это проблема приведения, поэтому я добавил 0 в столбцы, чтобы убедиться, что оба они обрабатываются awk одинаково.
С помощью:https://stackoverflow.com/questions/5808971/casting-to-int-in-awk
Это сработало..
awk -F, 'NR==FNR{c[$1+0,$2,$3]++;next};c[$120002+0,$120003,$120004] > 0' small.csv large.csv > output.csv
Я думаю, это должно делать то, что вы хотите:
while read file; do pdftotext "$file" | grep --with-filename --label="$file" --color -i "foo"'; done < <(find /path/ -name '*.pdf' | sort)