Вам нужно задействовать мощь регулярных выражений
, чтобы справиться с этой проблемой, и позволить движку RE
выполнять всю тяжелую работу во время просеивания. ваши данные:
sed -n '/\(\S\{4,\}\).*\s.*\1/p' yourfile
023q 023q023q
0adc 0adc0adc
123456 123456
abcde abcdefg