Как выполнить поиск символов по их значению в Юникоде?

Question

Как выполнить поиск символов по их значению в Юникоде?

Simplemente ordene ambos archivos antes de compararlos

sort f1 > f1s
sort f2 > f2s
diff f1s f2s

1

grep regular-expression unicode

Stupid 06.06.2019, 17:25

Ссылка

2 ответа

Вы можете использовать ugrep в качестве сокращения -вместо grep для соответствия кодовой точке Unicode U+16A0:

ugrep '\x{16A0}' test.txt

Он принимает те же параметры, что и grep, но предлагает гораздо больше возможностей, например:

ugrep searches UTF-8/16/32 input and other formats. Option -Q permits many other file formats to be searched, such as ISO-8859-1 to 16, EBCDIC, code pages 437, 850, 858, 1250 to 1258, MacRoman, and KIO8.

ugrep matches Unicode patterns by default (disabled with option -U). The regular expression pattern syntax is POSIX ERE compliant extended with PCRE-like syntax. Option -P may also be used for Perl matching with Unicode patterns.

Подробнее см. ugrep на GitHub .

2

Dr. Alex RE 27.01.2020, 23:41

Ссылка

Похожие вопросы

-1

Извлечение подстрок из вывода команды 22.05.2021

Как извлечь из приведенного ниже вывода команды только подстроки kim, tin и tintu. Подстроки нельзя получить, просто разбив на -. Биты xxx - это строки, которые являются определенным оператором,...

0

проблема xargs с grepped-файлами, содержащими пробелы 08.04.2019

У меня есть ряд файлов .html, содержащих пробелы между ними. Что мне нужно, так это найти файл с помощью find в сочетании с grep, и если совпадение найдено, в основном я просто хочу, чтобы xargs открывал его ...

pLumo · Accepted Answer · 27.01.2020, 23:41

Вы можете использовать ANSI -C, заключенный в кавычки , для замены экранированных символов обратной косой черты -, как указано в стандарте ANSI C.

grep $'\u16A0'

Более сложные примеры можно найти в этом связанном вопросе и ответах на него.

Как выполнить поиск символов по их значению в Юникоде?

Теги

Похожие вопросы