острота sed для удаления средних словом пробелов

Надлежащий способ обработать несвязанный в пакете установщика Windows состоял бы в том, чтобы иметь тест preinst для существования библиотеки, и если это не присутствует, чтобы предложить устанавливать его от пакета библиотеки, который Вы включаете в пакет установщика программного обеспечения. Я вполне уверен большинство приложений GTK, которые имеют порты окон, делают что-то вдоль этих строк - я знаю, что гибридный язык делает.

2
08.07.2011, 12:45
1 ответ

Необходимо было бы сгруппировать две части слова и использовать их в качестве обратных ссылок в замене как это:

sed -e 's/\([A-Z]\) \([A-Z]\+\)/\1\2/g'

Обратите внимание, что я также изменил Ваше использование * кому: + указать на 1 или более происшествий предыдущего символа вместо 0 или больше, сохраняя немного шага.

Также у Вас могли бы быть проблемы с этим целым выражением, если слово 'я' найден отдельно. У Вас есть что-либо еще, на чем можно соответствовать знать, должен ли я быть своим собственным словом или соединенный со следующим? Что относительно и другие однобуквенные слова?

Я рекомендую комбинировать этот простой текстовый взлом с некоторым проверять правописание так, чтобы помочь проверить на ошибки, сделанные заменой, такие как "ABIRD" или "IWENT". Никакой объем игры regex не собирается дать Вам, идеальный результат на большом корпусе поврежденного текста как Вы описывает, но после того как Вы сделали некоторую грубую очистку с regex, на который можно пойти к прекраснее настроенным методам как программы проверки правописания (который может также быть выполнен из командной строки и автоматизирован) очищать вещи. Наконец, имейте человека, корректируемого это!

6
27.01.2020, 21:55

Теги

Похожие вопросы