1
ответ

Как удалить русский язык, и арабский язык представляет в виде строки от текстового файла

Проблема: у Меня есть текстовый файл с приблизительно 1M строки, каждая строка состоит из нескольких слов, Некоторые строки содержат российские или арабские слова (позволяет, называют их "плохими строками"), я хочу удалить только их плохо...
22.10.2014
1
ответ

Как отобразить символы Unicode полуширины в терминале гнома и т.д.

Я желаю настроить энергию с, скрывают для отображения unicode символов U+2329 (〈) и U+232A (〈) вместо <и> при использовании для указания на параметры типа. Это полуширинные символы это...
03.07.2014
1
ответ

Восстановление файлов Mojibaked

Я недавно встречался с несколькими поврежденными файлами, содержание которых полностью испеклось в преобразованиях между UTF-8 и ISO-Latin-1. Как я могу восстановить эти файлы? Процесс, который создал...
02.04.2014
1
ответ

Печать UTF-8 (включая китайский язык) текст

Я пытаюсь распечатать большое количество (несколько мегабайтов) закодированного текста UTF-8, который состоит из китайских и латинских символов (и возможно разбрызгивание других). Я хотел бы распечатать его в нескольких...
20.11.2013
1
ответ

Экран GNU не повторяет unicode корректные символы

Когда я делаю это в своем терминале:-e "\xF0\x9f\x8d\xba" эха я получаю прохладную пивную кружку в своем терминале: Однако, когда я запускаю экран и пробую то же, я получаю �. Как я получаю хорошую пивную кружку?...
06.07.2013
1
ответ

Как сделать так, чтобы экран не искажал какие-то последовательности UTF-8? [дубликат]

Я пытаюсь отследить, где мой UTF-8 искажается после того, как слишком много раз не смог отправить смайлик в Irssi. Мне удалось зайти так далеко: локальный терминал, эхо
06.07.2013
1
ответ

Неправильная сортировка согласно en_US.UTF-8

Я вижу странное поведение команды вида, когда я сортирую по en_US.UTF-8. Я пытаюсь отсортировать этот файл (LC_COLLATE=en_US.UTF-8 данные тестирования вида): 㐀 㐃㐄 ▼▽◢ ㎏㎜㎝ bqz ㄠㄨㄩ─┃┆...
17.06.2013
1
ответ

Как я могу получить полное покрытие Шрифта юникода для хинду Linux?

Я установил более чем 159 новых шрифтов, все, что было возможно в хинду зеркале. Но даже затем, gnucharmap не имеет: арабский математический арабский язык символов 01ee00 1eebb алфавита Расширенный-A ࢠ ࣾ Chakma...
30.11.2012
1
ответ

Python замены создается с UCS4 с UCS2

У меня есть мягкая фетровая шляпа fc15 установленный с 2.7.1-7.fc15 Python. Это создается с ucs4, и у меня есть некоторые пакеты здесь на работе, которые создаются с ucs2. Я теперь не могу создать другие пакеты, которые используют эти ucs2...
02.10.2012
1
ответ

Используя символы UTF-8 с 'записью' передают программу

когда я использую программу записи для отправки сообщений, как я могу использовать символы UTF-8? Я отправляю: запишите user2 Ehilà! Com'è? Но получатель добирается: сообщение из user1@samehost на pts/1 в 21:08... EhilM-CM-! Com'M-...
01.06.2012
0
ответов

Нет пакетной обработки, когда :busybox находит. -исполнитель

У меня есть доступ только к busybox. У меня есть такая папка :пруэба/$ :лс./уно./дос./трес В каждых двух подкаталогах (uno, dos )есть много файлов (с пробелами в именах и не -символами ASCII ), и я хочу переместить их в другой подкаталог
12.09.2021
0
ответов

Доступ к UTF -8 клинописных цифр и знаков препинания

Кто-нибудь знает, как получить доступ к UTF -8 клинописных цифр и знаков препинания? twash="\u12400" #two ash thash="\u12401" #three ash frash="\u12402&...
13.08.2021
0
ответов

Использование переменных, определенных в других скриптах bash

У меня есть сценарий bash, в котором я определяю UTF -8 греческих символов в файле с именем greek -utfb.sh. Я хочу запустить тесты, отображающие переменные для печати греческих букв в файле greek -utfb -scout. ---...
12.08.2021
0
ответов

Как печатать UTF -8 символов

Как я могу напечатать 8 символов UTF -на терминале, используя команды bash. Это работает echo -e '\U2586' Но следующее не работает printf '%s\n' $ (tput setaf 118 )"\\u2586" $ (tput sgr0)
10.08.2021
0
ответов

UTF -8 символов неправильно печатаются на консоли

Я видел несколько вопросов, похожих на этот, но я не могу использовать их решения, чтобы помочь себе. Итак, в чем моя проблема? У меня есть файл с символами ç, ã, à и т. д... но их нет...
15.07.2021
0
ответов

Как заменить кодовые номера Unicode на UTF -8 символов в ряде файлов?

У меня есть 500 файлов, содержащих экранированные символы Юникода, например :Альберт Вельскес V>9ronique Ekin и т. д. Данные были запрошены с сервера сценарием через XMLHttpRequests, и я предполагаю...
12.04.2021
0
ответов

Как сопоставить клавишу создания для вставки через setxkbmap?

Я использую американскую (не -международную )раскладку. Одним из способов ввода üäöß является установка клавиши ввода с помощью :setxkbmap -layout us -option compose :ralt К сожалению, это убирает обычный "alt"...
18.03.2021
0
ответов

XTerm отображает только часть некоторых юникодов, а Urxvt ничего не отображает

В моем случае (U )XTerm действительно отображает некоторые юникоды, но только частично. Например, :для букв :
17.02.2021
0
ответов

Является ли `utf8 `в `en _US.utf8 `каноническим набором символов?

Вывод locale различает прописные и строчные буквы :% языковой стандарт -a C en _AU.utf8 en _US.utf8 POSIX Чаще всего я видел UTF с дефисом и заглавными буквами -8. Что такое канонический...
02.09.2020
0
ответов

zsh :Индивидуальные шрифты поддерживают проблему рендеринга, которая отлично работает на bash

Я использую терминал gnome -версии 3.36. В bash я могу печатать без проблем $ अखिल् В zsh это не отображается должным образом $ अखिल<094d> это поведение zsh для индийских шрифтов, которые работают нормально...
14.07.2020
0
ответов

Мертвые ключи - совмещение функций - противоречиво

Я не совсем понимаю мертвые ключи. Например, мёртвый острый ключ всегда ведёт себя следующим образом: вы должны знать, какой символ совместим, и затем вы можете ввести этот символ с помощью ...
16.05.2020
0
ответов

Почему sed не выполняет то, что определено в файле сопоставления локали для grep (и sed, awk )?

Наличие файла со всеми (печатными )символами ascii :$ printf '%b' "$ (printf '\\U%x\n' {32..126} )" > файл Можно отсортировать (с помощью tr, чтобы сократить длинный вывод до одной строки ):$ sort file |...
05.04.2020
0
ответов

Сортировка LC_ALL=C vs LC_ALL=C.utf8

Различается ли команда сортировки linux между локалью C и C.utf-8? в руководстве по сортировке сказано использовать LC_ALL=C для сортировки по значению байта, но я видел, что C.utf-8 допускает также значения utf8 (а не только ASCII)...
27.01.2020
0
ответов

Как использовать строку китайских иероглифов в качестве ввода для другой команды в bash?

В настоящее время я использую команду для преобразования некоторых китайских иероглифов в пиньинь, которая требует, чтобы строка в моем bash была совместима с Unicode, и помещала результат в другую переменную. Я могу запустить следующее...
18.10.2019
0
ответов

Отличить символы ascii от символов UTF-8 в том же файле

В Ubuntu 18.04 я создал фиктивный текстовый файл всего с одним символом UTF-8, è. Все остальные символы - это ascii: $ cat dummytext Привет Привет! Это результирующий шестнадцатеричный дамп: $ hexdump -C dummyfile ...
21.03.2019
0
ответов

SSH до FreeBSD в UTF-8

Я пытаюсь SSH до FreeBSD-11.2-релиз с мою машину Windows, используя Mintty, но когда я устанавливаю LC_ALL в EN_US.UTF-8 и попробуйте вставить / вставить Персонаж без ASCII, соединение закрыто. Я использую ...
29.11.2018
0
ответов
0
ответов

Как добавить символы Юникода к паролю?

Я пытаюсь создать более надежные пароли, одна из идей которых - добавить символ Юникода - пароль. Хотя я использую что-то вроде $ apg -a 1 -M SNCL -n 3 -m 20, я не знаю способа ...
06.01.2018
0
ответов

pandoc продолжает жаловаться на символ не-utf8, хотя кажется, что нет символа не-utf8

Я пытаюсь преобразовать файл разметки в pdf с помощью pandoc. Поскольку моя уценка содержит китайские иероглифы, я использую следующую команду для создания pdf: pandoc --pdf-engine = xelatex -V CJKmainfont = ...
26.12.2017
0
ответов

Как я могу улучшить этот скрипт преобразования символов?

Я использую приведенный ниже код для преобразования таких символов, как '\u00c0', в формат Unicode, например 'À' unicode(){ sed -i 's/\\\u00c0/À/g' $1;sed -i ' s/\\\u00c1/Á/g' $1;sed -i 's/\\\u00c2/Â/g' $1;sed -i 's/\\\u00c3/...
24.11.2017