unicode - лучшие вопросы о Unix / linux операционная система (юникс)

1

ответ

Как удалить русский язык, и арабский язык представляет в виде строки от текстового файла

Проблема: у Меня есть текстовый файл с приблизительно 1M строки, каждая строка состоит из нескольких слов, Некоторые строки содержат российские или арабские слова (позволяет, называют их "плохими строками"), я хочу удалить только их плохо...

22.10.2014

1

ответ

Как отобразить символы Unicode полуширины в терминале гнома и т.д.

Я желаю настроить энергию с, скрывают для отображения unicode символов U+2329 (〈) и U+232A (〈) вместо <и> при использовании для указания на параметры типа. Это полуширинные символы это...

gnome-terminal unicode terminal-emulator

03.07.2014

1

ответ

Восстановление файлов Mojibaked

Я недавно встречался с несколькими поврежденными файлами, содержание которых полностью испеклось в преобразованиях между UTF-8 и ISO-Latin-1. Как я могу восстановить эти файлы? Процесс, который создал...

unicode corruption

02.04.2014

1

ответ

Печать UTF-8 (включая китайский язык) текст

Я пытаюсь распечатать большое количество (несколько мегабайтов) закодированного текста UTF-8, который состоит из китайских и латинских символов (и возможно разбрызгивание других). Я хотел бы распечатать его в нескольких...

postscript unicode printing text-processing

20.11.2013

1

ответ

Экран GNU не повторяет unicode корректные символы

Когда я делаю это в своем терминале:-e "\xF0\x9f\x8d\xba" эха я получаю прохладную пивную кружку в своем терминале: Однако, когда я запускаю экран и пробую то же, я получаю �. Как я получаю хорошую пивную кружку?...

unicode gnu-screen terminal

06.07.2013

1

ответ

Как сделать так, чтобы экран не искажал какие-то последовательности UTF-8? [дубликат]

Я пытаюсь отследить, где мой UTF-8 искажается после того, как слишком много раз не смог отправить смайлик в Irssi. Мне удалось зайти так далеко: локальный терминал, эхо

gnu-screen terminal unicode

06.07.2013

1

ответ

Неправильная сортировка согласно en_US.UTF-8

Я вижу странное поведение команды вида, когда я сортирую по en_US.UTF-8. Я пытаюсь отсортировать этот файл (LC_COLLATE=en_US.UTF-8 данные тестирования вида): 㐀㐃㐄 ▼▽◢ ㎏㎜㎝ｂｑｚㄠㄨㄩ─┃┆...

i18n unicode sort

17.06.2013

1

ответ

Как я могу получить полное покрытие Шрифта юникода для хинду Linux?

Я установил более чем 159 новых шрифтов, все, что было возможно в хинду зеркале. Но даже затем, gnucharmap не имеет: арабский математический арабский язык символов 01ee00 1eebb алфавита Расширенный-A ࢠ ࣾ Chakma...

unicode fonts gentoo

30.11.2012

1

ответ

Python замены создается с UCS4 с UCS2

У меня есть мягкая фетровая шляпа fc15 установленный с 2.7.1-7.fc15 Python. Это создается с ucs4, и у меня есть некоторые пакеты здесь на работе, которые создаются с ucs2. Я теперь не могу создать другие пакеты, которые используют эти ucs2...

unicode python yum compiling fedora

02.10.2012

1

ответ

Используя символы UTF-8 с 'записью' передают программу

когда я использую программу записи для отправки сообщений, как я могу использовать символы UTF-8? Я отправляю: запишите user2 Ehilà! Com'è? Но получатель добирается: сообщение из user1@samehost на pts/1 в 21:08... EhilM-CM-! Com'M-...

unicode konsole

01.06.2012

0

ответов

Нет пакетной обработки, когда :busybox находит. -исполнитель

У меня есть доступ только к busybox. У меня есть такая папка :пруэба/$ :лс./уно./дос./трес В каждых двух подкаталогах (uno, dos )есть много файлов (с пробелами в именах и не -символами ASCII ), и я хочу переместить их в другой подкаталог

busybox find mv unicode

12.09.2021

0

ответов

Доступ к UTF -8 клинописных цифр и знаков препинания

Кто-нибудь знает, как получить доступ к UTF -8 клинописных цифр и знаков препинания? twash="\u12400" #two ash thash="\u12401" #three ash frash="\u12402&...

bash unicode

13.08.2021

0

ответов

Использование переменных, определенных в других скриптах bash

У меня есть сценарий bash, в котором я определяю UTF -8 греческих символов в файле с именем greek -utfb.sh. Я хочу запустить тесты, отображающие переменные для печати греческих букв в файле greek -utfb -scout. ---...

associative-array bash unicode

12.08.2021

0

ответов

Как печатать UTF -8 символов

Как я могу напечатать 8 символов UTF -на терминале, используя команды bash. Это работает echo -e '\U2586' Но следующее не работает printf '%s\n' $ (tput setaf 118 )"\\u2586" $ (tput sgr0)

bash unicode

10.08.2021

0

ответов

UTF -8 символов неправильно печатаются на консоли

Я видел несколько вопросов, похожих на этот, но я не могу использовать их решения, чтобы помочь себе. Итак, в чем моя проблема? У меня есть файл с символами ç, ã, à и т. д... но их нет...

terminal unicode

15.07.2021

0

ответов

Как заменить кодовые номера Unicode на UTF -8 символов в ряде файлов?

У меня есть 500 файлов, содержащих экранированные символы Юникода, например :Альберт Вельскес V>9ronique Ekin и т. д. Данные были запрошены с сервера сценарием через XMLHttpRequests, и я предполагаю...

character-encoding conversion special-characters unicode

12.04.2021

0

ответов

Как сопоставить клавишу создания для вставки через setxkbmap?

Я использую американскую (не -международную )раскладку. Одним из способов ввода üäöß является установка клавиши ввода с помощью :setxkbmap -layout us -option compose :ralt К сожалению, это убирает обычный "alt"...

compose-key keyboard-layout unicode xkb

18.03.2021

0

ответов

XTerm отображает только часть некоторых юникодов, а Urxvt ничего не отображает

В моем случае (U )XTerm действительно отображает некоторые юникоды, но только частично. Например, :для букв :

rxvt unicode xterm

17.02.2021

0

ответов

Является ли `utf8 `в `en _US.utf8 `каноническим набором символов?

Вывод locale различает прописные и строчные буквы :% языковой стандарт -a C en _AU.utf8 en _US.utf8 POSIX Чаще всего я видел UTF с дефисом и заглавными буквами -8. Что такое канонический...

locale unicode

02.09.2020

0

ответов

zsh :Индивидуальные шрифты поддерживают проблему рендеринга, которая отлично работает на bash

Я использую терминал gnome -версии 3.36. В bash я могу печатать без проблем $ अखिल् В zsh это не отображается должным образом $ अखिल<094d> это поведение zsh для индийских шрифтов, которые работают нормально...

unicode zsh

14.07.2020

0

ответов

Мертвые ключи - совмещение функций - противоречиво

Я не совсем понимаю мертвые ключи. Например, мёртвый острый ключ всегда ведёт себя следующим образом: вы должны знать, какой символ совместим, и затем вы можете ввести этот символ с помощью ...

keyboard keyboard-layout linux-mint unicode

16.05.2020

0

ответов

Почему sed не выполняет то, что определено в файле сопоставления локали для grep (и sed, awk )?

Наличие файла со всеми (печатными )символами ascii :$ printf '%b' "$ (printf '\\U%x\n' {32..126} )" > файл Можно отсортировать (с помощью tr, чтобы сократить длинный вывод до одной строки ):$ sort file |...

awk grep sed sort unicode

05.04.2020

0

ответов

Сортировка LC_ALL=C vs LC_ALL=C.utf8

Различается ли команда сортировки linux между локалью C и C.utf-8? в руководстве по сортировке сказано использовать LC_ALL=C для сортировки по значению байта, но я видел, что C.utf-8 допускает также значения utf8 (а не только ASCII)...

locale sort unicode

27.01.2020

0

ответов

Как использовать строку китайских иероглифов в качестве ввода для другой команды в bash?

В настоящее время я использую команду для преобразования некоторых китайских иероглифов в пиньинь, которая требует, чтобы строка в моем bash была совместима с Unicode, и помещала результат в другую переменную. Я могу запустить следующее...

bash python unicode

18.10.2019

0

ответов

Отличить символы ascii от символов UTF-8 в том же файле

В Ubuntu 18.04 я создал фиктивный текстовый файл всего с одним символом UTF-8, è. Все остальные символы - это ascii: $ cat dummytext Привет Привет! Это результирующий шестнадцатеричный дамп: $ hexdump -C dummyfile ...

text-processing unicode character-encoding ascii

21.03.2019

0

ответов

SSH до FreeBSD в UTF-8

Я пытаюсь SSH до FreeBSD-11.2-релиз с мою машину Windows, используя Mintty, но когда я устанавливаю LC_ALL в EN_US.UTF-8 и попробуйте вставить / вставить Персонаж без ASCII, соединение закрыто. Я использую ...

ssh freebsd tty unicode

29.11.2018

0

ответов

Как создать текстовый файл (1 гигабайт), содержащий случайные символы с кодировкой UTF-8?

Следующая команда не использует UTF-8: head -c 1M myfile.txt

files random text unicode

26.08.2018

0

ответов

Как добавить символы Юникода к паролю?

Я пытаюсь создать более надежные пароли, одна из идей которых - добавить символ Юникода - пароль. Хотя я использую что-то вроде $ apg -a 1 -M SNCL -n 3 -m 20, я не знаю способа ...

debian password unicode

06.01.2018

0

ответов

pandoc продолжает жаловаться на символ не-utf8, хотя кажется, что нет символа не-utf8

Я пытаюсь преобразовать файл разметки в pdf с помощью pandoc. Поскольку моя уценка содержит китайские иероглифы, я использую следующую команду для создания pdf: pandoc --pdf-engine = xelatex -V CJKmainfont = ...

unicode pandoc

26.12.2017

0

ответов

Как я могу улучшить этот скрипт преобразования символов?

Я использую приведенный ниже код для преобразования таких символов, как '\u00c0', в формат Unicode, например 'À' unicode(){ sed -i 's/\\\u00c0/À/g' $1;sed -i ' s/\\\u00c1/Á/g' $1;sed -i 's/\\\u00c2/Â/g' $1;sed -i 's/\\\u00c3/...

linux regular-expression sed unicode

24.11.2017