Я думаю, вы запутаете «кодирование» и «наборы персонажей».
В первом случае файл содержит только символы, найденные в US-ASCII. Это означает, что файл будет выглядеть то же самое, независимо от того, какие языковые настройки вы используете для его отображения.
Во втором случае файл теперь содержит символы, принадлежащие к набору символов UTF8, потому что это то, что вы ввели в него.
здесь нет преобразования, происходящего здесь; Команда просто информирует вас о том, что содержимое файла.
Файл
Команда Просто догадается, что в файлах у вас есть анализировать.
Он делает анализ, прочитав определенное количество байтов из заголовка файла, иногда в процессе нескольких шагов (если он найдет некоторый четкий маркер в начале). В не структурированном текстовом файле это, безусловно, читает больше, чем количество символов, чем в вашем расширенном ./ Файл
, поэтому он анализирует все символы.
На вашем втором примере вы поместите несколько символов UTF-8 в файл и на основе этого файла
завершит этот файл, используя набор символов UTF-8
.
Если у вас будет например 900KB-файл с толькоми символами ASCII и добавить линию ECHO ASCII, , файл
все равно сообщит о нем в качестве файла закодированного ASCII, потому что он не читал, что и закодированные символы UTF-8.
Порог лежит где-то рядом с 100 КБ