У меня есть большой файл CSV, содержащий около 25 миллионов строк и 256 столбцов. Разделителем полей CSV-файла является символ ~. Я хочу заменить первые 2 столбца такими данными From: data1 ~ data2 ~ data3 ......................
Пример файла с дублирующимися строками: # more file.csv spark2-env,spark_thrift_cmd_opts,--driver-memory 15g --executor-cores 7 spark2-thrift-sparkconf,spark.memory.offHeap.enabled,true mapred-...
Рассмотрим большое количество файлов CSV (* .csv), находящихся в какой-либо папке. Все они имеют одинаковый заголовок. Как я могу эффективно объединить их все в один файл CSV с одним и тем же ...
Возможный дубликат: есть ли надежный инструмент командной строки для обработки файлов CSV? Я пытаюсь разобрать вторую строку файла (которая содержит запятые в двойных кавычках) «100 Вт A19 10, ...
Я использую двоичный файл xls2csv для перевода документов XLS в CSV на моей машине Red Hat Linux. Например: (со страницы руководства): xls2csv -x "1252spreadsheet.xls" -b WINDOWS-1252 -c "ut8csvfile.csv" ...
Вход: X Y
1 11
1 12
2 21
2 22 Желаемый результат: 11 12
21 22 Я хочу транспонировать файл cvs по значению столбца 1. В этом примере для X = 1 транспонируйте (11, 12)^T в (11, 12); для X = 2, ...
Мне нужно транспонировать / развернуть файл CSV. Не знаю, возможно ли это. Предположим, содержимое этого CSV-файла: имя файла; рейтинг; идентификатор; сводка.
S4348gjO.doc; хорошо; 0001; описание того, как достичь ваших целей
S4348gjO.doc; ...
У меня есть два CSV-файла, скажем, A и B. Я понял, что случайно перепутал вещи, и теперь, чтобы исправить ошибку, я хочу написать сценарий оболочки, чтобы данные в третьем столбце ...
У меня есть следующие данные в очень большом CSV: «sortorder», «name», «description»
«1», «Б.1», «Котельная»
«2», «1.1», «Первый офис»
«3», «1,2», «Второй офис»
и т.д ... Которые я хотел бы получить в итоге ...
следующая команда: распечатать два значения за один ssh shut ssh test01 "имя хоста && cat / etc / sysconfig / rhn / rhnsd" test01
INTERVAL = 240, но как изменить синтаксис, чтобы напечатать ...
Я создал свою первую таблицу postgres и пытаюсь разобраться, как скопировать файл .csv в таблицу, одновременно генерируя серийный номер в столбце 1 (ID), который начинается с номера ...
У меня есть файл sales_ $ date.csv. Я хочу разбить его на 10 файлов на основе последней цифры первого столбца (ITEM). так что на самом деле файл будет разделен на 10 файлов: sales_ $ date-01.csv, sales_ $ date-02.csv, ....
Я пытаюсь выяснить, как отфильтровать определенные файлы csv по имени, а затем извлечь их вторую строку в один файл csv. Я не уверен, что это хорошая идея - находить файлы, а затем передавать их с ...
Существует текстовый файл, содержащий более 10000 строк в формате: поле1 поле2 поле3 поле4 поле5 ... полеX Его необходимо преобразовать, чтобы он выглядел так: поле1, поле2, field4, field3, field5 в fieldX The ...
Я пытаюсь подсчитать количество строк после проблемной строки в CSV-файле. Я знаю, что могу использовать синтаксис grep -a # для вывода # количества строк после обнаружения совпадения. Меня только интересует ...
У меня есть csv файл под названием scenario1.csv, в котором второй столбец имеет такие названия, как "0-4 года высокий риск", "65+ лет первый ответчик" и т.д. Таких значений 20. В 21-й строке, во втором столбце есть ...
Как сделать быстрое преобразование excel в csv? Я пробовал с помощью php, perl, JavaScript. но это занимает слишком много времени. Например, для файла размером 5MB потребуется 3-5 минут.
начиная с команды ps -eo user,pcpu,pid,args | sort -rnk 3 | head -30 Как разобрать вывод этой команды в csv файл с пользователями, имеющими наибольшее количество процессов и потребляющими процессор? ...
У меня есть файл .csv размером 67 ГБ (я знаю ... я знаю ...) Я необходимо удалить 4 125 878-ю строку из файла, так как она повреждена. Мои инструменты синтаксического анализа CSV не будут игнорировать или пропускать его. Я мог бы использовать sed, чтобы
У меня есть файл данных с числами, разделенными табуляциями, например, этот 1 2 3 4
2 4 6 8 Мой реальный файл имеет ширину 50000 столбцов, и мне нужен только каждый 100-й столбец (столбец 100, 200, 300, 400, ...).
Теперь я хотел бы ...
Предположим, у меня есть сумасшедший набор данных в CSV: SOS_VOTERID, COUNTY_NUMBER, COUNTY_ID, LAST_NAME, FIRST_NAME, MIDDLE_NAME, SUFFIX, DATE_OF_BIRTH, REGISTRATION_DATE, PARTY_AFFILIATION, RESIDENTIAL_ADDRESS1, ...
У меня есть список контактной информации, которую мне нужно обработать в формате .txt, разделенный символами,. Мы хотим сохранить только коды SIC, которые начинаются с 65, что означает недвижимость. Команда должна проверять только ...
Часть моего программного обеспечения выдает различные команды для открытия и просмотра файлов разных типов. Например, я использую atril для PDF-файлов и eom для PNG.
Однако у меня есть небольшая проблема с CSV-файлами. Я могу их открыть ...
У меня следующая структура текстовых строк: 3923 001 L05 LV, L05 RM
3923 002 L12 RA, L12 LA
3923 003 I06 ALL
3923 004 G04 RV, Z09 ALL, но мне понадобится это: 3923 001 L05 LV
3923 001 ...
У меня есть два файла csv с некоторыми информация журнала.
Мне нужно сравнить строку с строкой field1 (file1) с field2 (file2) с диапазоном 1 минута (-00: 00: 01
Хотите сжимать все мои файлы .csv в файл gzip. Я использую эту команду. gzip * .csv; Файл проблемы содержит в своем имени символ «//», поэтому команда выдает ошибку. Ошибка: - '//File.csv' не является ...