имена, которые происходят наибольшее число времен в наборе данных

Question

имена, которые происходят наибольшее число времен в наборе данных

Я бы Использование GREP GREP



grep -Fxvf oldfile newfile


 -F : Используйте режим фиксированного строки (без метасимволов) 

 -x : сопоставить всю линию (не подстроить) 

 -F Oldfile :  Прочитайте строки, которые должны быть сопоставлены из  OldFile 

 -V : инвертировать матч, то есть строки печати не найдено в  OldFile


                    
                        0
                        
                    
                    
                                            
                    
                    
                        Gilles 'SO- stop being evil'
                        26.06.2014, 02:14 
                    

                    Ссылка


            2 ответа


        
                    
        

            

            
                
                                    
            

            
                
                    
                        
                            
                                 Вы можете использовать 

echo "hjsyeh hellodir ; awgshd newdir; hjsyeh hidir; jkdhjk welcomedir" | \
 sed -e "s/;\s*/\n/g" | awk '{print $1 }' | sort | uniq -c 


 Вывод:

  1 awgshd
  2 hjsyeh
  1 jkdhjk


EDIT:.
Выход в запрошенном формате с другим вызовом awk:

echo "hjsyeh hellodir ; awgshd newdir; hjsyeh hidir; jkdhjk welcomedir" |                                                                
  sed -e "s/;\s*/\n/g" | awk '{print $1 }' | sort | uniq -c | 
  awk '{ printf "%s -%s directories\n" , $2 , $1  }'


 вывод:

awgshd -1 directories
hjsyeh -2 directories
jkdhjk -1 directories
                            
                            

                                2
                                
                            
                            
                            
                                
                                28.01.2020, 02:28 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                Решение perl : 

$ perl -anle '
    $h{$F[0]}++;
    END {
        $key_max = (sort { $h{$b} <=> $h{$a} } keys %h)[0];
        print "$key_max - $h{$key_max} directories";
    }
' file
hjsyeh - 2 directories


Это решение будет хорошо работать, если ваши данные малы. При работе с большими файлами для итерации через хэш необходимо использовать несколько perl-строек  каждая ,  ключи ,  значения :

$ perl -anle '
    $h{$F[0]}++;
    END {
        while (($k,$v) = each %h) {
          if ($v > $max_val) {
              $max_key = $k;
              $max_val = $v;
          }
      }
      print "$max_key - $max_val directories";
    }
' file
hjsyeh - 2 directories
                            
                            

                                1
                                
                            
                            
                            
                                
                                28.01.2020, 02:28 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                                    

                Похожие вопросы
                
                    
                                                    
                                0 
                                Используя grep в сценарии оболочки 25.02.2015 
                                У меня есть текстовый файл, который похож на это (я показываю немного строк его), ИНДЕКС: 1 цель snRNA_seq:TTTTGGAGCAGGGAGATGGAAT miRNA_seq:CTCCTGACTCCAGGTCCTGTGT: RNU2-1, RNU2-64P, RNU2-37P, RNU2-61P, RNU2-68P...
                            

                                                        
                                0 
                                Изменение отображает вывод с xrandr? 27.04.2015 
                                У моего соседа по комнате есть действительно старое 1280x1024 дисплей VGA, что наборы драйверов к 1600x1200 по умолчанию и он заставляет это отображать сообщение, говоря, что он не может отобразить вход. Я могу ctrl+alt+f1 и использование...
                            

                                                        
                                2 
                                 В Linux верхняя команда сортирует по полю «TIME +» с использованием командной строки, итерация 1 раз  09.02.2017 
                                 Когда мы запускаем верхнюю команду и если мы набираем «T», она будет сортировать по TIME + Я хочу сортировать по " TIME + »в командной строке, используя top -n 1, чтобы я мог захватить весь процесс в файле и проанализировать его ... 
                            

                                                        
                                0 
                                Найдите строку с заглавной строчной буквой и поместите ее перед строкой в верхнем регистре 21.04.2020 
                                У меня есть сценарий bash, считывающий имена с веб-страницы как переменные, которые используют формат LASTNAME Имя: SANCHEZ Rick
СМИТ Морти
VAN SOMETHING Halen Однако мне нужно отображать каждое имя как ...
                            

                                                        
                                2 
                                Debian :не может пропинговать дальше маршрутизатора  28.11.2019 
                                Здравствуйте, товарищи стекеры, я не уверен, что правильно спланировал конфигурацию сети. У меня такая топография домашней сети: :модем/маршрутизатор < -> маршрутизатор debian < -> локальная сеть. Мне нужно... 
                            

                                                        
                                0 
                                как сохранить содержание веб-страницы в файле с помощью сценария оболочки 27.02.2015 
                                как сохранить содержание веб-страницы в файле с помощью сценария оболочки. Веб-страница использует URL, имя пользователя и пароль для открытия. завихритесь-O odcview:password http://stomv11204:8080/SIM/realGraph.do?componentId=...
                            

                                                        
                                7 
                                Там какой-либо экран блокирует решения для openbox? 09.06.2011 
                                Если я хочу использовать OpenBox затем, как я могу заблокировать свой "монитор", когда я оставляю ПК в течение нескольких минут? Как экранная заставка гнома под GNOME.
                            

                                                        
                                1 
                                 Как мне расширить список букв / цифр в ash?  09.03.2018 
                                 В busybox оболочка по умолчанию - ash, поэтому некоторые знакомые приемы в bash недоступны.  Одна вещь, которую я хотел бы сделать, это расширить список букв, например {a..z}, который расширился бы до abcdefghi ... 
                            

                                                        
                                5 
                                Использует xargs быстрее, чем не использование его? 13.11.2011 
                                Это быстрее: найдите/tmp - ядро имени - тип f | xargs/bin/rm-f, чем выполнение этого: найдите/tmp - ядро имени - тип f - должностное лицо/bin/rm-f {} \; Так был бы с помощью xargs увеличить общую скорость? (Я добрался...
                            

                                                        
                                7 
                                 Клавиша Print Screen в i3  31.01.2019 
                                 По умолчанию i3 игнорирует клавишу Print Screen, доступную на большинстве клавиатур. Как его можно активировать?

score 2 · Answer 1 · 28.01.2020, 02:28

Вы можете использовать

echo "hjsyeh hellodir ; awgshd newdir; hjsyeh hidir; jkdhjk welcomedir" | \
 sed -e "s/;\s*/\n/g" | awk '{print $1 }' | sort | uniq -c

Вывод:

  1 awgshd
  2 hjsyeh
  1 jkdhjk

EDIT:. Выход в запрошенном формате с другим вызовом awk:

echo "hjsyeh hellodir ; awgshd newdir; hjsyeh hidir; jkdhjk welcomedir" |                                                                
  sed -e "s/;\s*/\n/g" | awk '{print $1 }' | sort | uniq -c | 
  awk '{ printf "%s -%s directories\n" , $2 , $1  }'

вывод:

awgshd -1 directories
hjsyeh -2 directories
jkdhjk -1 directories

score 1 · Answer 2 · 28.01.2020, 02:28

Решение perl :

$ perl -anle '
    $h{$F[0]}++;
    END {
        $key_max = (sort { $h{$b} <=> $h{$a} } keys %h)[0];
        print "$key_max - $h{$key_max} directories";
    }
' file
hjsyeh - 2 directories

Это решение будет хорошо работать, если ваши данные малы. При работе с большими файлами для итерации через хэш необходимо использовать несколько perl-строек каждая , ключи , значения :

$ perl -anle '
    $h{$F[0]}++;
    END {
        while (($k,$v) = each %h) {
          if ($v > $max_val) {
              $max_key = $k;
              $max_val = $v;
          }
      }
      print "$max_key - $max_val directories";
    }
' file
hjsyeh - 2 directories