perl one liner line + строка соответствия в файле и игнорирование символов обратной косой черты

У меня есть следующий файл (file1 )

more file1

<?xml version="1.0" encoding="UTF-8"?>

 <apps>
 <app name="UAT/ECC/Global/MES/1206/MRP-S23"  ear="UAT/ECC/Global/MES/1206/MRP-S23.ear" xml="UAT/ECC/Glal/ME/120/MRP- S23.xml"/>
  <app name="OQ/ediedbn/adSFSF/adSFSF-CL" ear="OQ/ebn/aSF/adSF- CL.ear" xml="OQ/ediedbn/adSFSF/adSSF-CL.xml"/>
 <app name="OQ/ediedbn/adaEBS/adOrBS-HR-CL"  ear="OQ/ediedbn/adOraS/araEBS-HR-CL.ear" xml="OQ/eddbn/aOraEBS/adOEBS-   HR-CL.xml"/>
<app name="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" ear="UAT/CZ/LIS/T068_01/LIS-QA-S03.ear" xml="UAT/CZ/LIMS/T068_01/LIMS-QA-S03.xml"/>
 .
 .
 .

и это строки примеров, которые мне нужно сопоставить в file1

more file2

OQ-63/ECC/Glal/Interny/Adapter_Services/adOraEBS-NA
OQ-63/ECC/Glal/MES/58,61/ECC-MRP-S20
OQ-63/ECC/Glbal/MES/CZ/adum-CZ-Adapter
OQ-63/EC/Glal/TI/Adaptvices/adTIS

каков наилучший подход в синтаксисе perl one liner для сопоставления строк из file2 в file1 (и игнорировать обратную косую черту и другие необычные символы)

Я пробовал это, но не сработало

 a="OQ-63/ECC/Glal/Interny/Adapter_Services/adOraEBS-NA"

 perl -pe '/(^|\s)\Q$ENV{a}\E(\s|$)/'  file1
0
23.01.2017, 12:50
2 ответа

У вашей попытки было несколько проблем:

  1. perl -pe печатает все строки - вам нужно либо удалить несовпадающие строки, либо использовать -n, и явная печать
  2. сопоставленным строкам предшествуют кавычки, но вы проверяете \ s
  3. Для тестирования полезно показать файл1 с некоторыми строками, соответствующими файлу2 :)

Итак, это будет работать:

a="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" perl -ne '/"\Q$ENV{a}\E"/ && print' file1

Чтобы выполнить все сопоставления в одной строке, вы можете сделать:

perl -ne 'BEGIN { open(F2, shift); $re=join("|", map {chomp($_); "\"\Q${_}\E\"";} <F2>);} /$re/ && print' file2 file1
1
28.01.2020, 02:46

Это XML. Регулярные выражения плохо подходят для XML, несмотря на то, что они выглядят так, будто должны работать.

Это связано с тем, что XML является контекстным, а регулярное выражение — нет.А XML имеет множество вариантов форматирования, которые семантически идентичны, но не соответствуют одному и тому же регулярному выражению.

Хотя, похоже, ни одна из записей «второго файла» не соответствует вашему первому файлу в вашем примере. Я предполагаю, что вы хотите сопоставить поле «имя» XML. (По возможности следует избегать «совпадения с любым атрибутом»).

#!/usr/bin/perl

use strict;
use warnings;

#dumper is only needed for the 'print Dumper' line below
#for debugging. Both can safely be removed. 
use Data::Dumper;
use XML::Twig;

open ( my $match_file, '<', 'file2' ) or die $!;
chomp ( my @matches = <$match_file> ); 
my %lookup = map { $_ => 1 } @matches; 

#or if you want a more pithy one that IMO is a bit harder to understand. 
#my %lookup = map { s/[\r\n]+//gr => 1 } <$match_file>;

print Dumper \%lookup; 

my $twig = XML::Twig -> new -> parsefile ( 'file2' ); 

#xpath is XMLs equivalent of regex, but it's 
#more suited to node and attribute matching. 
foreach my $app ( $twig -> get_xpath ( '//app' ) ) {
   $app -> print if $lookup{$app->att('name')};
   #Alternatively extract a single field. 
   print "XML: ", $app -> att('xml'),"\n";
}

Как один вкладыш? Честно говоря, я бы не стал, если вы хотите выполнить и чтение совпадений и- поиск/печать.

Но для одного элемента я бы, возможно, выбрал:

a="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" perl -MXML::Twig -e 'XML::Twig -> new ( twig_handlers => { 'app' => sub { $_ -> print if $_ -> att('name') eq $ENV{'a'} } } ) -> parse ( { do {local $/; <> } )'

Но, честно говоря, я бы придерживался написания «длинной формы», а не пытался разыграть какое-то волшебство в одной строке, — если вы попытаетесь и прочитайте все ваши шаблоны, вы получите неэффективный алгоритм, и если вы попытаетесь выполнить их все, то вы выполняете двойное чтение файла и структуру данных в одном и том же лайнере , и это просто беспорядок.

0
28.01.2020, 02:46

Теги

Похожие вопросы