У меня есть следующий файл (file1 )
more file1
<?xml version="1.0" encoding="UTF-8"?>
<apps>
<app name="UAT/ECC/Global/MES/1206/MRP-S23" ear="UAT/ECC/Global/MES/1206/MRP-S23.ear" xml="UAT/ECC/Glal/ME/120/MRP- S23.xml"/>
<app name="OQ/ediedbn/adSFSF/adSFSF-CL" ear="OQ/ebn/aSF/adSF- CL.ear" xml="OQ/ediedbn/adSFSF/adSSF-CL.xml"/>
<app name="OQ/ediedbn/adaEBS/adOrBS-HR-CL" ear="OQ/ediedbn/adOraS/araEBS-HR-CL.ear" xml="OQ/eddbn/aOraEBS/adOEBS- HR-CL.xml"/>
<app name="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" ear="UAT/CZ/LIS/T068_01/LIS-QA-S03.ear" xml="UAT/CZ/LIMS/T068_01/LIMS-QA-S03.xml"/>
.
.
.
и это строки примеров, которые мне нужно сопоставить в file1
more file2
OQ-63/ECC/Glal/Interny/Adapter_Services/adOraEBS-NA
OQ-63/ECC/Glal/MES/58,61/ECC-MRP-S20
OQ-63/ECC/Glbal/MES/CZ/adum-CZ-Adapter
OQ-63/EC/Glal/TI/Adaptvices/adTIS
каков наилучший подход в синтаксисе perl one liner для сопоставления строк из file2 в file1 (и игнорировать обратную косую черту и другие необычные символы)
Я пробовал это, но не сработало
a="OQ-63/ECC/Glal/Interny/Adapter_Services/adOraEBS-NA"
perl -pe '/(^|\s)\Q$ENV{a}\E(\s|$)/' file1
У вашей попытки было несколько проблем:
Итак, это будет работать:
a="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" perl -ne '/"\Q$ENV{a}\E"/ && print' file1
Чтобы выполнить все сопоставления в одной строке, вы можете сделать:
perl -ne 'BEGIN { open(F2, shift); $re=join("|", map {chomp($_); "\"\Q${_}\E\"";} <F2>);} /$re/ && print' file2 file1
Это XML. Регулярные выражения плохо подходят для XML, несмотря на то, что они выглядят так, будто должны работать.
Это связано с тем, что XML является контекстным, а регулярное выражение — нет.А XML имеет множество вариантов форматирования, которые семантически идентичны, но не соответствуют одному и тому же регулярному выражению.
Хотя, похоже, ни одна из записей «второго файла» не соответствует вашему первому файлу в вашем примере. Я предполагаю, что вы хотите сопоставить поле «имя» XML. (По возможности следует избегать «совпадения с любым атрибутом»).
#!/usr/bin/perl
use strict;
use warnings;
#dumper is only needed for the 'print Dumper' line below
#for debugging. Both can safely be removed.
use Data::Dumper;
use XML::Twig;
open ( my $match_file, '<', 'file2' ) or die $!;
chomp ( my @matches = <$match_file> );
my %lookup = map { $_ => 1 } @matches;
#or if you want a more pithy one that IMO is a bit harder to understand.
#my %lookup = map { s/[\r\n]+//gr => 1 } <$match_file>;
print Dumper \%lookup;
my $twig = XML::Twig -> new -> parsefile ( 'file2' );
#xpath is XMLs equivalent of regex, but it's
#more suited to node and attribute matching.
foreach my $app ( $twig -> get_xpath ( '//app' ) ) {
$app -> print if $lookup{$app->att('name')};
#Alternatively extract a single field.
print "XML: ", $app -> att('xml'),"\n";
}
Как один вкладыш? Честно говоря, я бы не стал, если вы хотите выполнить и чтение совпадений и- поиск/печать.
Но для одного элемента я бы, возможно, выбрал:
a="UAT/CZ/LIMS/T068_01/LIMS-QA-S03" perl -MXML::Twig -e 'XML::Twig -> new ( twig_handlers => { 'app' => sub { $_ -> print if $_ -> att('name') eq $ENV{'a'} } } ) -> parse ( { do {local $/; <> } )'
Но, честно говоря, я бы придерживался написания «длинной формы», а не пытался разыграть какое-то волшебство в одной строке, — если вы попытаетесь и прочитайте все ваши шаблоны, вы получите неэффективный алгоритм, и если вы попытаетесь выполнить их все, то вы выполняете двойное чтение файла и структуру данных в одном и том же лайнере , и это просто беспорядок.