Как сделать djvu файл доступным для поиска

Выборки от pkill руководство:

SYNOPSIS

    pkill [options] pattern

OPERANDS

    pattern
        Specifies an Extended Regular Expression for matching against the
        process names or command lines.

Таким образом, pkill интерпретирует '+' в Вашем аргументе как специальный символ образца. Используйте обратную косую черту для выхода из него. Если Вы используете doublequotes для заключения в кавычки или не заключаете в кавычки вообще, обратные косые черты Escape, таким образом, Bash не интерпретирует их. Как это:

pkill -SIGTERM -f "auth\\+live\\+ec575698789349860987088t897906769878968970"
3
02.10.2014, 21:49
1 ответ

Иногда копия добивается успешно, а иногда она терпит неудачу.

Вероятно, он не удается, потому что какой-то процесс в то время как писал на установленную файловую систему, догадай, вот почему хорошая практика Urount до: -)

DD должно быть действительно просто Откройте и Написать , я думаю, версия MacOSX добавит некоторое управление, и я думаю, что легко понять, почему с именами их устройств по сравнению с Linux I Triple-Check Rege Pref DD ing.

-121--114442-

«простым» способом было бы преобразовать файл .djvu обратно на несколько файлов .tiff (не к многосписвому TIFF), а затем рекомбин их с djvubind . Это, однако, уменьшит качество изображения .djvu файлов несколько, как это преобразование с потерями (почти наверняка при использовании.

Так что вы лучше вставляете текст OCR-ED в оригинале .djvu И это то, что Этот скрипт делает. Этот скрипт опирается на несколько дворовиков, которые вы можете найти в пакете DJVulibre-Bin , если вы еще не установили их.

Вот скрипт:

#!/usr/bin/perl

$lang = "eng";

if ( $#ARGV < 0 ) {
  print "give a DJVU file as 1st argument \n" ;
  exit 0 ;
}

$inputdjvu = $ARGV[0] ;
$imagetmp = "/tmp/temp.tif" ;
$djvutmp = "/tmp/outdjvu" ;

print "processing of $inputdjvu\n" ;

# calculate the number of pages
$nbpages = `djvused "$inputdjvu" -e 'n'` ;
print "number of pages: $nbpages" ;

for ($i=1 ; $i <= $nbpages ; $i++) {
  print "OCR de la page $i\n" ;

  # page extraction as an image
  `ddjvu -format=tiff -mode=black -page="$i" "$inputdjvu" $imagetmp` ;

  `tesseract $imagetmp /tmp/outocr -l $lang` ;
  print "OCR done\n" ;

  open(TXT, '/tmp/outocr.txt') ;
  open(TXTDJVU, ">$djvutmp") ;

  print TXTDJVU "(page 0 0 1 1\n" ;
  while ($line=<TXT>) {
    $line =~ s/\"/\\\"/g ;
    print TXTDJVU "(line 0 0 1 1 \"$line\")\n" ;
  }
  print TXTDJVU ")\n" ;

  close (TXT) ;
  close (TXTDJVU) ;

  # writing the text in the DJVU file
  `djvused "$inputdjvu" -e 'select $i; remove-txt' -s` ;
  `djvused "$inputdjvu" -e 'select $i; set-txt $djvutmp' -s` ;
}

# note: structure which works
# print TXTDJVU "(page 0 0 1 1\n" ;
#   print TXTDJVU "     (line 0 0 1 1 \"toto\")\n" ;
#   print TXTDJVU "     (line 0 0 1 1 \"toto la la\")\n";
#   print TXTDJVU ")\n" ;
4
27.01.2020, 21:19

Теги

Похожие вопросы