Los documentos XML/HTML deben procesarse con herramientas de análisis adecuadas.
xmllint
enfoque (con sed
soporte para buscar/reemplazar dentro del texto del cuerpo de la etiqueta arbitraria <script>
):
$ xmllint --html --xpath '//script/text()' input.html | sed -En 's/.*\|([^|]+)\|data\|new.*/\1/p'
mystring123
$ xmllint --html --xpath '//div[@class="description"]/text()' input.html
mytitle123
С GNU Parallel это выглядит так:
parallel scripts/PipelineHaplo.sh {} '{=s/_R1/_R2/=}' 2 ::: raw/*R1.fastq.gz