Как еще один Linuxer, ищущий полезную речь-к -текст (диктовка), я заглянул в программу Speechpad.pw:
Недостатки:
Таким образом, Speechpad.pw является проприетарным, а также с закрытым исходным кодом и также привязан к Google, который мы Я буду знать как бессонный сборщик метаданных, личной информации и личного содержимого.
Эти недостатки делают его беспроигрышным приложением для меня, хотя само распознавание речи работает очень хорошо - намного лучше, чем все, что я видел до сих пор.
Это упоминается в качестве примера в man sox
:
разбивает входной файл на несколько файлов продолжительностью 30 секунд. Каждое имя выходного файла будет иметь уникальный номер, как указано в разделе «Выходные файлы».
sox infile.wav output.wav trim 0 30: newfile: restart
Итак, если ваши файлы wav находятся в каталоге ~ / myfiles
, и вы хотите создать разделенные версии в ~ / split
вы можете сделать
mkdir ~/split
cd ~/myfiles
find . -name '*.wav' \
-exec sh -c 'mkdir -p ~/split/$(dirname "{}")' \; \
-exec sox {} ~/split/{} trim 0 10 : newfile : restart \;