Какие пакеты программного обеспечения для транскрипции или диктовки существуют в настоящее время для Linux?

Вы можете попробовать следующие 2 метода

Первый метод с использованием awk

awk '{print $2}' filename
1
09.05.2021, 21:54
3 ответа

Предостережение :Вы не уточнили, ожидали ли вы найти настоящий инструмент автоматического расшифровки голоса или базовый инструмент расшифровки.

Я бы сказал, что вам не повезет, если вы действительно ожидаете/надеетесь найти истинное распознавание голоса, но если вам нужны более стандартные подходы, попробуйте эти:

Package: gtranscribe
Description-en: simple GTK+ tool focused on easy transcription of spoken words
 gTranscribe is a simple GTK+ tool to transcribe audio files and other
 sources. The playback speed can be adjusted without changing the pitch of the
 voice. It supports spell checking and resuming at the last transcribed
 position.
Tag: implemented-in::python, interface::graphical, interface::x11,
 role::program, uitoolkit::gtk, use::TODO, works-with-format::mp3,
 works-with-format::mpc, works-with-format::oggvorbis,
 works-with-format::plaintext, works-with-format::wav,
 works-with::audio, works-with::text, x11::application

или

Package: transcriber
Description-en: transcribe speech data using an integrated editor
 Transcriber enables easy transcription of recorded speech.
 It is indispensable for every task that involves examination and
 transcription of audio files, like transcription of recorded interviews, song
 lyrics, radio shows and so on.  It is also useful if you are active
 in the field of speech research.

Ваш сценарий использования определит, подходят ли они вам или нет, так что вы не можете сделать ничего большего, кроме как установить их, протестировать и посмотреть, работают ли они на вас.

1
28.07.2021, 11:33

Я использую vosk для китайского языка, и он отлично работает с относительно короткими предложениями общего характера.

Он работает полностью в автономном режиме. У меня это на Raspberry PI 3B+, аппаратные требования довольно простые.

2
28.07.2021, 11:33

Попробуйте ботаник -диктовку , она поддерживает диктовку и имитирует ввод с клавиатуры, см. демо-видео .

(на основе отличного VOSK -API ).

1
28.07.2021, 11:33

Теги

Похожие вопросы