Чтобы сравнить файлы и выбрать один для копирования, вам нужно будет сравнить их содержимое . Это может оказаться трудным для проприетарного формата файла, такого как .doc
(в отличие от .docx
).
Вы можете сначала преобразовать файлы .doc
в текст с помощью libreoffice в автономном режиме:
libreoffice --headless --convert-to txt: text mydocument.doc
На этапе секунд можно было бы сравнить файлы, хотя я сомневаюсь, что преобразованный .doc
будет иметь точно такое же содержание, что и версия .txt
, поэтому сложно (если не невозможно) сравнить их программно.