Данные вашего примера выглядят как сломанный фрагмент json, поэтому вам действительно следует использовать jq
для извлечения из него того, что вам нужно перед тем, как делать то, что вы сделали с исходным вводом, который вызвал его выглядеть так.
Однако, чтобы извлечь URL-адреса, начинающиеся с https://www
и не содержащие символ двойной кавычки -, из того, что у вас есть, вы можете использоватьgrep
:
$ grep -o 'https://www[^"]*' input.txt
https://www.mycompany.com/posts/aureliaflore_china-seoul-startup-activity-6571925510337728512-acAw
https://www.mycompany.com/posts/aureliaflore_reuters-top-news-on-twitter-activity-6571392661482233856-T3dO
https://www.mycompany.com/posts/aureliaflore_are-you-thinking-to-the-benefits-of-digitalization-activity-6570119712154451968-927T