Email парсер pdf, word, excel
У нас есть огромный объем документов в формате pdf, word, excel. Задача состоит в том, чтобы выписать все емаилы с этих файлов. Вручную обрабатывать порядка 20.000 файлов будет нереально долго.
Было принято решение автоматизировать этот процесс, разработав парсер.
Скрипт находит email в указанном файле или папке с файлами (перебирая каждый) и сохраняет его в результирующий список — парсит емаилы. Ход работы парсера отображается в консоли.
Стек разработки:
- Python 3