МОИ РАБОТЫ

Email парсер pdf, word, excel

У нас есть огромный объем документов в формате pdf, word, excel. Задача состоит в том, чтобы выписать все емаилы с этих файлов. Вручную обрабатывать порядка 20.000 файлов будет нереально долго.

Было принято решение автоматизировать этот процесс, разработав парсер.

Скрипт находит email в указанном файле или папке с файлами (перебирая каждый) и сохраняет его в результирующий список — парсит емаилы. Ход работы парсера отображается в консоли.

Стек разработки:

  • Python 3