Skip to content

Latest commit

 

History

History
16 lines (13 loc) · 1019 Bytes

README.md

File metadata and controls

16 lines (13 loc) · 1019 Bytes

Парсер интернет-портала «Страхование сегодня»

(PHP 5.x) Извлечение информации о состоянии лицензии страховых компаниях с сайта «Страхование сегодня» (insur-info.ru).

Описание

Для скачивания данных с сайта использовалась программа Content Downloader. Каждая страница сохраняется в файл вида article_X_.txt. Содержимое файлов - HTML код таблицы

Файлы

  • export_result.php - обработка данных:
    • извлечение данных из текстовых файлов
    • очистка
    • приведение к нужному виду
    • создание сводную таблицу
    • сохранение в .xlsx файл
  • output.xlsx - пример выходных данных