Python разработка для ваших целей

Vyacheslav Simdyanov vyacheslav742

Рейтинг: 3 766
Верифицирован через Сбер ID
Всего отзывов: 0
Выполнил заданий: 1
  • Надежность: Использовал: Работал по Безопасной сделке
  • Работ в портфолио: 43
  • Типовых услуг: 7
  • Работ на продажу: 4
  • Возраст: 42 года
  • Стаж работы: 4 года
  • Зарегистрирован: 01.03.2025
  • Образование: Среднее профессиональное
  • Юридический статус:Самозанятый
  • Стоимость услуг (руб): 850 за час 120 000 за месяц
Был на сайте:

Автоматизированный парсер реестра компаний дорожно-строительной отрасли (ОКВЭД 42.11)

Используемые навыки:

Описание

Целью проекта была разработка инструмента для сбора актуальной информации о строительных организациях с портала checko.ru по специфическому классификатору деятельности (ОКВЭД 42.11 — Строительство автомобильных дорог). Проект решает задачу формирования базы потенциальных подрядчиков и партнеров, автоматизируя ручной поиск данных по ИНН, полным названиям и дополнительным видам деятельности организаций.

Стек технологий
Python, Selenium Webdriver, BeautifulSoup4 (bs4), JSON, HTML.

Решение

Для реализации проекта был использован стек Python в связке с Selenium и BeautifulSoup4. Основные этапы разработки:
Эмуляция действий пользователя с помощью Selenium для обхода динамической подгрузки данных и пагинации на портале.
Парсинг структуры HTML-страниц через BeautifulSoup4 для извлечения целевых полей: название, ИНН, полный список ОКВЭД и текстовое описание деятельности.
Обработка исключений и настройка задержек для обеспечения стабильности работы скрипта при парсинге больших объемов данных.
Проектирование логики сопоставления основного и дополнительных кодов ОКВЭД для фильтрации целевых компаний.

Результат

Создан масштабируемый скрипт, позволяющий получать структурированные данные и сохранять их в формате JSON для дальнейшей интеграции в CRM или аналитические системы. На выходе формируется массив данных, содержащий полную юридическую информацию о компаниях (пример: МБУ "ДОРСЕРВИС", ИНН 5003115016), включая перечень всех видов зарегистрированной деятельности. Инструмент сократил время на сбор базы данных в десятки раз по сравнению с ручным поиском.

Презентация проекта

42_11.png

Оценили проект:

0
LARGE MEDIUM SMALL