Взялся и пока вроде не плохо выходит!!! Постараюсь объяснить суть идеи! Не так давно был запущен гос. ресурс где в соответствии с нашим законодательством должны публиковаться все сообщения о банкротствах.
А теперь суть проблемы !
То ли из-за коррупционной составляющей, то-ли просто из-за технической сложности проекта, то-ли просто из-за того что ресурс государственный. ОН МЯГКО ГОВОРЯ не соовершенен.
Приведу пример на сайте около 40 торговых площадок при этом добрая половина из них работает на одном движке изменен чуть чуть дизайн из этого следует что разработчик один, а следовательно что к ключик к скриптам сайта тоже один.
Теперь суть идеи! Опустим технические подробности!
Берем сервак, создаем на нем 1000 - 2000 клиентов (ботов), и посылаем запросы на сайт торговой площадки. Получаем WEB страницу из страницы выбираем то что-нужно нам
1. Цена!
2. Что реализуется на торгах!
3. дата проведения!
и т.д.
Проанализировав информацию на ресурсе и на торговой площадке.
Получается что если не большая то значительная часть сообщений либо вообще не актуальна либо искажена.
Считаю проблему открытой и заслуживающую внимания!
Теперь по чему я эти занимаюсь! Получив выше указанную табличку! И сложив столбец с ценой получил 12 значную цифру. И подумал что чем гоняться за отдельными торгами лутше попробовать отхватить 0,1 %(или больше) от всей сумы.
Короче файлики exell формируются автоматически актуальны на СЕГОДНЯ.
ЦЕНА ФИКСИРОВАНА 1р.
Для сравнения печатная версия (газета "Коммерсант") 30р. - актуальность 1 неделя
Электронная версия того-же издания 500р. в месяц - актуальность 1 неделя
Ну и в завершение "Тот кто владеет информацией владеет миром"