Слово и фраза: Искать: Сортировать по:
Форумы на Sostav.ru / Конкурентная разведка / Программа для сбора инфы по сайтам
Может кто подскажет нужный софт?

Profile
IQ©

Постов: 5694
Дата регистрации: 12.02.2008
Коллеги, возникла задача ежедневно мониторить некоторые сайты. Порядка 1000 - 1500. Но не просто на изменения, а потом вручную просматривать, а по конкретным словам и словосочетаниям (желательно конечно, что бы бесплатно, ну или недорого).

Просмотрел варианты.
Sitespector - по описанию вроде подходит, но что-то никак не могу найти где скачать
Web Secretary 1.31 - из описания не очень понятно, но похоже что это не то.
WebSite-Watcher 5.1.6 - вроде есть система фильтров, но что за система ???
Copernic Tracker - судя по описанию - подходит, но небесплатна и как работает? - неизвестно.

В общем, подскажите, если пользуетесь.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.12.2009 14:00
цитата
Profile
Дмитрий Петряшов©
Ride the lightning
Модератор
Постов: 2245
Дата регистрации: 08.08.2006
для: IQ©
Бесплатные: Update Scanner (плагин к файрфоксу);
до 1 тыс. рублей WebSiteWatcher
до 5 тыс. руб. SiteSputnik, Avalanche 2.5
--------
Маркетинг и конкурентная разведка

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 23.12.2009 14:09
цитата
Profile
IQ©

Постов: 5694
Дата регистрации: 12.02.2008
для: Дмитрий Петряшов©
Спасибо.
А какая наиболее соответствует задаче/удобству пользования/качеству работы?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 23.12.2009 22:15
цитата
Profile
Дмитрий Петряшов©
Ride the lightning
Модератор
Постов: 2245
Дата регистрации: 08.08.2006

Цитата, автор IQ:
для: Дмитрий Петряшов©
Спасибо.
А какая наиболее соответствует задаче/удобству пользования/качеству работы?


Наиболее прост в освоении плагин к Файрфоксу.Его буквально поставил и начал работать. У него есть ряд недостатков:
а. запоминается только последнее и предпоследнее состояние страницы, архив изменений не ведется;
б. нет возможности отслеживать изменения определенного участка страницы;

Затем идет Вочер, у которого есть только недостаток "а". Возможность игнорирования изменения опредеоенного участка страницы реализована, но там надо с фильтрами разбираться.

Затем идет СайтСпутник. Это целый комбайн по поиску информации. Мониторинг изменений там реализован так, что весь архив изменений страницы ведется.

Ну а для полноценной работы с Аваланчем нужно знать html.
--------
Маркетинг и конкурентная разведка

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 24.12.2009 00:21
цитата
Profile
IQ©

Постов: 5694
Дата регистрации: 12.02.2008
для: Дмитрий Петряшов©
Спасибо.

"Ну а для полноценной работы с Аваланчем нужно знать html"

А на сколько хорошо? Например, у меня уровень следующий. Я могу разобраться в чужом коде и добавлять тексты и фото. Могу добавлять страницы и перелинковывать сайт. Могу со скриптами работать, но не писать. В принципе, могу простенький сайт сделать. Но не более. Этого будет достаточно?

А зачем там нужно знание html?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 25.12.2009 10:58
цитата
Profile
Дмитрий Петряшов©
Ride the lightning
Модератор
Постов: 2245
Дата регистрации: 08.08.2006
для: IQ©
Суть работы Аваланча примерно следующая: его настраивают на определенные страницы и прописывают, какую именно информацию брать. Обратите внимание на www.sostav.ru. Там масса информации, а Вам едва ли нужны всякие баннеры и прочий малоинформативный для Ваших задач мусор. Допустим, Вам нужно только скачивать по три новости в день, которые расположены в правой части портала. Вам нужно натравить Аваланч на главную страницу сайта и прописать ему некую последовательность действий: найти на странице три этих новости, перейти по гиперссылкам на их полные тексты и закачать их в базу.

Основная сложность работы программы именно в "объяснении" поисковому пауку, откуда и до куда ему брать текст. Для этого нужно залезть в код страницы и найти теги, обрамляющие нужный Вам текст. Сложность в том, что нужно выделить три вещи: дату новости, название новости и гиперссылку, ведущую на ее полный текст. Для этого применяется язык регулярных выражений. Таких сайтов можно прописать неограниченное количество. Сложность в настройке и состоит, а затем Аваланч работает автоматически, экономя массу времени.

Итак, все прописывается, Аваланч запускается. Он сгребает полные тексты новостей, на которые Вы его настроили, затем производит автоматическую рубрикацию. Затем Вы заходите во вторую часть программы, т.н. "Умные папки", где вы уже увидите все новости уже разбросанные по рубрикам, и там сразу видно, сколько новостей добавилось. В любой момент можно добавить новую рубрику или удалить старую. Новости скачиваются и хранятся в локальной базе, которую потом можно заархивировать.

--------
Маркетинг и конкурентная разведка

Да 3 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 25.12.2009 16:56
цитата
В настоящий момент эту тему просматривают: участников - 0, гостей - 1.
Только зарегистрированные пользователи могут оставлять сообщения в этом форуме


Форумы на Sostav.ru / Конкурентная разведка / Программа для сбора инфы по сайтам
© "ООО Состав.ру" 1998-2021

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
Rambler's Top100   18+   Словарь маркетинговых терминов