 |
Как сделать хороший канал?

Поиск наилучшего источника данных

Настройка WatzNew для использования HTTP-интервалов
Здесь мы хотим дать несколько советов, как делать хорошие и быстрые каналы для WatzNew. Поиск наилучшего источника данныхПрежде чем решить, какой документ подключать, постарайтесь найти на сайте лучшую страницу с необходимой информацией. Это значит, что:
- Желательно, чтобы эта страница не была очень большой.
- Необходимая информация должна располагаться недалеко от начала страницы, чтобы вы могли легко настроить программу на нее.
- Желательно, чтобы шаблон для поиска находил ближайшую необходимую информацию (это значит, что все значения, возвращаемые шаблоном для поиска в исходном документе, находились не очень далеко друг от друга).
- Некоторые сервера предлагают возможность просматривать страницу только в режиме текста 'text mode only' или готовом к печати 'printable version'. Версия для печати, как правило, компактнее оригинальной WEB страницы. Рекомендуется использовать ее.
- Некоторые сервера используют своего рода "back-end" информацию с последними новостями на дополнительных html страницах (например http://www.wired.com/news_drop/free/free.txt
). Эти страницы являются лучшими для мониторинга через WatzNew. - Активные каналы Internet Explorer (*.cdf files), каналы Netscape в формате RSS (см. информацию here
), которые предлагаются многими сайтами, также хороший объект для мониторинга. Эти файлы представляют собой текстовые данные с тегами XML, для которых очень удобно задавать поисковые шаблоны. - Вообще говоря, лучшим источником данных являются XML файлы. Они содержат только данные и имеют самый удобный формат для создания шаблонов поиска. Для того чтобы узнать больше о формате XML посетите сайт http://www.xmltree.com/
.
Настройка WatzNew для использования HTTP-интерваловЗадание интервал HTTP в настройках канала является эффективным способом уменьшить время обновления канала. При помощи интервалов вы сообщаете серверу, какую часть документа загружать. Рекомендуется задавать интервалы для любой страницы, поскольку это сильно экономит время. Прежде всего, вы должны решить, какие значения задать для интервалов. Это можно сделать следующим образом: откройте свойства канала в закладке "Шаблон поиска", запустите поиск, путем нажатия соответствующей кнопки (помечено стрелкой на картинке ниже), и запомните значения, которые появятся в статус баре окна с исходным текстом. 
Затем нажмите на закладку 'Общие', проверьте опцию 'ю введите интервал (в байтах)' и установите интервал для этого канала. Ваш интервал должен быть на 2-10 Kb больше, чем тот, который вы получили на предыдущем шаге. 
Все значения задаются в байтах и считаются от начала страницы. Первый байт имеет отступ = 0. Типы интервалов:
- X-Y значит 'загрузить байты из данного интервала'.
- X- значит'загрузить с байта X до конца'.
- -Y значит'загрузить последние Y байт'.
Примеры интервалов:
- 0-1999 значит 'первые 2000 байт'.
- 500-699 значит '200 байт, начиная с 500-го '.
- -500 значит'последние 500 байт'.
- 9500- значит ' все с 9500-го байта до конца'.
Вы можете задать не только один интервал, но и множество интервалов, разделенные запятыми:
- 0-299,-1000 значит 'первые 300 байт и последние 1000 байт'.
Вы можете также просто задать максимальное число загружаемых байт:
- 3000 значит 'первые 3000 байт'.
|
 |
|