top-shop.ru
Угловая шлифмашина Hitachi

Автосборка индекса сайта с помощью CGI на языке shell.

©2004 автор canegor@mail.ru все права защищены

Этот прием наиболее выгоден для создания динамических индексов сборников статей. Т.е. если Ваш сайт, или его раздел регулярно пополняется небольшими статьями. В этом случае переписывать каждый раз индекс раздела невыгодно.

Удобнее собирать его автоматически - пусть CGI программа сама найдет статьи, и сгенерирует индекс раздела. Конечно, в этом ей придется помочь. Пусть статьи складываются в каталог articles (можно создавать подкаталоги для статей). Статья - может состоять из нескольких файлов. Нас интересует только "точка входа" - главный файл HTML статьи. Его нужно пометить каким - либо образом для сервера. Пусть у него будет расширение .htm - создадим файл с таким же именем, но расширением .tit (titul - заголовок), в этом файле запишем единственную строку - заголовок статьи для индекса.

(rootdir)
|
+--- articles -- statya1.htm statya1.tit image.gif
|
+--- cgi-bin -- articles.cgi (скрипт, который нужно написать)
|
index.html (Статический индекс всего сайта - основной)

После того, как мы определились с расположением файлов, выбираем для скрипта articles.cgi язык shell. Поиском статей заставим заниматься системную комманду find :).

Вот что у меня получилось. Ставим полномочия chmod o+x articles.cgi. Теперь индекс статей генерируется автоматически. Достаточно "залить" на сервер новую статью - и она появится в индексе. URL индекса, естественно должен указывать на articles.cgi.

Цитата из http://www.yandex.ru/info/webmaster7.html
Робот Яндекса обходит "динамические" страницы и относится к ним в точности так же, как и к "статическим". Процесс обхода роботом вашего сайта можно рассматривать как обслуживание очереди, состоящей из документов. Чем больше в этой очереди пустых, бессодержательных или совершенно одинаковых документов, тем меньше шанс у интересных и содержательных документов оказаться проиндексированными. Это означает, что вебмастеру стоит подумать, какие документы он хотел бы видеть в выдаче поисковой машины.


Содержание.