! Переписан код получения значений тэгов ! Учёт полных путей файлов ! Определение формата файла по наличию тэга «<?php» ! Определение формата файла по наличию тэга «<!DOCTYPE» ! Определение кодировки страницы, записанной в виде <meta http-equiv=&qout;Content-Type&qout; content=&qout;text/html; charset=utf-8&qout;/>. Пока поддерживается только «utf-8» и «windows-1251» (по умолчанию) * При определении формата странички с LiveJournal пропускались из-за строки <html xmlns=&qout;http://www.w3.org/1999/xhtml&qout;> + Удаление комментариев <!-- камент --> перед операциями ! Замена спецсимволов на их значения « => « ! Новое поле BrockenTag: HTML валидация – проверка правильно закрытых HTML тэгов a, div, nobr, noindex, table, html, body, title, head ! Поле TextSize: Значения не были показаны ! Поле TextSize: Замена тэга <li> на пробел + Поле TextSize: Удаление двойных пробелов + Поле TextSize: Учитывается только текст между <body> и </body> + Поле TextSize: Удаление комментариев <!-- --> + Поле TextSize: При подсчёте размера текста вначале переносы строк заменяются на пробелы, затем тэги абзаца заменяются на 2 знака абзаца, а тэги разрыва строки заменяются на 1 знак абзаца ! Новое поле Keys(Keywords): Количество ключевых фраз. Считается количество фраз, разделённых запятыми (если есть), либо пробелам (если нет запятых). Можно выявить лишние запятые ! Названия полей с Count заменены на Words. Было «Count(Title)», стало «Words(Title)» ! Новое поле H3: Заголовок третьего уровня. Остальные, думаю, уже не нужны ! Новые поля Count(H1), Count(H2), Count(H3): Количество заголовков первого, второго, третьего уровня, чтобы отследить лишние заголовки первого уровня или их отсутствие ! Поля с Follow удалены, оставлены только Count(A_ext_follow) и A_ext_follow ! Ссылка на собственную страницу не считается внешней + Для внешних ссылок учитывается и ftp ! Поле BrockenLink показывает битые ссылки для тэгов <img src="">, <body background="">, <link href="">, <table background=""> + Поле BrockenLink: если в ссылке есть обратный слеш «\», ссылка считаются битой ! Новое поле Level показывает уровень вложенности страницы. 1 – главный файл (index.htm, index.html, index.php). 2 – страницы, на которые ведут ссылки со главной страницы. Чтобы попасть на эти страницы с главной, нужен один щелчок. 3 – страницы, на которые ведут ссылки со страницы второго уровня. Чтобы попасть на эти страницы с главной, нужны два щелчка. 0 – уровень страниц либо не определён (на них нет ссылок), либо уровень больше 3. Смысла искать страницы больше третьего уровня нет. Это и долго, и не приносит никакой практической пользы. При большом количестве страниц в папке, а особенно при сортировке по этому полю, Total Commander работает очень долго. Уровень вложенности для страниц в подпапках не определяется ! Новое поле SapeLevel показывает уровень вложенности страницы для sape.ru – биржи покупки/продажи ссылок. Известно, что sape учитывает не более 150 ссылок со страницы. Страницы, имеющие в поле Level уровень 2–3, в поле SapeLevel могут иметь уровень 0.
Хотите заработать, продавая ссылки со своего сайта?
Зарегистрируйтесь по моей ссылке:
www.sape.ru
Добавьте в систему свой сайт, укажите цены и начинайте зарабатывать! В отличие от других способов, здесь количество посетителей неважно.