DenZzz
|
|
« Ответ #140 : 10 июля 2007, 15:48:13 » |
|
NapAСделал сортировку правил в ЧС по группам.
Отлично! Еще несколько заметок по другим спискам: Не обновлять:Первое правило предлагаю расширить так: True#~#[/=?&](get|view)?(.*_)?(avatar|images?|img|pic(s|ture|x)?|screenshot)(_?id|preview)?(/?$|=|&|\.(php|pl))#~##~##~##~#0и можно убрать перекрываемые им правила: True#~#handycache\.ru/forum/index\.php\?.*(avatar|image)$#~##~##~##~#0 True#~#my\.opera\.com/.*/(avatar|picture|img)\.pl#~##~##~##~#0 Только из кэша:Сделать аналогично описаному выше... Белый список:Правило: True#~#handycache\.ru/forum/index\.php\?action=(keepalive|post|quotefast)#~##~##~#False#~#True#~#False#~#False#~#False#~#False#~#0исправить, как предлагал Михаил: True#~#/index\.php\?.*\bact(ion)?=(keepalive|post|quotefast)#~##~##~#True#~#True#~#False#~#False#~#False#~#False#~#0
|
|
|
|
|
NapA
|
|
« Ответ #141 : 10 июля 2007, 16:09:02 » |
|
ОК, сделал. А как насчет групп в ЧС? Может добавить группу "Трекеры" или удалить какие-нибудь?
|
|
|
|
|
DenZzz
|
|
« Ответ #142 : 10 июля 2007, 22:47:19 » |
|
А как насчет групп в ЧС?
Переименуй "Все остальное" в "Прочее". Может добавить группу "Трекеры" Из 1 правила? Можно пока перенести его в "Прочее"...
И еще, правило: True#~#/ushki(/.+\??)?(\.|code\.html)?#~##~##~#0 можно убрать, т.к. оно перекрывается правилом: True#~#(\b|_)u(ka|shki)[^a-z]#~##~##~#0
|
|
|
|
|
NapA
|
|
« Ответ #143 : 10 июля 2007, 23:08:47 » |
|
Переименуй "Все остальное" в "Прочее". ОК. Из 1 правила? Из-за двух. utm еще
|
|
|
|
|
DenZzz
|
|
« Ответ #144 : 10 июля 2007, 23:30:53 » |
|
Из-за двух. utm еще
Ну, тогда добавь новую группу... Тогда уж и "Online-статусы" выдели, чтобы новички не искали...
|
|
|
|
|
Михаил
|
|
« Ответ #145 : 11 июля 2007, 00:26:04 » |
|
urchin.js - это как и utm тоже компонента Urchin Tracker'а. Эти два правила можно даже в одно объединить. /(aw)?stats?\w*\.js - это тоже к трекерам относится.
|
|
|
|
|
DenZzz
|
|
« Ответ #146 : 11 июля 2007, 02:32:46 » |
|
Правила в ЧС: True#~#log\.trafic\.ro#~##~##~#0 True#~#pro\.traffer\.ru#~##~##~#0 True#~#ru-traffic\.com#~##~##~#0 полностью перекрываются правилом №9, которое лучше подправить так: #4#~#True#~#(\b|_)(my|ua)?traff?(er|ic)?[^a-z]#~#tcompressor\.ru/#~#
|
|
|
|
|
Михаил
|
|
« Ответ #147 : 11 июля 2007, 15:02:26 » |
|
С правилом 8 ЧС (click) будет много ложных срабатываний. Многие сайты формируют ссылки (не обязательно рекламные) через click. Например, сейчас переход по любому из результатов поиска на mail.ru невозможен ( http://go.mail.ru/click?url=...&title=...); это, кстати, еще один редирект, который можно учесть в Переадресации. Есть много других примеров.
|
|
|
|
|
DenZzz
|
|
« Ответ #148 : 11 июля 2007, 15:18:09 » |
|
С правилом 8 ЧС (click) будет много ложных срабатываний. Зато сейчас под него попадает более 50 рекламных ссылок из набора Агнис!
|
|
|
|
|
NapA
|
|
« Ответ #149 : 11 июля 2007, 15:52:06 » |
|
Адрес go.mail.ru пока забил в исключение.
|
|
|
|
|
DenZzz
|
|
« Ответ #150 : 11 июля 2007, 15:59:14 » |
|
Кстати, в рекламных фильтрах Агнис я насчитал 273 правила, содержащего слово "click" в абсолютно разных частях URL... Собственно, поэтому в своем ЧС я агрессивно режу все ссылки с "click", стоящем в любом месте URL! Так что, правило NapA даже более "мягкое"...
|
|
|
|
|
NapA
|
|
« Ответ #151 : 11 июля 2007, 16:26:04 » |
|
Так что, правило NapA даже более "мягкое"... Принцип "не навреди".
|
|
|
|
|
Михаил
|
|
« Ответ #152 : 11 июля 2007, 19:04:43 » |
|
|
|
|
|
|
NapA
|
|
« Ответ #153 : 11 июля 2007, 19:36:09 » |
|
Может быть отключить это правило? Кому надо - включит.
|
|
|
|
|
DenZzz
|
|
« Ответ #154 : 11 июля 2007, 20:53:14 » |
|
Если есть Click'и, ведущие к рекламе, то и надо, имхо, именно их прописывать в ЧС (если они не носят других признаков рекламы - ad, banner и пр.), но не обобщать это на все.
В одном только списке Агнис таких несколько сотен! Все прописывать в ЧС? А сколько полезных click'ов ты можешь привести? Не проще их в исключения добавить?... Добавлено: 11 Июля 2007, 21:46:34
Это просто кнопки, отсутствие которых мало кто заметит... А это счетчик, который все равно вырежет другое правило!
|
|
|
|
|
Михаил
|
|
« Ответ #155 : 11 июля 2007, 21:41:32 » |
|
В одном только списке Агнис таких несколько сотен! Все прописывать в ЧС? И у всех этих сотен отсутствуют другие именно рекламные признаки: ad, bn, count, banner и пр.? А сколько полезных click'ов ты можешь привести? Не проще их в исключения добавить?...
Очень много - больше 30 только по моим логам. А это счетчик, который все равно вырежет другое правило!
И хорошо бы, да это одновременно и редирект на прописанный адрес. Но если б даже просто счетчик - у него присутствует основной признак - "count". "Сlick" сам по себе в общем случае не обозначает тип стоящего за ним контента. Именно поэтому молчаливое отнесение его к рекламе не обосновано и даст множество ложных срабатываний.
|
|
|
|
|
DenZzz
|
|
« Ответ #156 : 11 июля 2007, 22:07:45 » |
|
И у всех этих сотен отсутствуют другие именно рекламные признаки: ad, bn, count, banner и пр.?
У большинства нет признаков, попадающих под другие правила! Вот, несколько фильтров Агнис: .click. .clicks. /cgi-bin/click? /cgi/newclick.cgi /click- /click. /click/ /clickover. /clicks- /clicks. /clicks/ и т.д.
|
|
|
|
|
|
DenZzz
|
|
« Ответ #158 : 12 июля 2007, 08:35:00 » |
|
Ну далеко не всегда реклама это. У меня подавляющее большинство именно рекламных срабатываний "клик" попадает одновременно под другие правила ЧС. Посмотри по своему логу.
Смотрел, по-разному бывает! Агнис свои списки тоже по реальным URL составлял! В общем, чтобы долго не спорить, можно сделать это правило отключенным - на откуп пользователю... Само правило предлагаю расширить так: #4#~#False#~#(\b|_)(ad|double|fast)?cl(i?ck(er|s)?(hype)?|x)[^a-z]#~##~#
|
|
|
|
|
NapA
|
|
« Ответ #159 : 12 июля 2007, 10:46:43 » |
|
Может быть подобные правила с возможными ложными срабатываниями стоит отнести в отдельную группу?
|
|
|
|
|
|