+  HandyCache форум
|-+  Главная категория» Общие вопросы» Дефолтные списки HandyCache
Имя пользователя:
Пароль:
Страниц: 1 2 [3] 4 5 ... 18   Вниз
  Отправить эту тему    Печать  
Автор Тема: Дефолтные списки HandyCache  (Прочитано 368038 раз)
0 Пользователей и 1 Гость смотрят эту тему.
mai62
Автор HC
*****

Репутация: +226/-4
Offline Offline

Сообщений: 6383


« Ответ #40 : 13 июня 2007, 00:10:57 »

Если прийдете к общему мнению по поводу нового состава дефолтных списков, поменяю.
Считаю, что дефолтные списки должны быть такими, чтобы не вызывали лишних вопросов у пользователя-новичка даже в ущерб эффективности.
Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #41 : 14 июня 2007, 03:34:21 »

Вот наваял списки. Некоторые правила отключил, которые далеко не всем нужны. Из черного списка удалил спорные и раритетные правила, которые редко встречаются. Оставил блокировку счетчиков, рекламы, трекеров и прочих нежелательных для посещения сайтов. В архив положил файл proxy.lst с правилом для Cproxy, может еще какие-нибудь прокси туда можно вписать? Или вообще он ненужен? Вобщем, высказываемся какие правила включить/отключить, удалить/добавить и т.д.

* lists.zip (10.67 Кб - загружено 165 раз.)
Сообщить модератору   Записан

DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #42 : 14 июня 2007, 09:22:51 »

Вобщем, высказываемся какие правила включить/отключить, удалить/добавить и т.д.

Начнем с "Черного списка"...

У тебя есть статистика срабатывания правил?
В дефолтных списках упор нужно делать на универсальность! Поэтому, ИМХО, не стоит включать в него редкие узконаправленные правила типа:
absolutepoker\.com/processing/imp\.asp
accord\.netgravity\.com

и т.д., т.к. большинству пользователей они никогда не пригодятся!

P.S. По синтаксису и дублям напишу позже...
Сообщить модератору   Записан
aleax
Новичок
*

Репутация: +0/-0
Offline Offline

Сообщений: 15


WWW
« Ответ #43 : 14 июня 2007, 11:31:24 »

Вобщем, высказываемся какие правила включить/отключить, удалить/добавить и т.д.

Правило из списка "Не обновлять"
#5#~#True#~#\.(jsp|rdf|rss|xml)#~##~##~#0:05
не срабатывает для лент новостей вида
Код:
http://operafan.net/component/option,com_rss/feed,ATOM0.3/no_html,1/
http://www.opera-ac.com/index.php?option=com_rss&feed=RSS2.0&no_html=1
http://handycache.ru/component/option,com_rss/feed,RSS2.0/no_html,1/
возможное решение:
#5#~#True#~#\.(jsp|rdf|rss|xml)|.*option(=|,)com_rss.*#~##~##~#0:05
Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #44 : 14 июня 2007, 15:45:41 »

Цитировать
В дефолтных списках упор нужно делать на универсальность! Поэтому, ИМХО, не стоит включать в него редкие узконаправленные правила типа:
Согласен. Подобные тоже удалю.

Цитировать
возможное решение:
#5#~#True#~#\.(jsp|rdf|rss|xml)|.*option(=|,)com_rss.*#~##~##~#0:05
Может лучше так: #5#~#True#~#\.(jsp|rdf|rss|xml)|[=,]com_rss[/&]#~##~##~#0:05
Сообщить модератору   Записан

aleax
Новичок
*

Репутация: +0/-0
Offline Offline

Сообщений: 15


WWW
« Ответ #45 : 14 июня 2007, 16:37:18 »

Может лучше так: #5#~#True#~#\.(jsp|rdf|rss|xml)|[=,]com_rss[/&]#~##~##~#0:05
может и лучше, я в RegExp не особо силен.

у части правил из списка не обновлять временной интервал задан 5минут.
а у правила .* - 10минут, вседствии чего по прошествии пяти минут все URL подпадают под него и всё равно не обновляются. надо както сбалансировать временные промежутки.
« Последнее редактирование: 14 июня 2007, 16:54:15 от aleax » Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #46 : 14 июня 2007, 16:59:34 »

Цитировать
у правила .* - 10минут
Это правило по умолчанию отключено, думаю, что перед тем как включить это правило юзер задумается для чего оно вообще надо. Сделал 5 минут.

Переваял черный список. Оставил только то, что очень часто встречается.

* lists.zip (5.13 Кб - загружено 105 раз.)
Сообщить модератору   Записан

aleax
Новичок
*

Репутация: +0/-0
Offline Offline

Сообщений: 15


WWW
« Ответ #47 : 14 июня 2007, 17:12:32 »

Это правило по умолчанию отключено, думаю, что перед тем как включить это правило юзер задумается для чего оно вообще надо. Сделал 5 минут.

Переваял черный список. Оставил только то, что очень часто встречается.
1.согласен.

2. в чёрный список неплохо бы добавить парочку правил для overklockers.ru (ввиду его популярности в рунете)
так как стандартные правила не полностью блокируют рекламу на нём.
примерно так:
#4#~#True#~#(overclockers\.ru)/(adx.js|adjs.php|adclick.php|adview.php)#~##~#
#4#~#True#~#(overclockers\.ru/partners)/(.*)#~##~#
Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #48 : 14 июня 2007, 17:43:14 »

Цитировать
#4#~#True#~#(overclockers\.ru)/(adx.js|adjs.php|adclick.php|adview.php)#~##~#
Это правило я не стал добавлять, а расширил правило №8 ЧС.

Цитировать
#4#~#True#~#(overclockers\.ru/partners)/(.*)#~##~#
Я даже и незнаю стоит ли добавлять его? Есть у меня правило для /partners/, но оно может блокировать и что-то нужное, поэтому из этих списков я его удалил. А добавлять именно overclockers\.ru/partners/, наверное, не стоит.
Сообщить модератору   Записан

Михаил
Gold beta tester
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #49 : 14 июня 2007, 20:04:41 »

NapA
Порылся в чулане и нашел пару своих универсальных правил для Черного списка.
По слову "banner":
(^|[/._])(ban(view|er)?|banner(bank|house|link|s|system|tex)?|bnrs?|rotabanner\d*|cookie_ban|([ablmtv]|ek|lit|ng|pr|soft)?bn)[-/._?]
По слову "ad":
(^|[/.])(ad([svx]?\d*|banner|bureau\.net|click|cycle|engage|frame|fox|js|land|log|name|net|river|serv(er)?\d*|ver(t(s|ise(rs)?|ising|izer)?)?)|(abn|active|page|text|view)ad\d*)[/.?]
По статусу ICQ:
(^|/)online(\.(gif|php|dll|asechka\.ru.*))?\?
По слову "counter":
(^|[/.])((hits)?count|(cy|my|tns-)?counter|_?cntg?)[/.?]

Все эти комбинации выстраданы практикой и гарантированно встречались в повседневности. Может, учтешь чего, если полностью не перекрывается твоим списком.
« Последнее редактирование: 14 июня 2007, 20:25:29 от Михаил » Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #50 : 14 июня 2007, 20:21:14 »

Цитировать
Может, учтешь чего, если полностью не перекрывается твоим списком.
Практически все уже присутствует в моем чс. А чего нет, то обязательно добавлю.
Сообщить модератору   Записан

DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #51 : 14 июня 2007, 20:54:15 »

Переваял черный список. Оставил только то, что очень часто встречается.

Отлично!
Кстати, твой ЧС сейчас полностью перекрывает существующий дефолтный?

Теперь по синтаксису:

Например, в твоей редакции 1-е правило ЧС никогда не сработает на URL: http://topcounter.site.ru . Проверь с отбрасыванием http://...

Скобки в начале и конце первых правил:
(/|-|_) - не охватывает начало строки, точку и т.д.
(/|-|=|\?)  - не охватывает точку, знак подчеркивания и т.д.

Поэтому предлагаю заменить эти скобки на более простую конструкцию: (\b|_) , которая учитывает все возможные знаки, кроме букв и цифр.

А (/|-|_|=|\.|\?|\d+) - лучше заменить на [^a-z]
« Последнее редактирование: 14 июня 2007, 21:30:30 от DenZzz » Сообщить модератору   Записан
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #52 : 14 июня 2007, 22:04:49 »

Цитировать
Например, в твоей редакции 1-е правило ЧС никогда не сработает на URL
Правильно, для этого и нужно правило № 29, хотя их можно и объеденить.

Цитировать
(/|-|_) - не охватывает начало строки, точку и т.д.
Потому что не везде нужны точки, тире и т.д. Где-то и этого достаточно. Спорить не буду, сделал по-твоему, но могут быть ложные срабатывания.
Сообщить модератору   Записан

DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #53 : 14 июня 2007, 22:29:15 »

Правильно, для этого и нужно правило № 29, хотя их можно и объеденить.

29-е на http://topcounter.site.ru/ и т.п. не срабатывает!
После модификации 1-е правило полностью перекроет 29-е. Ложных срабатывания от (\b|_) лично я не замечал!


Вообще, было бы неплохо, если бы кто-то прогнал потом ЧС по своим логам монитора за продолжительный период времени на предмет поиска ложных срабатываний...
Помнится, у popkov-а были большие логи... Подмигивающий
Сообщить модератору   Записан
Qua
Новичок
*

Репутация: +1/-0
Offline Offline

Сообщений: 22



« Ответ #54 : 14 июня 2007, 22:32:59 »

К слову, некоторая статистика по кол-ву попаданий:
Черный список у меня - 580 правил
Сработало хотя бы раз - 177 правил
Всего срабатываний - около 90 тысяч раз, причем 70 тысяч приходятся всего на первые полтора десятка правил...
Это я к тому, что "золотые правила" можно вычленить и путем сравнения статистики их срабатываний. Хотя они несколько субъективны и очень индивидуальны, но все же давайте смотреть какие правила у нас работают чаще.

Мой ТОП-10

#4#~#True#~#.*top\.list\.ru/counter\?#~#id=(1005829|682573);#~#
#4#~#True#~#.*i\.ru-board\.com/(images/remake\d*|temp/.+)\.gif$#~##~#
#4#~#True#~#.*(\.|/|-|_)+((\?)?partner(s)?|(a-|cy|my|n)+count(er(s)?(\?)?|s)?|(awm)?recip(\d|s)?|(double)?cl(ick(hype)?|x)+|(f|master|mega(_)?|rota|view)?ban((n)?er(-|\d+|bank|c|city|connect|host|s|id)?|_show|n|redir|rec|s|view)?|(pay)?pop(ieen|me|s|(_)?test|under|up(_|s)?)+|(php)?ad(_type|bot|brite|cl(ick|x)+|dweb|flight|frame|image(s)?|link|net|onspot|revolver|runner|s(erv)?|tomi|v|ver(t|tising)?|view)+|re(c|ck|k)+(l(ama)?)?)(\.|/|_|\?|=)+#~#(.*pandasoftware\.com/partners/.+\.aspx$|.*virus-radar\.com/(banner_(tir|top(1|5))_enu\.html$|(banner_virus_total_ir|static_banner_bkg)_enu\.(gif|png)$))#~#
#4#~#True#~#.*counter\.yadro\.ru/#~##~#
#4#~#True#~#.*/.*(88(_|-|x)+31|100(_|-|x)+60|100(_|-|x)+400|120(_|-|x)+600|468(_|-|x)+(60|80)).*\.(gif|jp(e)?g|png|swf)$#~##~#
#4#~#True#~#.*counter\.rambler\.ru/.+\?#~##~#
#4#~#True#~#.*ajax\.js$#~##~#
#4#~#True#~#.*u\d+\.\d+\.spylog\.com/cnt\?#~#cid=717646&#~#
#4#~#True#~#.*ad\.adriver\.ru/cgi-bin/.+\.cgi\?#~##~#
#4#~#True#~#.*google-analytics\.com/urchin\.js$#~##~#
Сообщить модератору   Записан

И др., и пр., и т.д., и т.п.
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #55 : 14 июня 2007, 22:48:56 »

Цитировать
29-е на http://topcounter.site.ru/ и т.п. не срабатывает!
После модификации сработает Улыбка
Цитировать
После модификации 1-е правило полностью перекроет 29-е
Дык я согласен. Уже изменил его.

Qua, рад, что мой древний список тебе пригодился, да еще и эффективным оказался. Улыбка
Сообщить модератору   Записан

Qua
Новичок
*

Репутация: +1/-0
Offline Offline

Сообщений: 22



« Ответ #56 : 15 июня 2007, 01:43:25 »

Цитата: NapA
Qua, рад, что мой древний список тебе пригодился, да еще и эффективным оказался. Улыбка
Я и нового жду с нетерпением. Кинь в личку или приложи лучше к постику - пусть люди радуются Показывает язык
Сообщить модератору   Записан

И др., и пр., и т.д., и т.п.
NapA
Beta tester
*****

Репутация: +5/-0
Offline Offline

Сообщений: 53



WWW
« Ответ #57 : 15 июня 2007, 03:05:40 »

Цитировать
Я и нового жду с нетерпением. Кинь в личку или приложи лучше к постику - пусть люди радуются
А чего ждешь? Заходи ко мне на сайт да и качай. Я же постоянно обновляю.
Сообщить модератору   Записан

Qua
Новичок
*

Репутация: +1/-0
Offline Offline

Сообщений: 22



« Ответ #58 : 15 июня 2007, 06:02:59 »

А чего ждешь? Заходи ко мне на сайт да и качай. Я же постоянно обновляю.
Действительно, кто не в курсе свежие списки для HandyCache от NapA тут.
По крайней мере для меня они как дефолтные (типа это не оффтоп Показывает язык)
Есть даже RSS лента новостей об их обновлении... Шокирован
Сообщить модератору   Записан

И др., и пр., и т.д., и т.п.
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #59 : 15 июня 2007, 08:33:19 »

NapA

Добавь в ЧС вот эти два правила:
#4#~#True#~#hit(box|exchange|list|scount|sites?|\?)#~##~#
#4#~#True#~#(hot|smart|spy|war)log\.#~##~#

А эти тогда можно убрать:
True#~#hits\.spylog\.com/cookie_transfer\?#~##~##~#0
True#~#spylog\.com/js/.+\.js#~##~##~#0
True#~#warlog\.info#~##~##~#0
True#~#hitbox\.com#~##~##~#0
True#~#hitscount\.com/usersonline\.php#~##~##~#0



Вот из этих двух правил лучше сделать одно, т.к. они во многом пересекаются:
True#~#(/|_|\.)(\d*|ad|b|f(lash)?|g(et)?|jade|kv|load|master|mega_?|mein|my|photo|res|rota(tion)?|show|view|\?.*)?ban(n?er.*|\d+|_show|n|redir|rec|s|view)?(/|-|_|=|\.|\?)#~##~##~#0
True#~#^(ad|biz|rota|ukr)?banners?(link)?\d*(\..*)?\..*/#~##~##~#0



Не очень нравятся правила для ру-борда, которые режут даже статичный логотип форума:
True#~#forum\.ru-board\.com/board/(temp/.+|images/elka)\.(gif|jpe?g|swf)#~##~##~#0
True#~#i\.ru-board\.com/(images/(remake\d*|ru-board(_ny_new|\d*))|temp/.+)\.gif#~##~##~#0

Лучше вместо них использовать проверенное годами:
#4#~#True#~#(forum|i\d?)\.ru-board\.com/(board/)?temp/#~#\.css$#~#



Правило:
True#~#(/|-|_)(double)?cl(ick(hype)?|x)(/|-|_|=|\?)#~##~##~#0
после модификации (\b|_) перекроет:
True#~#^(double)?click(\..*)?\..*/#~##~##~#0



ИМХО, лучше не сортировать ЧС по алфавиту, а сгруппировать правила по категориям, как уже предлагали выше:
Неплохо б, чтобы правила группировались. К примеру, пишем отключенное правило "---------------- Реклама ------------------", а после него все правила, относящиеся к блокированию рекламы, и т.д. Группы могут быть следующими: реклама, счетчики, статус online, информеры, трэкеры, порно, чаты, разное.
т.к. похожие правила могут начинаться с разных букв, а искать их потом придется по всему списку, что не удобно...
« Последнее редактирование: 15 июня 2007, 09:42:36 от DenZzz » Сообщить модератору   Записан
Страниц: 1 2 [3] 4 5 ... 18   Вверх
  Отправить эту тему    Печать  

 
Перейти в: