Страниц: 1 ... 90 91 [92] 93 94 ... 98   Вниз
  Отправить эту тему    Печать  
Автор Тема: Content Master v. 0.ХХ - расширение HC для очистки страниц от рекламы  (Прочитано 889192 раз)
0 Пользователей и 1 Гость смотрят эту тему.
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1820 : 26 сентября 2012, 09:19:51 »

По первой части: я понимаю что они независимы и понимаю что никакого влияния не оказывает. Но как вы говорили если включена группа "Удаление элементов по URL", то какими правилами они вырезаются? Только если в скриптах встречается такие ключи или только в комментах? Или все что попадется?

По второму стало немного ясно. Спасибо.
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1821 : 26 сентября 2012, 09:51:56 »

Цитировать
если включена группа "Удаление элементов по URL", то какими правилами они вырезаются?
В HTML ищется в:
- параметре 'src' элементов <audio>, <embed>, <frame>, <iframe>, <img>, <input>, <script>, <source>, <track>, <video>
- параметре 'href' элементов <a>, <area>, <link>
- параметре 'data' элемента <object>
- параметре 'value' элемента <param name='movie'>
соответственно все эти элементы вырезаются
- параметре 'background' элемента <body>
- параметре 'ping' элементов <a>, <area>
в двух последних случаях вырезается только параметр 'background' и 'ping' из тэга элемента

В ява-скриптах ищется в конструкциях:
- $jQ.ajax({url:...});
- .src=...
- везде по слову 'http', если по контексту похоже, что это параметр функции или присваивание переменной
найденные конструкции вырезаются

В CSS ищется в конструкциях:
- background:
- background-image:
- @import
найденные конструкции вырезаются
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1822 : 26 сентября 2012, 10:42:24 »

Огромнейшее спасибо за более чем развернутый ответ.
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1823 : 28 сентября 2012, 09:46:52 »

Дефолтный набор правил на вот такой вот странице
http://auto.yandex.ru/search.xml/?mark=CHEVROLET&model=LACETTI&specify_search=on&state=USED&price_from=&price_to=&currency=RUR&year_from=&year_to=&engine_type=&color=&km_age_to=&displacement_from=&displacement_to=&climate=&airbag=&top_days=14

Режет список объявлений по правилу ad в разделе class\id.
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1824 : 28 сентября 2012, 19:14:43 »

ОК.
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1825 : 29 сентября 2012, 09:25:39 »

И еще один вопрос.
Даже 2.

1. В какой последовательности СМ исполняет правила. Тоесть он обрабатывает код страницы сначала своими, потом Адманчеровскими, потом адблоковскими и уже в конце правилами ЧС НС?

2. Сейчас борюсь с рекламой тупо добавляя доменные имена рекламодателей в ЧС НС, но сам список в НС отключен но включен в СМ. Вроде все работает но иногда проскакивает реклама хотя домен в блоке. Потому и спросил какие конструкции вырезает СМ по черному списку.
Получается что всетаки лучше завести свое провило для СМ со списком этих доменов в соответствующих секциях.
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1826 : 29 сентября 2012, 10:28:17 »

Цитировать
В какой последовательности СМ исполняет правила. Тоесть он обрабатывает код страницы сначала своими, потом Адманчеровскими, потом адблоковскими и уже в конце правилами ЧС НС?
Если называть правила в порядке, указанном в настройках: 'Раздел-Группа', то будет примерно такая картинка:
- сначала выполняются в указанной последовательности '1-5', '2-12', '1-1', '1-2', '1-3', '1-4', '2-1', '2-2', '2-3', '2-4', '2-5'
- затем вперемешку '2-6', '2-7', '2-8', '2-9', '2-13', '3-1', '4-1', '4-2', '4-3'
- наконец в указанной последовательности '1-6', '3-2', '2-11', '2-10'
Цитировать
Вроде все работает но иногда проскакивает реклама хотя домен в блоке.
Правило вырезания по URL может не срабатывать, если оно перекрыто правилом из '2-13', '3-1', '4-3', 'AdMuncher-Don't match against keyword' или сайт находится в глобальных исключениях СМ.
Если это Вами учитывается, а результат все равно неверный, давайте разбираться с конкретным случаем.
Сообщить модератору   Записан
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #1827 : 04 октября 2012, 09:20:43 »

Михаил

СМ не режет рекламу в новостях этого сайта: http://63.ru/text/factsline/572458.html
Причем на главной странице СМ рекламу режет, а в новостях - нет. Раньше вроде везде резал.
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1828 : 04 октября 2012, 10:03:04 »

У меня нет рекламы на этой странице. Какие правила у тебя не срабатывают, хотя должны?
Сообщить модератору   Записан
Anyone
Старожил
****

Репутация: +3/-1
Offline Offline

Сообщений: 327



« Ответ #1829 : 04 октября 2012, 12:34:06 »

Михаил

СМ не режет рекламу в новостях этого сайта: http://63.ru/text/factsline/572458.html
Причем на главной странице СМ рекламу режет, а в новостях - нет. Раньше вроде везде резал.

Вроде режет везде. Часто захожу на 63.ru, криминала пока не обнаружил.

Скрины:

IE без HC - http://savepic.su/2566123.png
Opera+HC - http://savepic.su/2615274.png
« Последнее редактирование: 04 октября 2012, 12:41:59 от Anyone » Сообщить модератору   Записан
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #1830 : 04 октября 2012, 17:30:37 »

Хм, странно, на работе режет, дома нет. На той странице вообще нет срабатывания СМ и блок CSS не вставляет. Вечером настройки проверю. Может, антивирус с веб-контролем структуру HTML портит...
Сообщить модератору   Записан
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #1831 : 04 октября 2012, 23:18:56 »

Разобрался. СМ бездействует, потому что эта страница приходит ко мне без строки Content-Type: text/html  в заголовке. СМ просто не понимает, что это HTML и игнорирует страницу.

Посмотрел Web-сниффером, сервер выдает некорректный заголовок:
Content-Type: text/html; charset=windows-1251:
Двоеточия в конце строки быть не должно, поэтому какой-то софт на пути до меня удаляет всю строку, как некорректную.


Михаил

Возможно, стоит добавить в СМ еще распознание HTML по URL:  \.html?$   хотя бы опционально?

Ну, или просто в fraud_urls.txt добавь, плиз, строку:
\Ahttp://63\.ru/text/#~#text/html
« Последнее редактирование: 05 октября 2012, 01:02:05 от DenZzz » Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1832 : 05 октября 2012, 00:33:06 »

в fraud_urls.txt добавь, плиз, строку:
\Ahttp://63\.ru/text/#~#text/html
Сделано.
Сообщить модератору   Записан
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #1833 : 05 октября 2012, 01:01:35 »

Спасибо.

Сейчас обнаружил, что там многие другие разделы сайта с рекламой грузятся.  63.ru/text/ лишь один из них...

Что интересно, включил блок AdMuncher (он был у меня отключен) и вся реклама исчезла со всех разделов сайта! Причем даже если на первом HTML СМ не срабатывает, зато потом правила AdMuncher блокируют главный скрипт, который всю рекламу грузит!

Мораль - надо держать все блоки правил СМ всегда включенными! Улыбка
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1834 : 05 октября 2012, 09:22:48 »

А может просто стоило в настройках СМ отключить пункт "Не обрабатывать ответы не НТМЛ"??
Сообщить модератору   Записан
DenZzz
Модератор
*****

Репутация: +179/-11
Offline Offline

Сообщений: 5589



« Ответ #1835 : 05 октября 2012, 09:41:21 »

Этот пункт отключен. У него другой смысл - он только обработку JS и CSS отключает. А в моем примере тип содержимого не определен, поэтому оно игнорируется.
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1836 : 05 октября 2012, 14:34:41 »

Ясно спасибо.
Есть где отдельный ФАК по пунктам настроек именно СМ а не НС??
Сообщить модератору   Записан
alex77
Старожил
****

Репутация: +11/-1
Offline Offline

Сообщений: 482



« Ответ #1837 : 07 октября 2012, 06:51:41 »

скажите что с этим сайтом http://www.appleinsider.ru/ не так ?
при включенном СМ и всех  его фильтрах - ХК просто виснет!
отключаешь СМ - нету проблемы.
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1838 : 07 октября 2012, 11:55:46 »

У меня проблемы нет. Если нужна помощь, дайте, плиз, для начала лог СМ.
Сообщить модератору   Записан
alex77
Старожил
****

Репутация: +11/-1
Offline Offline

Сообщений: 482



« Ответ #1839 : 07 октября 2012, 15:14:49 »

вот такой вот огрызок

в мониторе висит соединение, которое даже остановить нельзя!
Код:
07.10.2012/21:59:38 local/127.0.0.1 http://www.appleinsider.ru/ 0 103545/369 0 720 "Client disconnected" П.35, Referrer handycache.ru - Visited often, З.1, CM:26 hits
П.35 (Преобразование URL): ((.+)\.)?([-a-z0-9]+)\.([a-z]+)/ 
Referrer handycache.ru - Visited often 
З.1 (Запись в кэш): .* 
CM:26 hits
такое выдало после примерно 6 минут "висения", нагрузка процессора 50% (при 2-х процессорном)

* ContentMasterLog.zip (0.63 Кб - загружено 25 раз.)
Сообщить модератору   Записан
Страниц: 1 ... 90 91 [92] 93 94 ... 98   Вверх
  Отправить эту тему    Печать  

 
Перейти в: