Страниц: 1 ... 70 71 [72] 73 74 ... 77   Вниз
  Отправить эту тему    Печать  
Автор Тема: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы  (Прочитано 599600 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1420 : 25 июня 2014, 10:26:34 »

Текст ошибки говорит, что она происходит при попытке анализа CSS. Судя по тому, что происходит она очень редко, можно предположить, что в большинстве случаев этот CSS берется из кэша браузера, т.е. это внешний CSS-файл.
На странице ixbt.com таких 3:
http://www.ixbt.com/css/main_branded_search.css
http://www.ixbt.com/css/main_fixed_new.css
http://www.ixbt.com/css/side_tv.css

Попробуй каждый из этих URL загрузить в браузере (не из кэша браузера). Всплывет ли ошибка?
Сообщить модератору   Записан
DVall
Старожил
****

Репутация: +9/-0
Offline Offline

Сообщений: 362


« Ответ #1421 : 25 июня 2014, 19:29:45 »

Цитировать
Всплывет ли ошибка?
Нет.
И ошибка возникает не сразу, а через какое то время брожения по тырнету...
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1422 : 25 июня 2014, 20:17:02 »

Тогда жду дополнительных наблюдений.
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1423 : 01 июля 2014, 14:25:29 »

У меня одного правило в файле ContentMaster_Default строка 60 вырезает форму поиска в Яндексе?
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1424 : 01 июля 2014, 17:14:08 »

Спасибо. Поправил.
Сообщить модератору   Записан
LordMerlin
Старожил
****

Репутация: +12/-8
Offline Offline

Сообщений: 488


« Ответ #1425 : 01 июля 2014, 17:26:23 »

Пожалуйста. И вам спасибо.
Сообщить модератору   Записан
Terfe
Постоялец
***

Репутация: +4/-1
Offline Offline

Сообщений: 126


« Ответ #1426 : 08 июля 2014, 04:09:38 »

Вырезается тело новости:
finance.liga.net/banks/2014/7/7/news/39176.htm
При отключённых фильтрах Admuncher страница отображается корректно.
Когда-то было подобное с AdBlock`ом, но после исправления глюка с обработкой JS в СМ оно ушло. Михаил, вы бы не могли глянуть, это глюк или это просто из-за правил Admuncher?
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1427 : 08 июля 2014, 10:40:18 »

У меня не вырезает. Нужен лог СМ.
Сообщить модератору   Записан
Terfe
Постоялец
***

Репутация: +4/-1
Offline Offline

Сообщений: 126


« Ответ #1428 : 08 июля 2014, 23:09:18 »

Лог.

* ContentMasterLog.html.7z (8.01 Кб - загружено 24 раз.)
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1429 : 09 июля 2014, 00:17:35 »

это глюк или это просто из-за правил Admuncher?
Это срабатывает правило AdMuncher

Remove divs/spans with text: <div style="position:*.facebook.*.parentnode.

Можно убедиться по логу, что вырезанный фрагмент удовлетворяет этому правилу и содержит весь текст статьи.
Оригинальный AdMuncher этот фрагмент не удаляет, что, видимо, является багом этой программы.
« Последнее редактирование: 09 июля 2014, 00:23:51 от Михаил » Сообщить модератору   Записан
Terfe
Постоялец
***

Репутация: +4/-1
Offline Offline

Сообщений: 126


« Ответ #1430 : 09 июля 2014, 05:04:57 »

Ок. Спасибо.
Сообщить модератору   Записан
zakoul
Старожил
****

Репутация: +13/-2
Offline Offline

Сообщений: 326


« Ответ #1431 : 09 июля 2014, 06:31:49 »

Михаил, опять сломался поиск картинок и видео на яндексе.
60 строка ContentMaster_Default.txt

P.S. Если зайти на http://yandex.ru/video то (кроме поиска) не отображается популярное видео

* Yandex.7z (26.92 Кб - загружено 23 раз.)
« Последнее редактирование: 09 июля 2014, 06:42:14 от zakoul » Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1432 : 09 июля 2014, 10:21:40 »

Попробуйте сейчас.
Сообщить модератору   Записан
zakoul
Старожил
****

Репутация: +13/-2
Offline Offline

Сообщений: 326


« Ответ #1433 : 09 июля 2014, 11:50:19 »

Спасибо. Работает.
Сообщить модератору   Записан
Terfe
Постоялец
***

Репутация: +4/-1
Offline Offline

Сообщений: 126


« Ответ #1434 : 10 июля 2014, 03:30:45 »

Михаил,
Попался ещё один новостной сайт с такой же проблемой с АдМунчером - вырезаются целые куски страницы по его правилу.
Вот на этой странице
narodnarada.info/news/boycy-specbatalona-donbass-nachali-aktivnye-news-2065.html
по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?

Если открыть текстовым редактором файл лога СМ ContentMasterLog.html, то в начале файле между тегами <style> </style> увидим двоичным мусор типа "sz}B?Ў}їeэC". Так задумано? Улыбка
Сообщить модератору   Записан
YuS
Ветеран
*****

Репутация: +30/-4
Offline Offline

Сообщений: 701


crazy


« Ответ #1435 : 10 июля 2014, 07:49:10 »

по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?
А как должно обрабатываться подобное правило?

1. Удаление div/span с текстом:
Вот тут есть описание
Цитировать
This category causes Ad Muncher to search through both divs and spans and remove any that contain the given keyword.

Символ "*" обозначает любые символы...
« Последнее редактирование: 10 июля 2014, 07:56:06 от YuS » Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1436 : 10 июля 2014, 10:53:01 »

Цитировать
Вот на этой странице
narodnarada.info/news/boycy-specbatalona-donbass-nachali-aktivnye-news-2065.html
по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?

Похоже, Ваши сомнения небезосновательны. Вчитавшись внимательно в описание работы правил 'Remove divs spans with text', понял, что AM работает с ними несколько иначе, чем я думал. Последующие эксперименты с оригинальным AM подтвердили это.
Подумаю на досуге, как СМ сможет эмулировать такое поведение...

Цитировать
Если открыть текстовым редактором файл лога СМ ContentMasterLog.html, то в начале файле между тегами <style> </style> увидим двоичным мусор типа "sz}B?Ў}їeэC". Так задумано?
Такого быть не должно. У меня этого нет. Как надежно воспроизвести?
Сообщить модератору   Записан
YuS
Ветеран
*****

Репутация: +30/-4
Offline Offline

Сообщений: 701


crazy


« Ответ #1437 : 10 июля 2014, 13:00:25 »

AM работает с ними несколько иначе, чем я думал. Последующие эксперименты с оригинальным AM подтвердили это.
Подумаю на досуге, как СМ сможет эмулировать такое поведение...
Кстати, а где почитать-то подробнее, кроме той вики? И как сейчас работает CM? Разве не так, как описано в вики: вырезаются div-ы и span-ы, содержащие ключевой текст?
Сообщить модератору   Записан
Михаил
Модератор
*****

Репутация: +337/-14
Offline Offline

Сообщений: 5513



« Ответ #1438 : 10 июля 2014, 13:31:03 »

Кстати, а где почитать-то подробнее, кроме той вики? И как сейчас работает CM? Разве не так, как описано в вики: вырезаются div-ы и span-ы, содержащие ключевой текст?
Почитать больше негде. В Wiki я увидел:
"Before checking for keywords in these divs and spans, Ad Muncher will first extract and isolate any nested divs/spans."
Прочитав эту фразу и посмотрев на приводимые ниже примеры, я заподозрил, что AM против ожидания ищет задаваемый правилом кусок не во всем содержимом элемента <div>...</div> (так сейчас ищет СМ), а в "усеченном" его варианте.
Т.е. АМ берет содержимое элемента <div>...</div>, вырезает из него содержимое всех вложенных элементов <div> и <span>. И только оставшийся после этого вырезания кусок проверяет в соответствии с правилом 'Remove divs spans with text'.
Нелогичный с моей точки зрения подход, но это факт - работает АМ именно так.
К примеру, есть на сайте такой элемент:

<div>
   в Южной америке насчитывается более 140 рек<div>Здесь может идти какой угодно кусок сайта</div>ламы обитают в бассейне реки Урубамба
</div>

Правилом 'Remove divs spans with text: рекламы' оригинальный АМ все это вырежет полностью, т.к. перед применением правила он выкинет из div кусок, выделенный красным.

И такое вот безобразие нужно попытаться внедрить в СМ. Соотнеся такое поведение с внутренней организацией СМ я понял, что сделать это будет непросто...
Сообщить модератору   Записан
YuS
Ветеран
*****

Репутация: +30/-4
Offline Offline

Сообщений: 701


crazy


« Ответ #1439 : 10 июля 2014, 14:15:59 »

Ага, спасибо, вот теперь понятно, что происходит и в CM, и в оригинале.
Действительно, какой-то нелогичный подход. Правильнее, было бы вырезать ближайший блок, содержащий ключевой текст, а если его начать предварительно делить на вложенные куски, потом склеивать остатки, то и оформление может поплыть... и главное, если таких элементов на страницах будет много, то значительно увеличится ведь нагрузка на проц, а она и сейчас уже немаленькая от HC
Сообщить модератору   Записан
Страниц: 1 ... 70 71 [72] 73 74 ... 77   Вверх
  Отправить эту тему    Печать  

 
Перейти в: