Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1420 : 25 июня 2014, 10:26:34 »

Текст ошибки говорит, что она происходит при попытке анализа CSS. Судя по тому, что происходит она очень редко, можно предположить, что в большинстве случаев этот CSS берется из кэша браузера, т.е. это внешний CSS-файл.
На странице ixbt.com таких 3:
http://www.ixbt.com/css/main_branded_search.css
http://www.ixbt.com/css/main_fixed_new.css
http://www.ixbt.com/css/side_tv.css

Попробуй каждый из этих URL загрузить в браузере (не из кэша браузера). Всплывет ли ошибка?


	Сообщить модератору Записан

DVall

Старожил

Репутация: +9/-0
Offline

Offline

Сообщений: 362

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1421 : 25 июня 2014, 19:29:45 »

Цитировать

Всплывет ли ошибка?

Нет.
И ошибка возникает не сразу, а через какое то время брожения по тырнету...


	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1422 : 25 июня 2014, 20:17:02 »

Тогда жду дополнительных наблюдений.


	Сообщить модератору Записан

LordMerlin

Старожил

Репутация: +12/-8
Offline

Offline

Сообщений: 488

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1423 : 01 июля 2014, 14:25:29 »

У меня одного правило в файле ContentMaster_Default строка 60 вырезает форму поиска в Яндексе?


	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1424 : 01 июля 2014, 17:14:08 »

Спасибо. Поправил.


	Сообщить модератору Записан

LordMerlin

Старожил

Репутация: +12/-8
Offline

Offline

Сообщений: 488

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1425 : 01 июля 2014, 17:26:23 »

Пожалуйста. И вам спасибо.


	Сообщить модератору Записан

Terfe

Постоялец

Репутация: +4/-1
Offline

Offline

Сообщений: 126

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1426 : 08 июля 2014, 04:09:38 »

Вырезается тело новости:
finance.liga.net/banks/2014/7/7/news/39176.htm
При отключённых фильтрах Admuncher страница отображается корректно.
Когда-то было подобное с AdBlock`ом, но после исправления глюка с обработкой JS в СМ оно ушло. Михаил, вы бы не могли глянуть, это глюк или это просто из-за правил Admuncher?


	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1427 : 08 июля 2014, 10:40:18 »

У меня не вырезает. Нужен лог СМ.


	Сообщить модератору Записан

Terfe

Постоялец

Репутация: +4/-1
Offline

Offline

Сообщений: 126

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1428 : 08 июля 2014, 23:09:18 »

Лог.

ContentMasterLog.html.7z (8.01 Кб - загружено 24 раз.)
	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от ре&

« Ответ #1429 : 09 июля 2014, 00:17:35 »

Цитата: Terfe от 08 июля 2014, 04:09:38

это глюк или это просто из-за правил Admuncher?

Это срабатывает правило AdMuncher

Remove divs/spans with text: <div style="position:*.facebook.*.parentnode.

Можно убедиться по логу, что вырезанный фрагмент удовлетворяет этому правилу и содержит весь текст статьи.
Оригинальный AdMuncher этот фрагмент не удаляет, что, видимо, является багом этой программы.


« Последнее редактирование: 09 июля 2014, 00:23:51 от Михаил »	Сообщить модератору Записан

Terfe

Постоялец

Репутация: +4/-1
Offline

Offline

Сообщений: 126

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1430 : 09 июля 2014, 05:04:57 »

Ок. Спасибо.


	Сообщить модератору Записан

zakoul

Старожил

Репутация: +13/-2
Offline

Offline

Сообщений: 326

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1431 : 09 июля 2014, 06:31:49 »

Михаил, опять сломался поиск картинок и видео на яндексе.
60 строка ContentMaster_Default.txt

P.S. Если зайти на http://yandex.ru/video то (кроме поиска) не отображается популярное видео

Yandex.7z (26.92 Кб - загружено 23 раз.)
« Последнее редактирование: 09 июля 2014, 06:42:14 от zakoul »	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1432 : 09 июля 2014, 10:21:40 »

Попробуйте сейчас.


	Сообщить модератору Записан

zakoul

Старожил

Репутация: +13/-2
Offline

Offline

Сообщений: 326

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1433 : 09 июля 2014, 11:50:19 »

Спасибо. Работает.


	Сообщить модератору Записан

Terfe

Постоялец

Репутация: +4/-1
Offline

Offline

Сообщений: 126

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1434 : 10 июля 2014, 03:30:45 »

Михаил,
Попался ещё один новостной сайт с такой же проблемой с АдМунчером - вырезаются целые куски страницы по его правилу.
Вот на этой странице
narodnarada.info/news/boycy-specbatalona-donbass-nachali-aktivnye-news-2065.html
по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?

Если открыть текстовым редактором файл лога СМ ContentMasterLog.html, то в начале файле между тегами <style> </style> увидим двоичным мусор типа "sz}B?Ў}їeэC". Так задумано?


	Сообщить модератору Записан

YuS

Ветеран

Репутация: +30/-4
Offline

Offline

Сообщений: 701

crazy

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1435 : 10 июля 2014, 07:49:10 »

Цитата: Terfe от 10 июля 2014, 03:30:45

по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?

А как должно обрабатываться подобное правило?

1. Удаление div/span с текстом:
Вот тут есть описание

Цитировать

This category causes Ad Muncher to search through both divs and spans and remove any that contain the given keyword.

Символ "*" обозначает любые символы...


« Последнее редактирование: 10 июля 2014, 07:56:06 от YuS »	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1436 : 10 июля 2014, 10:53:01 »

Цитировать

Вот на этой странице
narodnarada.info/news/boycy-specbatalona-donbass-nachali-aktivnye-news-2065.html
по правилу АдМунчер "Remove divs/spans with text: <div style="margin:*<ins class="adsbygoogle"" СМ вырезает всё что между "div style..." и "...class="adsbygoogle"". Вы уверены что в оригинальном АдМунчере задумана именно такая обработка?

Похоже, Ваши сомнения небезосновательны. Вчитавшись внимательно в описание работы правил 'Remove divs spans with text', понял, что AM работает с ними несколько иначе, чем я думал. Последующие эксперименты с оригинальным AM подтвердили это.
Подумаю на досуге, как СМ сможет эмулировать такое поведение...

Цитировать

Если открыть текстовым редактором файл лога СМ ContentMasterLog.html, то в начале файле между тегами <style> </style> увидим двоичным мусор типа "sz}B?Ў}їeэC". Так задумано?

Такого быть не должно. У меня этого нет. Как надежно воспроизвести?


	Сообщить модератору Записан

YuS

Ветеран

Репутация: +30/-4
Offline

Offline

Сообщений: 701

crazy

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1437 : 10 июля 2014, 13:00:25 »

Цитата: Михаил от 10 июля 2014, 10:53:01

AM работает с ними несколько иначе, чем я думал. Последующие эксперименты с оригинальным AM подтвердили это.
Подумаю на досуге, как СМ сможет эмулировать такое поведение...

Кстати, а где почитать-то подробнее, кроме той вики? И как сейчас работает CM? Разве не так, как описано в вики: вырезаются div-ы и span-ы, содержащие ключевой текст?


	Сообщить модератору Записан

Михаил

Модератор

Репутация: +337/-14
Offline

Offline

Сообщений: 5513

Re: Content Master v. 1.XX - расширение HC для очистки страниц от ре&

« Ответ #1438 : 10 июля 2014, 13:31:03 »

Цитата: YuS от 10 июля 2014, 13:00:25

Почитать больше негде. В Wiki я увидел:
"Before checking for keywords in these divs and spans, Ad Muncher will first extract and isolate any nested divs/spans."
Прочитав эту фразу и посмотрев на приводимые ниже примеры, я заподозрил, что AM против ожидания ищет задаваемый правилом кусок не во всем содержимом элемента <div>...</div> (так сейчас ищет СМ), а в "усеченном" его варианте.
Т.е. АМ берет содержимое элемента <div>...</div>, вырезает из него содержимое всех вложенных элементов <div> и <span>. И только оставшийся после этого вырезания кусок проверяет в соответствии с правилом 'Remove divs spans with text'.
Нелогичный с моей точки зрения подход, но это факт - работает АМ именно так.
К примеру, есть на сайте такой элемент:

<div>
в Южной америке насчитывается более 140 рек<div>Здесь может идти какой угодно кусок сайта</div>ламы обитают в бассейне реки Урубамба
</div>

Правилом 'Remove divs spans with text: рекламы' оригинальный АМ все это вырежет полностью, т.к. перед применением правила он выкинет из div кусок, выделенный красным.

И такое вот безобразие нужно попытаться внедрить в СМ. Соотнеся такое поведение с внутренней организацией СМ я понял, что сделать это будет непросто...


	Сообщить модератору Записан

YuS

Ветеран

Репутация: +30/-4
Offline

Offline

Сообщений: 701

crazy

Re: Content Master v. 1.XX - расширение HC для очистки страниц от рекламы

« Ответ #1439 : 10 июля 2014, 14:15:59 »

Ага, спасибо, вот теперь понятно, что происходит и в CM, и в оригинале.
Действительно, какой-то нелогичный подход. Правильнее, было бы вырезать ближайший блок, содержащий ключевой текст, а если его начать предварительно делить на вложенные куски, потом склеивать остатки, то и оформление может поплыть... и главное, если таких элементов на страницах будет много, то значительно увеличится ведь нагрузка на проц, а она и сейчас уже немаленькая от HC


	Сообщить модератору Записан

Страниц: 1 ... 70 71 [72] 73 74 ... 77 Вверх

Отправить эту тему Печать

« предыдущая тема следующая тема »