Кстати, а где почитать-то подробнее, кроме той вики? И как сейчас работает CM? Разве не так, как описано в вики: вырезаются div-ы и span-ы, содержащие ключевой текст?
Почитать больше негде. В Wiki я увидел:
"Before checking for keywords in these divs and spans, Ad Muncher will first extract and isolate any nested divs/spans."
Прочитав эту фразу и посмотрев на приводимые ниже примеры, я заподозрил, что AM против ожидания ищет задаваемый правилом кусок не во всем содержимом элемента <div>...</div> (так сейчас ищет СМ), а в "усеченном" его варианте.
Т.е. АМ берет содержимое элемента <div>...</div>, вырезает из него содержимое всех вложенных элементов <div> и <span>. И только оставшийся после этого вырезания кусок проверяет в соответствии с правилом 'Remove divs spans with text'.
Нелогичный с моей точки зрения подход, но это факт - работает АМ именно так.
К примеру, есть на сайте такой элемент:
<div>
в Южной америке насчитывается более 140 рек
<div>Здесь может идти какой угодно кусок сайта</div>ламы обитают в бассейне реки Урубамба
</div>
Правилом
'Remove divs spans with text: рекламы' оригинальный АМ все это вырежет полностью, т.к. перед применением правила он выкинет из div кусок, выделенный красным.
И такое вот безобразие нужно попытаться внедрить в СМ. Соотнеся такое поведение с внутренней организацией СМ я понял, что сделать это будет непросто...