Регистрация...

Eserv Forum / E4 / Mail / Удаляется файл Relearn.esp

wikipost // (v1)
Продукты и услуги Скачать Документация Купить Поддержка Форумы Партнёрам Статьи О компании
Обнаружилась неприятная хрень — при перезапуске сервиса acFilter удаляется файл Relearn.esp, соответственно — всё обучение фильтра идёт лесом. Что может быть?
SP: License check done. SP: Base2: D:\E4\CommonPlugins\acFilter\antispam\spamprotexx\Relearn.esp SP: Base1: D:\E4\CommonPlugins\acFilter\antispam\spamprotexx\Storage.esp SP: Init OK SP: CPC OK SP: CP OK SP: CP.advice OK

В логах чисто всё вроде-бы, это вот при рестарте сервиса даётся.
 
Комментарии к этой версии (13.07.2011 11:53) [~shajtan] 4d9df940
Комментарии к версии 2 (13.07.2011 11:53) [~shajtan] 41a9638e
АвторДатаТекстtags
ac13.07.2011 14:16
Как мне объясняли в Агаве, Relearn — это временный файл, используемый только в момент перестроения базы Storage. Поэтому о его исчезновении можно не беспокоиться, всё обучение в Storage (если его дата не меняется, то это тоже не означает, что ничего туда не записывается, там запись через filemapping). Можно для теста повторно классифицировать прошедшую ранее через обучение почту и по изменениям вероятностей в логе убедиться, что всё работает.
wikipost
shajtan13.07.2011 15:05
А как тогда объяснить, что после перезапуска сервиса та почта, которая раньше стабильно определялась как спам, начинает валить в "инбокс"?

Эксперимент с повторным обучением чуть попозже проведу, отпишусь о результатах.
wikipost
ac13.07.2011 16:12
shajtan пишет: А как тогда объяснить, что после перезапуска сервиса та почта, которая раньше стабильно определялась как спам, начинает валить в "инбокс"?

Наверное все-таки что-то в этой почте изменилось...

P.S. Проверил файлы Relearn.esp на своих двух серверах — у меня они при перезапуске не удаляются. На eserv.ru, например, его размер 12Мб, датирован сегодняшним днем (Storage.esp 18Mb), acFilter перезапускался пару дней назад.
wikipost
shajtan13.07.2011 16:12
Что-то я не понял... перекидываю письмо из "входящих" в "спам", на одно говорит
========== LEARN =================================================================== D:\E4\DATA\domains\loniir.ru\xxx\spam\3596.532269218.153.eml => spam SP_Prob=1.000000 SP=ok D=2


а на другое (не такое-же, просто тоже спам)
========== LEARN =================================================================== D:\E4\DATA\domains\loniir.ru\xxx\spam\3596.532200156.151.eml => spam SP_Prob=0.410426 SP=RCd: D:\E4\DATA\domains\loniir.ru\xxx\spam\3596.532200156.151.eml 1 D=2


Почему в первом письме выдавало SP_Prob=1.000000 и оно при этом было отправлено во "входящие"?

По поводу обучения в Storage — а что, размер его и время доступа в принципе меняться не будет никогда? У меня он всего 13 метров, и датой от 30.07.2010. При этом Relearn за сегодняшний день (после перезапуска сервиса и обучения на сотне-другой писем) вырос на мегабайт.
wikipost
shajtan13.07.2011 16:34
ac пишет: Наверное все-таки что-то в этой почте изменилось...

Совершенно стандартные сообщения — рассылки, например — которые попадали в спам и были переквалифицированы как чистые, определяются как нормальные до перезапуска и падают в спам после. То-же самое со спамом — стандартный спам типа "переезд" или "как уберечься от проверок", который после обучения чётко валился в "спам", после перезапуска и обнуления файла Relearn начинает падать во "входящие".
wikipost
ac13.07.2011 16:45
Найдите в указанном файле Message-ID этого письма и по логу классификации входящей почты посмотрите, какая вероятность у него была на момент приёма. Наверное за время между приёмом письма по SMTP и переносом его в spam его (или очень похожее другое письмо) уже провели через спам-обучение. Может не вы, а другой ваш пользователь.

Размер старых обученных баз действительно меняется редко, т.к. почти все слова он уже знает, а меняет только их счетчики, что не сказывается на размере БД, т.к. все числа в БД имеют один и тот же размер. Так размер БД PopFile у нас перевалил за 50 Мб уже очень давно, но сейчас его размер все еще 53Мб.
wikipost
Работает на Eserv/5.05567 (10.02.2020)