Optimizacion del spamlookup Keyword filter

Aunque este es un blog modesto, un día, de la noche a la mañana, el spam comenzó a crecer de forma inusual. Tenía instalados todos los módulos conocidos para evitar estos problemas pero algo tuvo que ocurrir para que dejaran de funcionar tan eficientemente.
Vaya por delante que soy un usuario de Movable Type, uno de esos productos comerciales por los que hay que pagar, aunque en mi caso tengo una licencia gratuita, porque yo lo valgo. Hoy en día todos los blogs tratan de usar WordPress, pero yo prefiero este porque es con el que me crié cuando tuve la página alojada en Zonalibre.
Tenía instalados los módulos antispam más importantes:
Nofollow, que lo que hace es decirle a los buscadores que no tengan muy en cuenta en sus valoraciones los links que se encuentren en los comentarios a un blog.
SpamLookup Link, que establece unas puntuaciones al comentario recibido en función del número de links que este tenga y las direcciones a las que apunte.
SpamLookup Keyword Filter, que detecta palabras susceptibles de ser texto de un spam (como Viagra o casino) y trata de valorarlas como spam o no.
Askimet, que es una base de datos centralizada que analiza el conjunto del mensaje y compara con una base de datos de direcciones IP, textos y comentaristas spammers, para evitar todo el trabajo y tachar como spam cualquier mensaje repetitivo.
Askimet es el sistema antispam preferido por todos, porque no exige esfuerzo ninguno. Es por ello que los que mandan comentarios de spam se preocupan especialmente por engañarle a él. Aún así funciona bastante bien.
El caso es que tuve que pulsar donde no debía y desinstalé Askimet. Como esta extensión es más propia de WordPress, la instalación sobre Movable Type no es del todo trivial – tampoco es complicada – se me ocurrió mirar qué hacían los otros dos sistemas antispam. El Keyword Filter en particular venía tal cual con los valores por defecto, con lo que no paraba ni un mensaje de correo.
Estuve buscando un poco y di con la página de un tipo enfermo que se ha dedicado a optimizar su configuración del Keyword Filter hasta el último detalle. Hasta tal punto ha llegado su obsesión que incluso ha escrito una mejora para el módulo del Keyword Filter, mejora que debe considerarse como extraoficial.
La lista que da esta persona es fantástica y detiene los comentarios de spam con una gran fiabilidad.
Aún así, decidí incluirle un par de modificaciones menores. Al fin y al cabo casi todos los comentarios de spam están escritos en inglés, y dado que esta página está en cristiano, me resultaría muy extraño que un guiri dejara un comentario en su idioma. Así, para los que tengamos páginas en español, no tiene sentido que con el gran filtro que supone el Keyword Filter sigamos sufriendo tantos mensajes basura.
Al anterior filtro he añadido un par de claúsulas añadidas por mi experiencia cotidiana:
/cool site/ 4
/Cool site/ 4
/Nice site/ 4
/nice site/ 4
/Good site/ 4
/good site/ 4
/Thank you/ 4
/Hi!/ 4
/Cool design/ 4
/teens/ 4
/magnificent/ 4
/Magnificent/ 4
Estas frases son los típicos encabezados cutres de los mensajes de spam. Me alegra su educación saludando y sus elogios a mi página, pero puedo vivir sin sus comentarios.
Desde entonces apenas si llega spam. Luego me atreví a instalar de nuevo Askimet, pero ya no hace falta, el spam recibe tantas tortas del filtro por palabras que ya no le quedan fuerzas para salir indemne.
Por supuesto todas estas medidas son temporales, los spammers encontraran la forma de evitarlas, pero hay que provocarles a que agudicen su ingenio.
Aquí tenéis el listado completo por si alguien quiere descargarlo. Basta irse al Keyword Filter ->Settings -> Keywords to Junk y pegar el texto del fichero anterior.
Todo el mérito de ese filtro se debe a esta persona. Que a mí poner un link no me cuesta nada.

Compra mi libro en Amazon.es o Amazon.com.

5.99€ ebook, 14.99€ libro pasta blanda.

4 comentarios sobre “Optimizacion del spamlookup Keyword filter”

  1. Cool site.
    [Comentario zrubavel:
    SpamLookup Link Memory +1.0 Link was previously published (comment id ****).
    SpamLookup Email Memory +1.0 E-mail was previously published (comment id ****).
    SpamLookup Keyword Filter -4.0 Word Filter match on ‘/Cool site/’: ‘Cool site’.
    Akismet +2.0 Akismet says ham
    Te has salvado por un pelo.]

  2. ¿No te agrada el método de la imagen de números y letras retorcidos, que hay que introducir tal cual? Es el más «divertido» para los comentaristas y parece el más aceptado por diversos portales.
    Aunque no tengo un blog, de vez en cuando me da por ponerme a pensar en métodos eficaces de validación que descarten a los robots. Casi siempre giran en torno a pasatiempos, como el de completar la frase: «En un lugar de La Mancha, de cuyo … no quiero acordarme» (Para enviar el comentario, introduzca la palabra que falta).

  3. Hace unos años trabajé como «azafato» en la universidad ayudando a la gente que se matriculaba ella sola mediante ordenador. Lo primero contra lo que se enfrentaban era un casillero donde tenian que introducir la contraseña que les habian hecho llegar por carta. Hubo un tipo que me llamó para preguntarme por qué cuando escribia en el casillero solo le salian asteriscos. No podia introducir la contraseña porque no salian letras en su ordenador.
    Las contraseña no solo filtra a spammers. También impide el paso de otro tipo de gente.

  4. Estoy de acuerdo con que la contraseña no sólo filtra a los spammers, a veces la clave a teclear tampoco es identificable por el que hace un comentario, y después de un par de intentos alguna vez he acabado por no comentar… Aun así reconozco que es más cómodo que andar revisando listas de palabras clave de vez en cuando según se va variando el contenido de los mensajes incordio, aunque me imagino que a la larga también esa protección se acabará rompiendo, es como lo de los sistemas anti-copia, sólo son anti-copia durante un par de meses, o si el sistema lo usa poca gente con lo cual no hay mucha gente interesada en romperlo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *