domingo, 22 de abril de 2012

Lectura bibliográfica: Redes asociativas

A continuación os dejo mi lectura bibliográfica sobre Redes asociativas, para la asignatura de Sistemas Inteligentes:

Me ha parecido interesante mencionar que gracias a la utilización de las redes bayesianas se puede filtrar el SPAM del correo electrónico con cierta seguridad, sería seguridad probabilística.
Actualmente se pueden usar listas negras para filtrar el correo, que evitan que lleguen a la bandeja de entrada correos que cumplan ciertas condiciones, como venir de un destinatario concreto, contener archivos adjuntos, ir destinados a un grupo de direcciónes, etc. Estas condiciones y los correos que las cumplen pasan a formar parte de la lista negra.
Por otra parte se podrían crear listas blancas, que solo permiten la entrada de correos que cumplan determinadas condiciones.
En cambio, el uso de redes bayesianas se basa en la probabilidad de que un correo que contiene una palabra sea SPAM. A esto va añadiendo probabilidades de que si contiene una palabra "A" también contenga una palabra "B" y sea SPAM.
También se analizan aspectos no textuales del correo, como puede ser que se haya enviado a altas horas de la noche (suele ser típico de spammer), o el porcentaje de carácteres alfanumérico, así como el número de receptores o bien el nombre del dominio de procedencia.
Existen técnicas basadas en redes bayesianas que aplican diferentes conceptos como pueden ser las de Sanami, que extraen las características típicas de un correo SPAM y las analizan. Existen otras técnicas como las de Pantel y Lin, que explicarlas se saldría de los conceptos que se quieren abarcar en la asignatura, y extendería demasiado esta lectura bibliográfica.

No hay comentarios:

Publicar un comentario