Artículos de WSDM 2008

Gracias al blog Jeff Search Engine Cafe me entero de que los artículos de la Primera Conferencia Internacional de la ACM sobre búsquedas en la Web y minería de datos (WSDM 2008) se pueden descargar de manera gratuita (gracias a Kevin Burton).

Desde hace unos meses he estado trabajando en algo de recuperación de información (Information retrieval) y gracias a esto me he vuelto a interesar en el tema y a dedicarme a uno de mis deportes favoritos: descargar archivos PDF, imprimirlos (cuando se puede) y sentarme a leerlos en las noches.

Hoy comencé a leer Beyond Basic Faceted Search; aunque no lo he terminado, me pareció muy interesante la posibilidad de ampliar los resultados cuando se hace faceted search y, especialmente, la sencillez de la implementación que proponen utilizando Lucene. Espero terminar de leerlo mañana y darle una mirada a los demás.

Tip del día:

Descargar todos los archivos PDF vinculados desde una página usando wget:

wget -r --level=1 --accept=.pdf -L http://example.com/foo.html