Con la popularización del RSS es muy fácil obtener contenido de ciertos sitios web para manipular esa información de diferentes maneras, pero ¿qué hacemos cuando no tenemos RSS ni nada por el estilo? para esto existe htmlSQL que se trata de una clase escrita en PHP que te permite acceder a los valores de un documento HTML de una manera muy fácil tal y cómo se hace una consulta en SQL. Esto quiere decir que no tendrás que escribir funciones complejas o expresiones regulares para extraer valores específicos de un HTML. Un ejemplo sencillo de una consulta es la siguiente:

htmlsql_example.png

Esta consulta da cómo resultado una matriz (array) con todos los enlaces href y títulos title de las etiquetas a que contienen el atributo: class="list".

Cómo usar htmlSQL

Soalmente tienes que incluir los archivos «snoopy.class.php» y «htmlsql.class.php» en tus scripts PHP al descargar vienen algunso ejemplos para que veas su modo de uso que es muy simple.

Página de descarga y demo cabe destacar que la licencia de este script es la BSD license.