Cómo extraer contenido de un HTML con htmlSQL

Enlaces patrocinados:

Con la popularización del RSS es muy fácil obtener contenido de ciertos sitios web para manipular esa información de diferentes maneras, pero ¿qué hacemos cuando no tenemos RSS ni nada por el estilo? para esto existe htmlSQL que se trata de una clase escrita en PHP que te permite acceder a los valores de un documento HTML de una manera muy fácil tal y cómo se hace una consulta en SQL. Esto quiere decir que no tendrás que escribir funciones complejas o expresiones regulares para extraer valores específicos de un HTML. Un ejemplo sencillo de una consulta es la siguiente:

htmlsql_example.png

Esta consulta da cómo resultado una matriz (array) con todos los enlaces href y títulos title de las etiquetas a que contienen el atributo: class="list".

Cómo usar htmlSQL

Soalmente tienes que incluir los archivos “snoopy.class.php” y “htmlsql.class.php” en tus scripts PHP al descargar vienen algunso ejemplos para que veas su modo de uso que es muy simple.

Página de descarga y demo cabe destacar que la licencia de este script es la BSD license.

Enlaces patrocinados:
Enlaces patrocinados:
Enlaces patrocinados:

7 Comentarios (Agrega el tuyo)

  1. Comentado 12 de Noviembre de 2007 a las 4:53 AM | Permalink | Responder ↓

    excelente!! como no lo vi antes!?? :)

    muy bueno el blog.. abrazo.

  2. miguel
    Comentado 1 de Diciembre de 2007 a las 9:06 PM | Permalink | Responder ↓

    hola quisiera como sacarl el contenido el video de una pagina que es de pago….e tratado con el programa (web copier) y me saca todos los documentos html de la pagina pero mi prolema es como sacar solo el video de que esta dentro del documento html
    para poder tenerlo en mi pc o quemarlo en un cd
    con el tiempo..gracias por tu ayuda …si tienen alguna ayuda escriban a wlinviter@hotmail.com

  3. Comentado 10 de Febrero de 2009 a las 4:28 AM | Permalink | Responder ↓

    Muy bueno el blog

  4. deybi
    Comentado 13 de Septiembre de 2009 a las 2:27 PM | Permalink | Responder ↓

    Miguel descargate REAL PLAYER, esta en el pack que ofrecer google.
    Una vez lo tengas instalado en tu compu, abrelo, haz clic en archivos….nuevo,,,,pagina web,,,, y pega en la nueva ventana la dirección de la página en la que se encuentra el video. Espera que el video abra por completo, tiene que leerlo todo, luego Daz clic derecho sobre el video y selecciona descargar. Creo que lo mismo se puede hacer en Internet Explorer y Firefox, por supuesto primero ten instalado el Real Player.

    Lo que hace Real Player es instalar un plugins especial que permite descargar video de cualquier página web, no conozco ninguna en la que no me de la opción de descargar.

  5. Gilbert
    Comentado 16 de Septiembre de 2009 a las 10:31 AM | Permalink | Responder ↓

    como hago para extaer de una web:http://www.topkoks.nl/carriere.aspx?id=198&search=1,
    el titulo, fecha, contenido de ese link, empresa que hizo esa oferta.

    he utilizado snoopy y htmlsql, y este codigo, pero no me da, que me hace falta?:
    include_once(”../snoopy.class.php”);
    include_once(”../htmlsql.class.php”);

    $wsql = new htmlsql();

    // set a individual agent:
    $wsql->set_user_agent(’MyAgentName/0.9′);

    // set a new referer:
    $wsql->set_referer(’http://www.topkoks.nl/carriere.aspx?id=198&search=1′);

    // connect to a URL
    if (!$wsql->connect(’url’, ‘http://www.topkoks.nl/carriere.aspx?id=198&search=1′)){
    print ‘Error while connecting: ‘ . $wsql->error;
    exit;
    }

    /* execute a query:

    This query returns all links:
    */
    if (!$wsql->query(’SELECT href, title FROM a’)){
    print “Query error: ” . $wsql->error;
    exit;
    }

    // fetch results as array
    foreach($wsql->fetch_array() as $row){

    print_r($row);

    }

    GRacias

Escribe un Comentario

Su correo nunca será publicado ni compartido. Los campos requeridos están marcados *

*
*

Comment moderation is enabled. Your comment may take some time to appear.

Trackbacks a este artículo: (URL del trackback)

  1. [...] Descubro en el blog de Carlos Leopoldo una genial librería escrita en php, que nos permite acceder a contenido html de sitios web remotos desde nuestra aplicación, mediante consultas tipo SQL: htmlSQL. [...]

  2. Por Links interesantes: PHP | el 33 en 11 de Octubre de 2008 a las 11:15 AM

    [...] Carlos Leopoldo: screen scrapping a lo SQL. [...]

Estudios Kurin - Técnicas de video y fotografía

Preguntas realizadas por los usuarios:

ejemplo htmlsqlextraer contraseña hotmail de mi pcextraer solo html webobtener contactos hotmail script tipo facebookextraer correos en phpclase htmlsqlphp extraer enlaces de websfuncion php extraer linkscreacion de formularios en lightwindow 2.0como extraer documento de una pagina Htmlsql, Extraer contenido de una pagina con php, Extraer HTML, Extraer informacion html, Como extraer contraseñas de hotmail, Expresiones regulares extraer html, Clase php "formularios rapidamente", Matriz simple de leopold, Php extraer contenido de pagina web, Extraer links php, Extraer html con tags con php, Eliminar imagen del hi5 snoopy, Php extraer enlaces de webs, Documento html extraer, Ejemplos para usar la clase htmlsql, Extraer un video de una web html, Ejemplo htmlsql, Extraer html php, Extraer informacion php formulario html, Creacion de formularios en lightwindow 2.0, Extraer correos en php, Como extraigo un video con codigo html, Como extraer las imagenes del hi5 de otros, HTML como extraer, Clase htmlsql, Extraer datos hml de un sitio, Programa para estraer contraseña de hotmail.com, Extraer solo html web, Extraer datos de un sitio con php, Extraer tags de una página + php, Extraer enlaces html, Extraer myspace layouts, Extraer contraseñas de hotmail, Como extraer la contraseña hotmail, Programas gratis extraer contraseñas de hotmail, Como extraer todo lo de un sitio web, Aplicacion web extrae html, Script extraer correo php, Extraer contraseña hotmail de mi pc, Extraer documentos de sitios web, Extraer foto borrada facebook, EXTRAER campos html, Lightwindow, Script para extraer información de un correo, Extraer contenido multimedia de una pagina, Como extraer la contraseña de hi5, Como extraer la contraseña de hotmail de mi pc, Obtener contactos hotmail script tipo facebook, Como extraer datos de sql al dreamweaver, Extraer un video de una pagina web con mac,