Método para la extracción masiva de canales de sindicación

  • Manuel Blázquez Ochando Departamento de Biblioteconomía y Documentación de la Facultad de Ciencias de la Documentación de la Universidad Complutense de Madrid
Palabras clave: Minería de datos, Extracción de datos, Web crawler, Sindicación de contenidos, RSS, Canales de sindicación

Resumen

Uno de los problemas para la investigación de la producción informativa de canales de sindicación es contar con la cantidad de fuentes suficientes y del mismo dominio, temática o área de conocimiento, para componer una muestra. Esto se debe a la dispersión de las fuentes de información en la Web y por otra parte a la dificultad del investigador para conocer todos los recursos disponibles. A estos problemas se suma la dificultad de extraer y localizar los enlaces de los canales de sindicación en cada recurso o sitio web pertinente que se descubre. En este artículo se aborda el método para extraer los canales de sindicación mediante la composición de semillas para el análisis, con programas web crawler, identificando la configuración y posterior preparación.
Publicado
2017-06-13
Cómo citar
Ochando, M. (2017). Método para la extracción masiva de canales de sindicación. Scire: Representación Y Organización Del Conocimiento (ISSNe 2340-7042; ISSN 1135-3716), 23(1), 39-45. Recuperado a partir de https://ojs.ibersid.eu/index.php/scire/article/view/4300
Sección
Artículos