Gestión de la información web usando Python
Author: Sarasa Cabezuelo, Antonio
Publisher: Editorial UOC
Published: 2017-03-05
Total Pages: 178
ISBN-13: 8491164863
DOWNLOAD EBOOKEn este manual se realiza una introducción a un conjunto de herramientas y técnicas para el acceso y procesamiento de datos web, que se encuentran en formatos como XML, CSV o JSON, o bien en bases de datos tanto relacionales como NoSQL. El objetivo de esta obra es acercar al lector estos conocimientos a partir de las herramientas y librerías de un lenguaje de programación concreto como Python, el más utilizado hoy en el área del análisis de datos y big data. El primer capítulo constituye una introducción a Python, que sirve como lenguaje vehicular en el resto de los capítulos, los cuales se dedican a estudiar el acceso y procesamiento de datos en los formatos XML, JSON y CSV. Los siguientes capítulos abordan el acceso a bases de datos relacionales, SQLite y MySQL, y a la base de datos NoSQL MongoDB. En los dos últimos capítulos, se tratan técnicas de extracción de información usando web scraping y programación de páginas web con la framework Bottle. Cada capítulo contiene algunos ejercicios propuestos para fijar las ideas expuestas.