Convertir archivos XLSX a CSV en Python

Convertir archivos XLSX a CSV en Python

En este artículo aprenderás a realizar la conversión de archivos XLSX a CSV utilizando Python. Para aquellos que no tienen experiencia en programación, los formatos XLSX y CSV son utilizados para almacenar datos en tablas. Sin embargo, el primero es un formato más completo que el segundo, lo que lo hace más difícil de manejar. Afortunadamente el lenguaje de programación Python nos permite realizar esta tarea de manera rápida y eficiente.

📋 Aquí podrás encontrar✍
  1. Requisitos previos
  2. Convertir archivos XLSX a CSV en Python
    1. Paso 1: Importar el módulo openpyxl y cargar el archivo XLSX
    2. Paso 2: Seleccionar la hoja a convertir
    3. Paso 3: Crear un archivo CSV y escribir en él
  3. Conclusión
  4. Preguntas frecuentes
    1. ¿Para qué se utilizan los formatos XLSX y CSV?
    2. ¿Qué es pip?
    3. ¿Cómo puedo asegurarme de tener instalado el módulo openpyxl?
    4. ¿Cómo puedo seleccionar una hoja específica dentro del archivo XLSX?

Requisitos previos

Antes de empezar, necesitarás tener instalado Python en tu computadora, así como el módulo openpyxl, el cual podrás instalar fácilmente utilizando pip.

Convertir archivos XLSX a CSV en Python

Para realizar la conversión de un archivo XLSX a CSV en Python, sigue los siguientes pasos:

Paso 1: Importar el módulo openpyxl y cargar el archivo XLSX

Para empezar, deberás importar el módulo openpyxl utilizando la siguiente línea de código:

import openpyxl

Posteriormente, podrás cargar el archivo XLSX utilizando la función load_workbook() de la siguiente manera:

workbook = openpyxl.load_workbook('archivo.xlsx')

Donde 'archivo.xlsx' es el nombre de tu archivo XLSX.

Paso 2: Seleccionar la hoja a convertir

Una vez que hayas cargado el archivo XLSX, deberás seleccionar la hoja que deseas convertir a CSV. Para esto, utiliza la función active(), la cual seleccionará la hoja activa por defecto.

worksheet = workbook.active

Si deseas seleccionar una hoja específica, utiliza el nombre de la hoja en lugar de la función active(). Por ejemplo:

worksheet = workbook['Hoja1']

Donde 'Hoja1' es el nombre de la hoja que deseas seleccionar.

Paso 3: Crear un archivo CSV y escribir en él

Para finalizar, debemos crear un nuevo archivo CSV y escribir en él los datos de la hoja seleccionada. Primero, crea un objeto csv.writer utilizando la librería CSV. Después, itera sobre cada fila en la hoja seleccionada utilizando un loop for y escribe los datos de cada celda utilizando la función writerow().


import csv

with open('archivo.csv', 'w', newline='') as file:
writer = csv.writer(file)
for row in worksheet.iter_rows(values_only=True):
writer.writerow(row)

Donde 'archivo.csv' es el nombre que deseas darle a tu archivo CSV.

Conclusión

El proceso de convertir archivos XLSX a CSV en Python es sumamente sencillo, gracias al módulo openpyxl y a la librería CSV. Con este proceso, tendrás la capacidad de convertir archivos de manera fácil y rápida, lo que te permitirá optimizar el flujo de trabajo en tu proyecto.

Preguntas frecuentes

¿Para qué se utilizan los formatos XLSX y CSV?

Ambos formatos se utilizan para almacenar datos en tablas, pero XLSX es más completo que CSV.

¿Qué es pip?

Pip es el sistema de gestión de paquetes utilizado para instalar y administrar módulos de Python.

¿Cómo puedo asegurarme de tener instalado el módulo openpyxl?

Puedes ejecutar el siguiente comando en la terminal de tu sistema: pip freeze | grep openpyxl.

¿Cómo puedo seleccionar una hoja específica dentro del archivo XLSX?

Utiliza el nombre de la hoja en lugar de la función active(). Por ejemplo: worksheet = workbook['Hoja1']

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir