Lección 3 15 min

Organizacion de Datos y Estructura de Tablas

Estructura tus datos correctamente con tablas nombradas, validacion de datos, formato consistente y tecnicas de limpieza que hacen el analisis confiable.

La Hoja de Calculo Que Nadie Podia Usar

El reporte de ventas tenia celdas combinadas que abarcaban tres columnas. Los nombres de region estaban en encabezados de fila, no en una columna. Algunos meses estaban abreviados (“Ene”), otros escritos completos (“Enero”). Dos productos tenian espacios al final de sus nombres, creando duplicados invisibles. Cada formula fallo. Cada tabla dinamica fallo.

Los datos estaban ahi. La estructura los hizo inutilizables.

Al final de esta leccion, organizaras datos para que formulas, tablas dinamicas, graficos y analisis con IA funcionen perfectamente.

🔄 Repaso rapido: En la leccion anterior, dominamos IF, SUMIF y funciones de texto. Recuerdas como SUMIF busca coincidencias en un rango? Si ese rango tiene datos inconsistentes (“Norte”, “norte”, “NORTE “), tu formula no capturara todas las entradas. Hoy prevenimos esos problemas en la fuente.

Las Reglas de una Buena Estructura de Datos

Regla 1: Una Fila = Un Registro

Cada fila debe representar una sola observacion, transaccion o entrada. Sin celdas combinadas que abarquen filas. Sin filas de resumen mezcladas con filas de datos.

Mal:

RegionVentas Q1Ventas Q2
Norte$50,000$62,000
Sur$45,000$51,000

Bien:

RegionTrimestreVentas
NorteQ1$50,000
NorteQ2$62,000
SurQ1$45,000
SurQ2$51,000

La version “buena” tiene mas filas pero funciona con todas las herramientas: SUMIF, tablas dinamicas, filtros y graficos.

Regla 2: Una Columna = Un Atributo

Cada columna debe contener un tipo de informacion. No mezcles nombres y titulos en una columna. No pongas ciudad y estado en una celda.

Regla 3: Sin Filas ni Columnas en Blanco

Las filas en blanco rompen rangos de datos, referencias de tablas y tablas dinamicas. Si necesitas separacion visual, usa formato (bordes, colores), no filas vacias.

Regla 4: Encabezados Solo en la Fila 1

Una fila de encabezados clara. Sin encabezados en multiples lineas. Sin celdas de encabezado combinadas. Los encabezados deben ser unicos, descriptivos y cortos.

Quick Check: Recibes una hoja de calculo donde los meses son columnas (Ene, Feb, Mar…) y los productos son filas. Por que esto es problematico para el analisis? Como lo reestructurarias?

Convirtiendo a Tablas Formales

Tanto Excel como Google Sheets tienen funciones formales de “Tabla” que agregan capacidades poderosas:

Excel: Selecciona tus datos -> Insertar -> Tabla (Ctrl+T) Google Sheets: Selecciona tus datos -> Formato -> Colores alternos (para tabla visual) o usa vistas de filtro

Beneficios de las tablas formales:

  • Expansion automatica cuando agregas nuevas filas
  • Referencias estructuradas en formulas (=SUM(Ventas[Monto]) en vez de =SUM(C2:C100))
  • Filtrado y ordenamiento integrado
  • Formato automatico que persiste con nuevos datos
  • Rangos nombrados que se actualizan automaticamente
Tengo datos organizados asi:
[describe tu estructura actual]

Ayudame a:
1. Identificar problemas estructurales
2. Sugerir el formato correcto de tabla plana
3. Escribir formulas o pasos para reestructurar los datos
4. Recomendar encabezados de columna y tipos de datos
5. Sugerir reglas de validacion de datos para cada columna

Validacion de Datos

La validacion de datos previene datos malos en el punto de entrada.

Listas Desplegables

Para columnas con opciones fijas (Estado, Departamento, Region):

Excel: Datos -> Validacion de datos -> Lista -> Ingresa opciones separadas por comas Google Sheets: Datos -> Validacion de datos -> Desplegable

Rangos Numericos

Para columnas que deben contener numeros dentro de un rango (Edad: 18-100, Calificacion: 1-5):

Ambos: Validacion de datos -> Numero -> Entre -> Establece minimo y maximo

Restricciones de Fecha

Para columnas de fecha (Fecha de inicio debe ser posterior a 2020):

Ambos: Validacion de datos -> Fecha -> Despues de -> Establece la fecha

Quick Check: Tienes una hoja de calculo donde cualquiera puede escribir cualquier cosa en la columna “Departamento”. Que problemas podria causar esto para SUMIF y tablas dinamicas? Como los previene la validacion de datos?

Esenciales de Limpieza de Datos

Los datos del mundo real son desordenados. Estas tecnicas los limpian:

Eliminar Duplicados

Excel: Datos -> Quitar duplicados Google Sheets: Datos -> Limpieza de datos -> Quitar duplicados

Estandarizar Texto

Usa formulas para limpiar antes de analizar:

  • =TRIM(A2) — Elimina espacios extras
  • =PROPER(A2) — Estandariza mayusculas
  • =SUBSTITUTE(A2, " ", " ") — Reemplaza dobles espacios por uno solo

Encontrar y Corregir Inconsistencias

Tengo una columna de nombres de departamento que deberian
estar estandarizados. Estos son los valores unicos que encontre:
[listalos, ej. "Mktg", "Marketing", "marketing",
"Marketing ", "MARKETING"]

Escribe una formula que convierta todas las variaciones
al nombre estandar correcto. Usa TRIM, UPPER e
IF/SWITCH segun sea necesario.

Manejar Datos Faltantes

Decide una estrategia antes de analizar:

  • Eliminar filas con datos criticos faltantes
  • Llenar con valores predeterminados (0 para numeros, “Desconocido” para texto)
  • Marcar para revision con formato condicional

La Lista de Verificacion de Organizacion de Datos

Antes de ejecutar cualquier analisis, verifica:

Revisa la estructura de mi hoja de calculo:
[describe o pega datos de ejemplo]

Verifica contra mejores practicas:
1. Cada fila es un solo registro?
2. Cada columna es un solo atributo?
3. Hay filas o columnas en blanco?
4. Hay exactamente una fila de encabezados?
5. Hay celdas combinadas? (Deben eliminarse)
6. Los tipos de datos son consistentes en cada columna?
7. Hay duplicados ocultos (espacios extras, diferencias
   de mayusculas)?
8. Estos datos funcionarian en una tabla dinamica tal como estan?

Intentalo Tu Mismo

Toma una hoja de calculo desordenada con la que hayas trabajado (o crea una con problemas deliberados: celdas combinadas, nombres inconsistentes, filas en blanco). Limpiala:

  1. Descombina todas las celdas
  2. Reestructura en formato de tabla plana (una fila por registro)
  3. Estandariza texto con TRIM y PROPER
  4. Agrega validacion de datos a columnas con opciones fijas
  5. Convierte a una Tabla formal (Ctrl+T en Excel)

La hoja de calculo limpia deberia funcionar perfectamente con SUMIF, tablas dinamicas y graficos sin ajustes adicionales.

Key Takeaways

  • La estructura correcta de datos (una fila por registro, una columna por atributo) es la base de todo analisis en hojas de calculo
  • Celdas combinadas, filas en blanco y encabezados en multiples niveles rompen formulas, tablas dinamicas y filtros
  • Las tablas formales (Ctrl+T en Excel) agregan expansion automatica, referencias estructuradas y filtrado integrado
  • La validacion de datos al ingresar previene las inconsistencias que causan errores de analisis mas adelante
  • Siempre limpia los datos antes de analizar: elimina espacios con TRIM, estandariza mayusculas, quita duplicados
  • La IA puede identificar problemas estructurales y escribir formulas de limpieza desde una descripcion de tus datos

Up Next

En la Leccion 4: Funciones de Busqueda, dominaremos VLOOKUP, INDEX-MATCH y XLOOKUP, las funciones que conectan datos entre diferentes tablas y hojas.

Comprobación de Conocimientos

1. Por que los datos deben organizarse en formato de 'tabla plana'?

2. Que es la validacion de datos y por que deberias usarla?

Responde todas las preguntas para comprobar

Primero completa el quiz de arriba

Skills Relacionados