Lección 4 15 min

Archivos de conocimiento y RAG

Sube archivos a tu GPT para convertirlo en experto en tu tema. Aprende los límites, formatos óptimos y cómo funciona RAG por dentro.

🔄 En la lección anterior aprendiste a escribir instrucciones con el framework RRAFC — Rol, Reglas, Audiencia, Formato, Conocimiento. Pero las instrucciones solas tienen un límite: le dicen al GPT cómo comportarse, no qué sabe.

Ahí entran los archivos de conocimiento. Es la diferencia entre un GPT que “sabe de marketing” (conocimiento general) y uno que sabe exactamente tu catálogo de productos, tus precios, tus políticas de envío.

Lo que aprenderás

Al terminar esta lección sabrás subir archivos de conocimiento, elegir los formatos correctos, y entender cómo funciona RAG — el sistema que permite a tu GPT buscar en tus documentos antes de responder.

Los números que importan

EspecificaciónLímite
Archivos por GPT20 máximo
Tamaño por archivo512 MB
Tokens por archivo2,000,000
Formatos soportadosPDF, TXT, DOCX, XLSX, CSV, JSON, MD, PPTX
Almacenamiento total~10 GB teórico (20 × 512 MB)

Eso es espacio de sobra para la mayoría de proyectos. Un manual de 200 páginas en PDF pesa típicamente 2-5 MB. Un catálogo de productos en CSV puede tener miles de registros y pesar menos de 1 MB.

Cómo funciona RAG (sin tecnicismos)

RAG = Retrieval-Augmented Generation. En español: “generación mejorada con búsqueda”. Suena complejo, pero el concepto es simple:

  1. Subes tus archivos al GPT (en la pestaña Configure → Knowledge)
  2. OpenAI divide cada archivo en fragmentos pequeños (párrafos, secciones)
  3. El usuario pregunta algo
  4. El GPT busca los fragmentos más relevantes a esa pregunta
  5. El GPT responde usando esos fragmentos como base

Es como si el GPT tuviera un asistente que antes de responder va a buscar en tu archivo la página exacta donde está la respuesta. No inventa — consulta.

Quick Check: ¿Cuál es la diferencia entre un GPT con instrucciones solamente y uno con instrucciones + archivos de conocimiento? (Las instrucciones le dicen al GPT cómo comportarse. Los archivos le dan información específica que puede consultar. Juntos: un GPT que sabe tu tema y responde como tú quieres.)

Formatos: cuáles usar y cuáles evitar

No todos los formatos producen los mismos resultados. Esto importa:

FormatoCalidad de extracciónCuándo usarloCuándo NO usarlo
TXT / MDExcelenteSiempre que puedas
DOCXBuenaDocumentos con estructura simpleDocs con muchas imágenes
CSV / JSONBuenaDatos tabulares, catálogos
PDFVariableSi no tienes el archivo originalPDFs escaneados o con tablas complejas
XLSXAceptableHojas de cálculo simplesMúltiples hojas con fórmulas
PPTXMalaÚltimo recursoSiempre que puedas convertir a TXT

Regla práctica: Si tienes la opción, convierte a TXT o Markdown antes de subir. El GPT extrae texto puro — las imágenes, los gráficos y el formato visual se pierden de todos modos.

Cómo preparar archivos que funcionen bien

La calidad de las respuestas depende directamente de cómo organizas tus archivos. Tres reglas:

1. Un tema por archivo

En vez de subir un documento de 100 páginas con todo, separa:

  • politicas-envio.txt — Tiempos, costos, zonas de cobertura
  • catalogo-productos.csv — Nombres, precios, descripciones, SKU
  • faq-clientes.txt — Preguntas frecuentes y respuestas
  • guia-devoluciones.txt — Proceso paso a paso

¿Por qué? Porque RAG busca por relevancia. Si todo está en un solo archivo gigante, la búsqueda puede traer fragmentos irrelevantes.

2. Estructura clara con headers

# Política de Envíos — TiendaMX
Última actualización: marzo 2026

## Tiempos de Entrega
- Ciudad de México (CDMX): 1-2 días hábiles
- Zona metropolitana: 2-3 días hábiles
- Interior de la república: 3-7 días hábiles

## Costos de Envío
- Pedidos mayores a $999 MXN: envío gratuito
- Pedidos menores: $99 MXN tarifa fija

## Rastreo de Pedidos
Para rastrear tu pedido, visita: tiendamx.com/rastreo
Ingresa tu número de pedido (formato: TM-XXXXX)

Headers claros + información estructurada = respuestas precisas.

3. Incluye metadatos

Agrega fechas, fuentes y versiones. Esto le da contexto al GPT:

Fuente: Departamento de Logística
Vigente desde: 1 de marzo de 2026
Versión: 3.2
Nota: Esta política aplica solo para envíos dentro de México

Quick Check: ¿Por qué es mejor separar la información en varios archivos temáticos en vez de un solo documento grande? (Porque RAG busca por relevancia semántica. Con archivos separados por tema, cada búsqueda trae fragmentos más precisos y relevantes a la pregunta del usuario.)

Ejercicio: prepara y sube tu primer archivo

Vamos a crear un archivo de conocimiento para el GPT de emails profesionales que hicimos en la lección 2.

Paso 1: Crea un archivo TXT con plantillas de email

# Plantillas de Emails Profesionales
Versión: 1.0 | Marzo 2026

## Seguimiento después de reunión
Asunto: Resumen y próximos pasos — [Tema de la reunión]
Cuerpo: Hola [Nombre], fue un gusto conversar contigo sobre [tema].
Quería confirmar los próximos pasos que acordamos: [lista de acuerdos].
¿Te parece bien avanzar con esto? Quedo atento.
Saludos, [Tu nombre]

## Respuesta a cliente insatisfecho
Asunto: Re: [Asunto original]
Cuerpo: Hola [Nombre], lamento mucho la experiencia que describes.
Entiendo tu frustración y quiero resolverlo. [Acción concreta que tomarás].
Te contacto en las próximas [X] horas con una actualización.
Saludos, [Tu nombre]

## Propuesta comercial inicial
Asunto: Propuesta: [Servicio] para [Empresa del cliente]
Cuerpo: Hola [Nombre], gracias por tu interés en [servicio].
Basándome en lo que conversamos, te comparto una propuesta inicial...

Paso 2: Sube el archivo

En el GPT Builder → Configure → Knowledge → sube el archivo plantillas-email.txt.

Paso 3: Actualiza las instrucciones

Agrega a la sección de Conocimiento de tus instrucciones:

CONOCIMIENTO:
- Consulta el archivo 'plantillas-email.txt' para templates de referencia
- Adapta las plantillas al contexto específico del usuario
- Nunca copies la plantilla textual — personaliza con los datos del usuario

Paso 4: Prueba

En Preview, escribe: “Necesito responder a un cliente que se queja porque su pedido llegó dañado.”

El GPT debería usar la plantilla de “cliente insatisfecho” como base pero personalizarla con el contexto específico.

Cuándo NO necesitas archivos de conocimiento

No todos los GPTs necesitan archivos. No los uses si:

  • El GPT solo necesita un estilo o formato específico (las instrucciones bastan)
  • La información cambia diariamente (los archivos son estáticos)
  • El GPT necesita datos en tiempo real (activa búsqueda web en su lugar)

Los archivos de conocimiento son para información estable — catálogos, políticas, manuales, guías. Para datos que cambian constantemente, la búsqueda web es mejor opción.

Puntos clave

  • Puedes subir hasta 20 archivos (512 MB cada uno) como Knowledge
  • RAG = el GPT busca en tus archivos antes de responder
  • TXT y Markdown producen los mejores resultados
  • Separa la información en archivos temáticos, con headers claros
  • Agrega metadatos (fecha, fuente, versión) para dar contexto
  • Los archivos son para información estable — para datos en tiempo real, usa búsqueda web

Siguiente lección

Ya tienes instrucciones y conocimiento. En la siguiente lección vas a aprender a usar las capacidades avanzadas del GPT — búsqueda web, DALL-E, análisis de datos — y cómo diseñar conversaciones que guíen al usuario naturalmente hacia mejores resultados.

Comprobación de Conocimientos

1. ¿Cuántos archivos puedes subir a un GPT como Knowledge?

2. ¿Qué formato de archivo produce los mejores resultados con RAG?

3. ¿Qué significa RAG en el contexto de GPTs personalizados?

Responde todas las preguntas para comprobar

Primero completa el quiz de arriba

Skills Relacionados