Cómo hablar con ChatGPT por voz en 2026 (por fin te entiende)

ChatGPT ahora te escucha mucho mejor — dictado nuevo en todos los planes, incluso el gratis. Aquí te enseño a hablarle, y qué nunca decir en voz alta.

Una amiga tiene un acento bien marcado. El español es su tercer idioma. Durante dos años básicamente se negó a usar la voz en ChatGPT porque le convertía “necesito escribirle al casero por el boiler” en cosas rarísimas. Entonces tecleaba todo.

La semana pasada me escribió: “oye, ¿ya me entiende??”

Sí. Ya te entiende.

El 26 de junio de 2026, OpenAI cambió sin hacer ruido el modelo de dictado detrás de ChatGPT — esa cosa que convierte tu voz en texto. Y salió para todos, incluido el plan gratis. Sin botón nuevo, sin nada que activar. Simplemente empezaste a tener menos de esos momentos de “¿por qué escribió ESO?”. Y encima, el modo de conversación hablada también recibió su lavado de cara, así que todo se siente menos como ladrarle órdenes a un robot y más como platicar de verdad.

Déjame enseñarte a usar los dos — porque son dos cosas distintas, y confundirlas es donde la mayoría se pierde.

Primero: dictado y chat de voz no son lo mismo

Esto confunde a casi todos, así que aclarémoslo antes que nada.

Dictado por voz = tú hablas, y él escribe tus palabras en la caja del mensaje. Después responde en texto, como siempre. Solo te estás saltando el teclado. Piénsalo como una versión mucho más lista del micrófono del teclado de tu celular.

Chat de voz (modo voz) = una conversación hablada de verdad. Tú hablas, él te responde en voz alta. Nada de texto, a menos que mires. Sigue escuchando, puedes interrumpirlo, alcanza a notar cuando haces una pausa. Este es el que se siente como una llamada con una amiga muy paciente.

Aquí la misma idea como imagen:

Dictado por voz
Tú hablas → él escribe tu prompt. La respuesta llega como texto. Solo te saltas el teclado.
Chat de voz
Tú hablas → él te responde en voz alta. Una conversación hablada de verdad, sin manos.
texto en la pantalla qué recibes de vuelta una voz que te habla

Los dos mejoraron este año. La actualización del 26 de junio fue específicamente sobre que la parte de escribir quedara mucho más precisa. El refresh del modo voz es sobre que la parte de hablar de vuelta suene más natural — entonación más suave, pausas reales, menos de ese tono plano de locutor de noticias.

Aquí la página oficial de OpenAI, para que veas que no me lo estoy inventando:

La página oficial de ChatGPT Voice mostrando un celular con el micrófono y los botones de voz, más ejemplos como práctica de idiomas y consejos. Fuente: OpenAI

Qué cambió de verdad el 26 de junio

OpenAI sacó un nuevo modelo de voz-a-texto para el dictado “en todos los planes” — Free, Go, Plus, Pro, Business, Enterprise. Todos. La forma de iniciar el dictado no cambió nada. Solo mejoraron el motor de abajo.

¿Cuánto mejor? En sus propias pruebas, la tasa de error de palabras bajó al menos un 10 % en los idiomas principales — esa es la forma estándar de medir cuántas palabras falla. Diez por ciento menos errores no suena a mucho, hasta que eres tú dictando una nota larga y ya no andas corrigiendo un dedazo cada tres frases.

Las mejoras se notaron sobre todo en:

  • Otros idiomas — japonés, coreano, chino, urdu, vietnamita, y tramos largos de español, francés, italiano y portugués. Ojo con esto: el español de formato largo salió mencionado por nombre.
  • Inglés con acento — como mi amiga. Este es el grande para un montón de gente.
  • Mezclar idiomas a media frase — si al hablar cambias natural entre español e inglés técnico (o sea, casi todos en la chamba lo hacemos), ahora lo maneja mejor.
  • Lugares ruidosos — un café, una oficina llena, la calle.
  • Voz baja o susurrada — para cuando no puedes exactamente gritarle al celular.
  • Letras y números juntos — como leer un código, una dirección o un número de parte. De hecho, para secuencias de letras y números (teléfonos, folios) el español fue uno de los idiomas que más mejoró.

Nada de esto necesita suscripción. Esa es la parte que vale la pena repetir: el plan gratis también recibió esto.

Cómo hacerlo de verdad (en tu celular)

Te lo dejo bien simple.

Para dictar un prompt:

  1. Abre la app de ChatGPT y empieza (o abre) un chat.
  2. Toca el ícono del micrófono dentro de la caja del mensaje — el que está junto a donde teclearías.
  3. Habla. Vas a ver tus palabras aparecer como texto.
  4. Léelo, corrige lo raro, dale a enviar.

Eso es dictado. Sigue siendo tu prompt, sigue siendo texto, solo que lo dijiste en voz alta.

Para tener una conversación hablada:

  1. En la app, busca el botón de voz más grande (normalmente un ícono de onda de sonido o de audífonos, a un lado de la caja de texto).
  2. Tócalo. Empieza a escuchar.
  3. Solo habla, como una llamada. Te responde en voz alta. Puedes meterte cuando quieras.
  4. Toca para terminar cuando acabes.

En la computadora (chatgpt.com en tu navegador) es la misma idea — el micro está en la caja para dictar, y hay una opción de voz para iniciar un chat hablado. Las conversaciones de voz funcionan para cualquiera con sesión iniciada, en las apps del celular y en la web de escritorio.

Un apunte rápido sobre la línea gratis-vs-pago solo para el chat de voz: los usuarios gratis tienen conversaciones de voz, pero con un límite diario (un par de horas) y el modelo más ligero. Los que pagan tienen la voz más completa y natural y uso prácticamente ilimitado. Pero — y esto importa — la mejora de precisión del dictado no tiene candado. Esa la recibimos todos.

Dictar un prompt
Toca el micro 🎙️
Habla
Escribe tus palabras
Revisa + envía ✓
Los mismos cuatro pasos ya sea en el celular o en la laptop.

Para qué lo usa la gente de verdad

Me puse a leer lo que la gente dice realmente en línea — no el marketing, las reacciones reales. Se repitieron unos cuantos patrones, y la verdad son los que también le recomendaría a alguien que apenas empieza.

Pensar en voz alta durante una caminata. Este sale todo el tiempo. La gente sale a caminar, abre el dictado o el modo voz, y nada más divaga — ideas a medias, “no, espérate, quita eso”, todo el desorden con el que uno piensa de verdad. Alguien contó que sale al balcón a hablar sobre un problema atorado en vez de quedarse viendo una hoja en blanco. Es más rápido que teclear y, curiosamente, más honesto. Dices lo que de verdad quieres decir antes de que tu editor interno lo limpie.

Redactar el correo o mensaje pesado. Sostienes el micro y nada más dices la cosa — “dile al casero que el boiler lleva sin funcionar desde el martes, firme pero amable, pregunta cuándo puede venir alguien”. Reconstruye sorprendentemente bien lo que quisiste decir, hasta con todos tus “este…” y “mejor ponle…” ahí metidos. Luego lo lees y lo mandas.

Un usuario lo describió más o menos así en X: hablas, escribe bien — hasta en una oficina abierta ruidosa — y se acabó el volver a teclear todo. Suena exagerado, pero es justo el día a día donde esto brilla.

Practicar otro idioma. Este está buenísimo y a mucha gente le encanta. Puedes tener una conversación de práctica en inglés, portugués, lo que estés aprendiendo — y como el oído mejoró para los idiomas que no son inglés, de verdad entiende tus intentos ahora. Pídele que te corrija sobre la marcha.

Nada más platicar tu día. Algunos usan el modo voz casi como caja de resonancia — una forma de sacarse un pensamiento de la cabeza y escucharlo de vuelta. No es terapia. Pero tampoco es nada.

Qué significa esto para ti

Según quién seas, aquí es donde yo empezaría:

  • Tienes acento, o el español no es tu primer idioma. Empieza aquí, hoy. Esta mejora prácticamente se hizo para ti. Prueba dictar un correo que traes pendiente y mira cuánto le atina ahora. Esta es la razón más grande para darle otra oportunidad a la voz en 2026.

  • Odias teclear en el celular. Usa el dictado para todo — mensajes que estás redactando, notas, preguntas rápidas. Toca el micro, habla, envía. Vas a preguntarte por qué picaste párrafos con los pulgares tanto tiempo.

  • Estás aprendiendo un idioma. Prende el chat de voz y que sea tu compañero de práctica. Pídele que hable despacio, que corrija tu gramática y que se quede en el idioma que quieres. Un tutor que nunca se cansa de ti.

  • Piensas mejor en voz alta que en papel. Sal a caminar, abre el modo voz, y habla sobre lo que traes atorado — un plan, un correo, una decisión. Deja que te haga preguntas de vuelta. Regresas de la caminata con algo escrito.

  • Eres totalmente nuevo en esto. Nada más haz una vez lo del dictado de cuatro pasos. Ya. Toca el micro, di “explícame qué es una hipoteca como si tuviera 12 años”, y lee la respuesta. La voz es la entrada más suave posible a usar IA, porque hablar ya sabes.

Qué no puede hacer (y qué nunca decir en voz alta)

La voz de verdad ya está buena. No es magia. Aquí es donde todavía muerde a la gente — y donde tienes que tener cuidado.

  • Todavía se mete cuando pausas para pensar. La queja más común, por mucho. Te detienes un segundo a juntar la idea, y él da por hecho que ya terminaste y arranca a responder. Molesto. Si eres de hablar lento y pensado, el dictado (hablar-a-texto) suele frustrar menos que el chat de voz completo, porque no te interrumpe.

  • Falla con nombres, marcas y jerga. Nombres poco comunes, nombres de productos, términos técnicos, alguna forma rara de escribir un nombre — le atina de adivinada, y adivina mal. Siempre lee un mensaje dictado antes de enviarlo. Cada vez. La única vez que no lo hagas es la vez que te cambia un nombre.

  • Puede estar simplemente equivocado — y oírlo en voz alta lo hace sonar más seguro de lo que es. Cuando ChatGPT habla con seguridad, tu cerebro lo trata como más confiable — así funcionan las voces con nosotros. Pero aun así puede inventar cosas. Si te dice un dato, una fecha, una dosis, algo legal, un precio — verifícalo. No actúes según una respuesta hablada que no revisaste.

  • Hablar en voz alta en público es… hablar en voz alta en público. La persona junto a ti en el camión oye toda tu conversación. O sea: no dictes nada privado en público — contraseñas, tu dirección, temas médicos, números de cuenta, los secretos de tus amigos. Si es sensible, tecléalo, o espera a estar a solas.

  • Los lugares ruidosos y los acentos todavía lo tumban a veces. Mejoró en ambos. “Mejor” no es “perfecto”. En un bar ruidoso con acento fuerte, cuenta con algunas fallas. Los lugares tranquilos te dan los resultados más limpios.

Nada de esto significa no usarlo. Significa usarlo como usarías cualquier herramienta que es 90 % confiable — genial para un primer borrador, revisado antes de que cuente.

Para cerrar

Hablarle a ChatGPT en 2026 es una experiencia genuinamente distinta a la de hace apenas seis meses. La mejora del dictado llegó para todos el 26 de junio — plan gratis incluido — y si habías descartado la voz porque nunca te entendía, esa razón ya casi no vale. Toca el micro. Di algo. Lee lo que escribió. Esa es toda la habilidad.

Y si quieres ponerte bueno de verdad en qué decir una vez que dominas la parte de hablar — o sea, el prompting real — esa es la parte divertida, y se aprende bien. Nuestro curso gratis de Fundamentos de IA te lleva desde cero, sin experiencia. El curso de Prompt Engineering va más a fondo cuando ya te enganchaste. Y si quieres sacarle todo el jugo a ChatGPT, ChatGPT Avanzado te enseña los trucos que la mayoría no conoce.

Empieza hablándole hoy. En el peor caso, te malentiende y te ríes un rato. En el mejor, nunca vuelves a escribir un mensaje largo en el celular.

Fuentes

Desarrolla Habilidades Reales en IA

Cursos paso a paso con quizzes y certificados para tu currículum