¿Cómo transcribir el audio de un pódcast?

Suscríbete donde escuchas tus podcasts: Apple | Spotify | Google | PocketCasts | Overcast | iVoox | CastBox | TuneIn | Stitcher.

Google ya indexa podcasts y una estrategia que puede ayudarte para que tengas más visibilidad allí, es crear una transcripción de tu audio. Sin embargo, hay que reconocer que dependiendo de la duración de los capítulos de tu pódcast, transcribirlos puede ser una tarea tediosa y costosa. En este BlogPod te proveemos la información que necesitas para decidir si lo haces. Aquí te hablamos de los beneficios que tendrías, consejos para hacerlo bien y las herramientas disponibles.

Beneficios de transcribir tu pódcast

Aunque los podcasts se crean para ser escuchados, esto no significa que la transcripción del audio no sea necesaria. Tener el contenido de tu pódcast por escrito es conveniente por las siguientes razones:

Ayuda a tus oyentes:

  • Al Google indexarlo más personas te encontrarán y aumentarás la posibilidad de que te escuchen.
  • Los que tienen discapacidad podrán seguirte.
  • Los que escuchan podcasts para aprender el castellano o, los que hablan nuestra lengua como segundo idioma tendrán una mejor comprensión.Recuerda que los podcasts a diferencia de la radio son internacionales.
  • Los más interesados podrán profundizar en el tema que presentas.
  • Los que no tienen suficiente tiempo para escuchar un capítulo completo, la transcripción puede ayudarles a explorar el contenido.
  • Los investigadores de un tema encontrarán fácilmente lo que dijeron tus invitados y podrán citarlos en un artículo, ensayo o libro que estén creando y tu pódcast podría aparecer como referencia en su bibliografía.

Te ayuda en tu trabajo:

  • Te facilita buscar citas en el texto para implementar el marketing de tu programa.
  • Si vas a entrevistar nuevamente a un invitado, con las notas puedes explorar lo que dijo anteriormente y así evitar hacerle preguntas repetitivas.
  • Si algún día decides escribir un libro o un artículo para tu blog y quieres citar a un entrevistado con las transcripciones, puedes buscar palabras clave y acelerar el proceso. No tienes que escuchar cientos de grabaciones o recorrer de memoria, lo que dijo en el pasado para usar una cita de un invitado.

Ejemplo de uso de las transcripciones para generar recursos

Las notas de un pódcast se pueden utilizar en una estrategia de monetización. Mixergy las está usando para generar recursos. Mixergy es una plataforma que ayuda a los emprendedores que están comenzando un Start Up proveyéndoles entrevistas y cursos con gente que ha logrado el éxito. Su énfasis principal son las entrevistas en su pódcast para emprendedores, considerado uno los más populares. Puedes escuchar los nuevos podcasts gratuitamente, pero sólo por un tiempo. Después de que el capítulo se archiva los clasifican por temas y solo está disponible para miembros que pagan una subscripción ‘Premium’. La transcripción del texto completo sigue siendo publicada en el sitio web para que todos la puedan leer. Esto ayuda a que los suscriptores potenciales exploren el contenido y si les gusta, unirse al sitio de acceso ‘Premium’.

La importancia del SEO para la visibilidad

Desde que Google comenzó a indexar los audios de los podcasts estos están apareciendo en la plataforma de búsquedas número uno del mundo. Tal parece que Google está creciendo en la identificación de palabras clave verbalizadas dentro de los podcasts / vídeos para poder clasificarlos. Esto le da una importancia clave porque no solo tu pódcast aparece allí, sino que pueden escucharlo en esa plataforma. Por eso, es esencial estar en Google, para que aumentes las posibilidades de que te escuchen.

Uno de los podcasts más populares en inglés ‘This American Life’ que supera el millón de descargas semanales, decidió hace unos años comenzar a publicar las transcripciones de sus capítulos. Como resultado tuvieron un crecimiento en la indexación del contenido en Google.

Según 3 PlayMedia lograron un aumento de:

  • 4,18% en visitantes únicos.
  • 6,38% de personas que vinieron por búsqueda orgánica.
  • 3,89% de enlaces entrantes a páginas donde estaban las transcripciones.
  • 7,23% de todos los visitantes vieron las transcripciones.

¿Cómo hacer una transcripción?

Las transcripciones se pueden hacer por seres humanos o mediante un ‘software’ de reconocimiento de voz. Si haces una transcripción manual palabra por palabra te podría tomar hasta cuatro veces la duración de una conversación. Por eso, muchos utilizan la transcripción automática y luego la editan. Pero hay implicaciones que debes conocer:

  • La precisión. No son 100% perfectas. Ninguna herramienta que utilice ‘software’ de reconocimiento de voz te dará transcripciones sin errores. No importa el servicio que uses, tendrás que hacer algún trabajo de edición.
  • El costo. Tener una transcripción de calidad puede ser costoso si estás creando capítulos con mucha frecuencia. Las tarifas de ‘freelancers’ varían pero los servicios de transcripción profesionales podrían comenzar alrededor de los $50 por mes.

Hay tres maneras de transcribir el contenido de un audio:

  • Transcribir palabra por palabra (en el caso de un pódcast en solitario o la narración de una historia).
  • Transcribir haciendo ediciones (en el caso de una entrevista).
  • Transcribir para escribir un artículo (basado en el capítulo en audio).

Transcribir palabra por palabra
No recomiendo hacer tus propias transcripciones porque es algo que toma mucho tiempo, particularmente si esa no es tu profesión. Además te distrae de lo más importante. Escuchar cada show (otra vez) para transcribirlo en el formato adecuado te quita tiempo para crear un contenido que añade valor.

Existen servicios de transcripción que pueden ser útiles. Los hay costosos, económicos y gratuitos. Los caros casi siempre son de mejor calidad, pero se puede conseguir calidad a un bajo precio. Por ejemplo, en ‘Fiverr’ pagué $6.00 por una buena transcripción de un audio de una hora pero no todos los ‘freelancers’ de esta plataforma hacen un buen trabajo. Tendrás que dedicar tiempo a probar diferentes proveedores hasta encontrar el más adecuado.

Esta es una decisión que tienes que tomar considerando tu tiempo.

Uno de los formatos más populares en el podcasting son las entrevistas. La calidad de la transcripción de una entrevista comienza antes de grabarla. Lo primero es pedirle permiso al invitado para grabar. Luego, es esencial darle algunas sugerencias para que la grabación desde su lado sea clara y sin ruidos que distraen y afectan la transcripción. La claridad del audio es clave para lograr un mejor resultado. También asegúrate de que el entrevistado usa un micrófono externo o un auricular con micrófono integrado. No es recomendable usar el micrófono del ordenador que por lo regular tiene una calidad pobre. Muchas ‘laptops’ tienen abanicos ruidosos que afectan la calidad del audio. Si están hablando a través de un teléfono, asegúrate de que lo hagan directamente al micrófono de ese dispositivo.

Transcribir haciendo ediciones
Un problema que resuelve este método es que no hablamos como escribimos. La manera en que nuestro cerebro procesa el discurso es muy diferente a la manera en que se procesa la escritura.

Por supuesto, el contenido influye mucho en la decisión de transcribir automáticamente. Si incluyes terminología técnica, la transcripción es más delicada. Por eso, siempre es recomendable editar todo lo que se transcribe.

Transcribir para escribir un artículo
En Vía Pódcast hemos probado esta estrategia convirtiendo algunos podcasts de entrevistas en artículos donde se destacan las ideas principales de la entrevista. El post se publica con un enlace al capítulo del pódcast.

Consejos prácticos para transcribir un pódcast

  • Formatea todo el texto de la transcripción como si fuera una entrada de blog. Eso implica editar, añadir subtítulos, etc. Los motores de búsqueda le dan a las publicaciones similares a los blogs mucho más peso que a las transcripciones sin editar o mal formateadas.
  • Asegúrate de poner en la transcripción los nombres de todos los participantes. Identifica a cada participante con su nombre y apellido la primera vez que hablan y luego solamente con el nombre. Muchas transcripciones de podcasts de entrevistas no invitan a la lectura. No identifican quién está hablando y muchas veces no editan nada para facilitar el entendimiento. Hablamos diferente a como escribimos. Aun cuando la transcripción sea casi perfecta, es bueno editarla para facilitar la claridad (lo puedes informar al principio o al final de la transcripción). Por supuesto, la edición no puede cambiar el significado de lo que se dice. También es recomendable usar negritas e itálicas y otros recursos de presentación gráfica para facilitar la lectura. Ejemplo de estos métodos son los podcasts Radio Ambulante, que narra historias y Smart Passive Income Podcast que contiene entrevistas con Pat Flynn.
  • No incluyas todo el contenido hablado. Si hay algo que consideras que no es relevante, elimínalo.
  • Describe la información relevante sobre el tono y la emoción del que habla. Esto se suele indicar entre corchetes, por ejemplo: ”No me gustas esto” (gritó) o «Marta dijo: Eso fue un error ( en un tono muy bajo)
  • Los segmentos del audio que no son muy relevantes los puedes poner entre paréntesis, utilizando minúsculas y cursivas.
  • En algunos casos, las transcripciones deben ser literales, incluyendo «sonidos de pensamiento» como um… ah…. e indicando las pausas. Esto también puede ser una buena práctica para la accesibilidad, ya que crea una representación exacta del audio para aquellos que no pueden experimentarlo.

¿Cuáles servicios de transcripción te pueden ser útiles?

Hay muchos servicios que transcriben audio, pero algunos de los más populares no funcionan con el castellano (por ejemplo Rev, Otter y Temi).

Estos son algunos de los servicios y herramientas digitales que puedes usar para convertir tu archivo de audio en texto al español. (No están en orden de importancia). Algunos no solo transcriben un audio, sino que pueden hacerlos desde un vídeo, FB Live, o Zoom y varios pueden crearte subtítulos en español para un vídeo

Descript

Descript se está convirtiendo en una gran opción para los podcasters y creadores de vídeo porque combina la transcripción con la edición del audio. Subes tu archivo de audio o vídeo en la plataforma, le das 2-3 minutos para que lo procese y recibirás una transcripción. Luego, te facilita editar el archivo de audio directamente desde la transcripción. Es decir, que todo lo que eliminas de la transcripción, desaparece de tu grabación. También puedes añadirle música o efectos de sonido a tu audio o vídeo. Con Descript puedes transcribir el vídeo y exportarlo con el texto, o con subtítulos.

Pero Descript es más que un servicio de transcripción pues además, quieren convertirse en un servicio para grabar, editar y publicar tu pódcast con el servicio ‘Descript Podcast Studio’.

Las transcripciones son creadas por el software de reconocimiento de voz, pero si lo deseas puedes contratar a un transcriptor humano para que mejore la precisión de la transcripción a través de la herramienta.

Descript acaba de lanzar Overdub Stock Voices (sin cargo adicional) que te permite crear un clon ultrarrealista de tu propia voz. Con esta función, que está alimentada por ‘Lyrebird AI’, puedes agregar tu voz a un audio simplemente escribiendo las palabras en el libreto. Lo puedes usar para substituir una línea que quieres decir de otra forma. También ofrecen ‘Overdub Stock Voices’, un servicio de ‘voice off’ que te permite añadir a tu pódcast otras voces muy naturales. Se cree que en un futuro, para un pódcast en solitario, tu podrás simplemente escribir un guión y la inteligencia artificial producirá el audio en tu voz.

Te ofrecen gratuitamente para que pruebes su herramienta de edición de audio / video y hasta 3 horas de transcripción del audio (solamente una vez). Si te gusta puedes comenzar con el plan que además de permitirte usar su plataforma de edición del audio/vídeo te da 10 horas de transcripción del audio por 15.00 US$ al mes. Este plan incluye la capacidad de sintetizar una voz a partir de un texto. El ‘plan Pro’ además de darte 30 horas de transcripción y acceso a grabar y editar tu pódcast, te ofrece: Overdub, Filler Words Pro (que elimina palabras que se repiten), Audiograms Pro y Publish Pro. Más información aquí.

Trint Es un servicio usado por The Washington Post y Associated Press.

Utiliza inteligencia artificial para transcribir automáticamente. Subes los archivos de audio y vídeo al software en línea que te transcribe utilizando el reconocimiento de voz automatizado. Trint tiene una buena presentación que facilita la búsqueda, verificación y edición de las transcripciones generadas por la máquina. Si tienes una duda en la transcripción puedes hacer clic en la linea del texto y te lleva al audio de la transcripción. Esta plataforma de transcripción de voz a texto con sede en Londres tiene una gran futuro. Su última ronda de financiación fue respaldada por The New York Times Company. El año anterior había recibido inversiones de The Associated Press. Trint no tiene versión gratuita, pero te ofrece una prueba gratis. El plan Starter cuesta por 7 archivos (de cualquier duración) 60.00 US$ al mes.

Sonix Al igual que Descript, este servicio también te permite editar tu pódcast al editar el manuscrito. Sonix es una plataforma en línea El equipo de producción del popular pódcast Radio Ambulante lo utiliza para la transcripción de sus entrevistas. Subes un archivo a Sonix y en poco tiempo recibes un correo electrónico, un enlace a la transcripción , notificándote que tu transcripción ha finalizado. La transcripción incluye marcas de tiempo, resaltado y funcionalidad de edición. Sonix ofrece una versión gratuita y una prueba gratis. La transcripción se paga por uso. Perfecto para trabajos basados ​​en proyectos. La versión de pago de Sonix está disponible a partir de 10.00 US$ la hora.

HappyScribe Otro servicio que también funciona basado en la inteligencia artificial. Ha sido utilizado por el diario El Mundo, ABS, Spotify, la BBC y Forbes. También ofrecen subtitulado de vídeos. Happy Scribe no tiene versión gratuita, pero ofrece una prueba gratis. La versión de pago está disponible a partir de 14.24 US$ la hora.

GoTranscript Están localizados en el Reino Unido, y ofrecen un plazo de respuesta de 6 horas y una precisión del 99% a .65 centavos por minuto.

Auphonic Hay otras plataformas que actualmente ofrecen transcripciones de voz a texto como el servicio de Auphonic que cuesta mucho menos que contratar a un ser humano para transcribir. Pero como era de esperar, los resultados pueden ser graciosos o ininteligibles en el peor de los casos.

SpeechText es otra alternativa. Subes el audio de tu pódcast y en menos de 5 minutos tienes la transcripción. Puedes probar gratuitamente el servicio. A diferencia de otros que cobran una suscripción, SpeechText te carga por un máximo de minutos. El plan de pago ‘Starter’ comienza en 10 al mes (por 180 minutos de uso) para un podcast en solitario. Para podcasts de entrevistas tiene el Plan ‘Personal’ que cuesta 19,00 US al mes por 380 minutos. Además ofrecen una herramienta de edición del texto online que te permite hacer allí tus revisiones. Ellos aseguran que su sistema puede identificar quién habla durante una entrevista que se transcribe.

Software

InqScribe Software para Mac que permite transcribir o exportar subtítulos. Cuesta $99.00

Dragon Professional Un software que no es barato (cuesta 300,00 US$) pero que es de un solo pago. Aseguran que este software es capaz de tomar dictados a una velocidad de escritura equivalente a 160 palabras por minuto, con una tasa de precisión del 99%. Si tienes los recursos esta parece también una buena alternativa para podcasters profesionales.

Otros servicios de transcripción al castellano son:

¿Cómo algunos podcasts muestran la transcripción?

This American Life coloca un enlace para la transcripción debajo del reproductor. Cuando abres la página comienza con la siguiente introducción:

This American Life se produce para el oído y está diseñado para ser escuchado, no para ser leído. Le animamos a que escuche el audio, que incluye emoción y énfasis que no aparecen en la página escrita. Las transcripciones se generan utilizando una combinación de software de reconocimiento de voz con transcriptores humanos y pueden contener errores. Por favor, compruebe el audio correspondiente antes de citarlo en una publicación.

Freakonomics publica la transcripción como parte del contenido del capítulo, debajo del reproductor del pódcast. Incluyen una caja indentada, con una marca de un color diferente, para indicar a las personas que hablan que identifican con el nombre y así las diferencian del narrador.

Conclusión
Hay muchas ventajas en transcribir y publicar las notas de un pódcast. Sin embargo, toman tiempo y cuestan dinero. Evalúa el resultado esperado vs el costo y decide. Si llegas a la conclusión de que debes hacerlo como parte de tu estrategia digital hazlo bien. Asegúrate que la transcripción sea correcta y que no afectará tu sitio y pódcast. Decide una estrategia para ponerla visible y evalúa los resultados para saber si funciona.

Apasionado con el poder de la voz y la intimidad de los podcasts.  Produce diariamente con Aracely Rivera la newsletter “Via Podcast” y su resumen en audio “NotiPod Hoy”. Allí realizan una curaduría de las noticias y tendencias que están inspirando y transformando el podcasting en español. Los podcasts que ha creado han sido premiados cinco veces. Enseña en la Academia de Podcasting. Tiene un MBA en marketing y una amplia experiencia en la radio,  el marketing digital y la formación internacional. Síguelo en las redes sociales: @melvinriverav

Patrocinadores de ORO :

Patrocinadores de PLATA:

¡Las últimas noticias, tendencias y herramientas del podcasting en 5 minutos o menos!

.