RATA-MANUAL 2
Sitio: | Aula Virtual de Formación en línea (ISMIE) |
Curso: | CREACIÓN MULTIMEDIA: IMAGEN, AUDIO Y VIDEO PARA EL DÍA A DÍA DEL DOCENTE 2025 (CONTENIDOS) |
Libro: | RATA-MANUAL 2 |
Imprimido por: | Invitado |
Día: | jueves, 26 de junio de 2025, 17:58 |
Tabla de contenidos
- 1. Conceptos básicos del audio digital
- 2. Antes de grabar: consejos y buenas prácticas
- 3. Grabación de audio con móvil o tableta
- 4. Grabación y edición de audio con Audacity
- 5. El pódcast como herramienta educativa
- 6. El diseño sonoro en la creación audiovisual
- 7. Consejos para evaluar nuestro audio
- 8. Herramientas I.A. en la generación y tratamiento del sonido
1. Conceptos básicos del audio digital
Ahora que hemos superado el entrenamiento en Imagedón y dominamos todas las técnicas maestras para manejar las imágenes a nuestro antojo, vamos a pasar al siguiente elemento de importancia dentro del audiovisual: el sonido.
Además de un medio de comunicación, especialmente útil en programas de radio o podcast, donde es el único elemento que nos conecta con nuestros oyentes, el sonido es una potente herramienta en producciones de video, donde nos ayudará a crear ambientes, transmitir sensaciones y captar la atención del espectador. Un mal sonido entorpece la comunicación y desvía la atención de lo que queremos contar, y por eso es muy importante cuidar la calidad del mismo. Pero antes de empezar a grabar y editar nuestros primeros audios es importante conocer algunos conceptos básicos.
Lo primero que necesitamos saber es la diferencia entre el sonido analógico y el digital, siendo éste segundo el que vamos a trabajar con nuestros equipos de alta tecnología. El sonido analógico es el que se almacena, procesa y reproduce por medio de circuitos electrónicos y otros dispositivos analógicos, por ejemplo, un cassete o un disco de vinilo. Y el sonido digital es el que se almacena, procesa y reproduce en medios digitales, como un disco duro o un teléfono móvil.Dentro del sonido digital nos podemos encontrar con distintos formatos de archivo, que se distinguen unos de otros por la compresión y codificación aplicada, y podemos identificarlos por su extensión (.mp3, .wma, etc.):
Formatos de audio sin comprimir, como WAV o AIFF, que permiten grabar archivos sin pérdida de calidad y, por ello, son los formatos más aconsejables para grabación y edición de audio. Conservan más cantidad de información, permiten manipulaciones más extremas sin degradación del sonido y garantizan una calidad adecuada para sacar posteriormente un archivo comprimido.
Formatos de audio comprimidos sin pérdida, como FLAC, Apple Lossless O WMA Lossless. Son formatos de muy buena calidad pero suelen ser incompatibles con muchos de los programas de edición. En caso de querer usarlos en nuestra producción, es aconsejable pasarlos antes a un formato más “amigable” para la edición, por ejemplo, WAV.
Formatos comprimidos como MP3, WMA o AAC. En este sistema de codificación se descarta parte de los datos del audio, en particular las frecuencias no audibles por el ser humano, intentando mantener la calidad del sonido. Son archivos más prácticos, fáciles de procesar y requieren menos espacio de almacenamiento. La degradación del sonido de los archivos comprimidos variará dependiendo del tipo y la tasa de compresión aplicada: un MP3 con bitrate (cantidad de datos almacenados por segundo) de 320 kbps se acerca a la calidad del CD y a 192 kbps la mayoría de la gente no distinguiría el archivo original del comprimido. Por debajo de eso, sí es perceptible una pérdida de calidad.
La compresión también puede ser CBR (constant bitrate) aplicando la misma tasa de compresión por igual a todo el archivo, VBR (variable bitrate) cuyo algoritmo analiza el audio y decide qué partes son susceptibles de ser más comprimidas y cuáles deben retener más información o ABR (average bitrate), que aplica una compresión variable pero manteniendo una tasa media definida previamente, por ejemplo 192 kbps.
Ejemplo de distintos formatos de grabación en una aplicación de móvil y el tamaño por hora de grabación
Otros elementos que debemos conocer, en particular si vamos a trabajar con archivos sin compresión, son la profundidad de bits, la tasa de muestreo y el número de canales:
Profundidad de bits (o bit depth): número de bits utilizados para representar cada muestra de la señal. A mayor número de bits, mayor resolución, que a su vez se traduce en mayor rango dinámico de la señal digitalizada. Lo habitual es 16 bits (por ejemplo, el CD) o 24bits (DVD), siendo está segunda opción la ideal si nuestro grabador o editor de sonido lo permite, ya que no existe diferencia de tamaño entre las dos y los 24bits reducirán los problemas de distorsión al grabar con una señal de entrada muy alta y los ruidos generados al subir el volumen en nuestro programa de edición.
Tasa de muestreo (o sample rate): cantidad de veces que se registra el sonido analógico por segundo, para ser reconstruido digitalmente. Podemos asimilarlo a la cantidad de cuadros (frames) por segundos en un video, necesarios para crear la ilusión de movimiento. Éste valor también hace referencia a la frecuencia máxima (sonido más agudo) que puede reproducirse en el archivo.
Lo habitual suele ser trabajar en 44.1 kHz (igual a 44.100 muestras por segundo) y 48 kHz, siendo esta última la recomendable por ser la frecuencia más utilizada en el mundo del vídeo.
Canales o número de pistas que componen un sonido. Pueden ser mono (producen el sonido en una sola pista), estéreo (producen el sonido a través de dos pistas distintas, izquierda y derecha) y sonido multicanal (por ejemplo, el sonido 5.1, que producirá un efecto envolvente si lo reproducimos en un sistema con 6 altavoces). En general, los micrófonos profesionales graban en mono y los incluídos en ordenadores, móviles, etc. en estéreo.
2. Antes de grabar: consejos y buenas prácticas
Para organizar la resistencia, la comunicación es fundamental y no podemos dejar que nuestros mensajes tengan problemas de sonido. Con nuestros equipos ATA (Alta Tecnología Animal), y un poco de maña, podremos mejorar nuestras grabaciones, pero para conseguir un sonido casi perfecto es muy importante que estas grabaciones se hagan con la máxima calidad posible. Aquí tienes algunos consejos que te pueden venir bien para conseguirlo:
Si es posible, grabar con micrófono profesional y/o externo, y preferentemente unidireccional, que son aquellos que tienen mayor sensibilidad en una única dirección, discriminando el resto de sonidos del entorno, y que son los más adecuados, por ejemplo, para grabar la voz.
Distintos tipos de micrófonos idóneos para grabar voces
Si no disponemos de un micrófono o una grabadora de mano, y tienes que grabar con el micrófono del móvil, la cámara o el ordenador, lo ideal es mantenerlo a una distancia cercana pero lo suficientemente alejada para que el aire que sale de tu boca no provoque ruidos molestos. También hay que tener especial cuidado con cualquier tipo de ruido por muy pequeño que sea, el del teclado o un bolígrafo por ejemplo, porque estos micrófonos son omnidireccionales y captan por igual todo lo que suena a su alrededor.
Hacerlo en lugares silenciosos y con buena acústica, evitando zonas donde el sonido pueda reverberar o producir eco. Los sitios pequeños tienden a tener menos problemas en este sentido. Los armarios pueden servir como cabina insonorizada y elementos como las cortinas, alfombras, libros, etc. son de mucha ayuda para evitar reverberaciones indeseadas.
En caso de no poder hacer uso de un espacio aislado de ruido, intenta grabar a la hora del día más tranquila.
Si se graba en la calle, alejarse de zonas con tráfico y ruido constante y proteger al micrófono de cualquier tipo de viento que pueda estropear al audio.
Antes de empezar a grabar nuestra locución o podcast, es conveniente hacer pruebas de sonido y comprobar qué tal suena en diferentes dispositivos, de manera que no nos llevemos sorpresas desagradables una vez que tengamos todo grabado.
En caso de que en nuestra producción suenen varios elementos a la vez (diálogo, música, efectos sonoros…) lo ideal es grabarlos por separado y posteriormente mezclarlos en la edición, aplicando un volumen y ecualización correcta, de forma que unos elementos no tapen a otros.
Si posteriormente a la grabación vas a editar el sonido con Audacity o una aplicación similar, es conveniente dejar unos segundos de silencio al inicio que permitan al software tener una referencia sonora del ruido que micrófono y entorno generan, de forma que posteriormente pueda eliminarse o reducirse de forma más precisa.
2.1. Grabar locuciones
La locución es una parte muy importante del audiovisual. Permite transmitir ideas y mensajes de manera clara y efectiva, ya sea a través de la radio, un podcast o como voz en off de un video. Puede que no todos tengamos una gran voz o estemos entrenados en el arte de la locución, pero antes de grabar podemos seguir varios consejos para que nuestro mensaje resulte más comprensible y atractivo para el oyente:
Preparar un guion bien estructurado y comprensible
Usar frases cortas y simples. Evitar frases complejas, subordinadas, etc. que pueden hacer perder el hilo al espectador.
Marcar pausas. Cada frase debe estar enfocada a un solo concepto.
Repetir palabras y conceptos. Ayuda a contextualizar y a enfatizar.
Lee en voz alta el guion varias veces antes de grabar. Familiarízate con el contenido, marca con negritas o colores las palabras que debas remarcar y las pausas que debas hacer.
Voz dinámica. Evita el tono monótono y aburrido y haz uso de inflexiones para marcar conceptos clave. Utilizar un tono de cercanía, dirigiéndote directamente al oyente, también ayuda a generar interés
Vocaliza y proyecta la voz correctamente
Repite. Es inevitable trabarse o equivocarse durante la locución. No hay problema, repite la frase o párrafo tantas veces como sea necesario, dejando una pausa entre repeticiones para que después sea más fácil de editar en postproducción.
3. Grabación de audio con móvil o tableta
Los dispositivos electrónicos que usamos día a día ya integran sus propias aplicaciones de grabación de audio. Son herramientas sencillas, fáciles de usar y sin muchas opciones de edición pero que serán suficientes para obtener grabaciones de audio de buena calidad. En esta clase vamos a aprender cómo sacarles el máximo partido. Y si la aplicación de tu móvil no te gusta o quieres mejorar la calidad de las grabaciones, al final te mostramos como usar la aplicación Dolby ON.
En Android puedes encontrar diferentes aplicaciones de grabación, dependiendo de la marca y el dispositivo. Algunas nos permitirán más opciones de configuración pero su uso principal será muy parecido.
El funcionamiento es muy sencillo: bastará con pulsar el botón de grabación para empezar a grabar:
Volver a pulsar para pausar la grabación:
Pulsar de nuevo para reanudarla y, finalmente, una vez que tengamos la grabación completa, podremos guardarla asignándole un nombre.
Mediante el menú de la aplicación o con cualquiera de los iconos de compartir podremos descargar el audio, enviarlo a nuestro correo electrónico o almacenamiento en la nube, etc.
SI la aplicación lo permite, es aconsejable configurar la grabación con la máxima calidad posible, preferentemente en WAV / AIFF, o si no es posible, en MP3 / AAC / m4A con el máximo bitrate posible
Algunos modelos de móvil tienen incluso la capacidad de transcribir el audio mientras realizamos la grabación.
En iOS, se puede usar la aplicación Notas de voz, asegurándonos de maximizar la calidad del audio en Ajustes
Posteriormente podemos mejorar fácilmente el audio y recortar aquellas partes que nos nos interesen:
Dolby On es una aplicación para ambos sistemas operativos que te permitirá grabar audio y mejorarlo gracias a sus potentes filtros. Aquí tienes un tutorial de cómo usarla:
4. Grabación y edición de audio con Audacity
Audacity es una herramienta de sonido muy potente que entre sus capacidades tiene la de grabar audio a través de los micrófonos de nuestro ordenador. Audio que luego podremos editar y exportar en diferentes formatos. Aquí tenéis unos tutoriales para empezar con el programa y realizar vuestras primeras grabaciones.
Audacity: Introducción y primeros pasos
Audacity: Grabación y retoque de audio
Audacity: Herramientas de edición
Audacity: Filtros y efectos de sonido básicos
4.1. Efectos y filtros de sonido (Galgos)
Ya hemos visto que el primer paso para conseguir un audio de calidad es asegurarse de que la grabación se hace correctamente. Pero si esta no ha sido del todo buena o simplemente queremos dejar nuestro audio aún mejor, existen algunas técnicas y herramientas en los programas de edición que nos pueden ayudar. Primero veremos una explicación teórica de dichas técnicas para posteriormente ver cómo aplicarlo de forma práctica en Audacity.
1. Ecualización
La frecuencia en sonido es una medida de la cantidad de vibraciones sonoras por segundo y es uno de los factores clave que determinan la percepción humana del sonido. Se mide en Hercios (Hz) y determina la altura o tono de un sonido. A mayores hercios, más agudo será el sonido, y a menor cantidad, más grave. La voz humana, por ejemplo, se mueve en un rango medio, entre 50 y 200 hercios para la voz masculina y entre 150 y 350 hercios para la femenina, pero el rango de sonidos que podemos llegar a captar está entre 20Hz y 20.000 Hz.
Distintas frecuencias sonoras, siendo la de arriba la más grave y la de abajo la más aguda
Esto nos permite, por ejemplo, mejorar nuestro sonido eliminando frecuencias que correspondan a interferencias eléctricas, sonidos retumbantes graves, etc. Pero la ecualización también tiene fines creativos: por ejemplo, las llamadas de teléfono de las películas no se graban tal cual, porque el sonido sería deficiente. Se graba de la mejor manera posible y luego se aplican filtros que eliminan las altas y bajas frecuencias, dando al sonido ese reconocible efecto de sonido telefónico.
De una forma similar, cuando grabamos locuciones, podemos aumentar el rango de frecuencias que corresponden a la voz humana de manera que esta suene con más presencia y nitidez.
Ecualización para el efecto de llamada teléfonica
Parámetros de un ecualizador
Los ecualizadores, al igual que cualquier otro procesador de dinámica (como los compresores que veremos más adelante) tienen varios parámetros para controlar cómo afectamos a la señal.
- Frecuencia: Este parámetro nos permite seleccionar qué frecuencia afectamos
- Ganancia: Con la ganancia podemos ajustar el volumen de dicha frecuencia
- Factor Q (ancho de banda): Este parámetro permite ajustar el rango de frecuencia que seleccionamos. A menor Q, mayor rango de frecuencias adyacentes seleccionaremos.
Tipos de filtros de ecualización
-
Filtro paso alto high pass filter: recorte de frecuencias graves que solo permite dejar pasar las frecuencias agudas.
-
Filtro paso bajo o lowpass filter: recorte de frecuencias agudas que solo permite dejar pasar las frecuencias graves.
-
Filtro paso banda o bandpass filter: recorte de frecuencias graves y agudas que solo permite el paso de un rango de frecuencias en concreto
-
Filtro notch: recorte de frecuencias con un factor Q muy estrecho, que normalmente se utiliza para eliminar frecuencias muy concretas, por ejemplo, el acople de un instrumento o una interferencia de sonido de la que sepamos a qué frecuencia pertenece.
En conclusión, la ecualización se realiza para limpiar la señal eliminando frecuencias indeseadas, y en caso de necesitarlo, añadir volumen a las frecuencias que queramos realzar.
Para grabación de voz, un consejo que puede serte útil es realizar un corte en las frecuencias más graves, a menos de 80 Hz, por ejemplo, que no afectan a la voz pero minimiza ruidos innecesarios (generados por la vibración del micrófono/soporte, o causados por el viento, por ejemplo). En el caso de las voces femeninas, como generalmente son más agudas, puedes hacer un corte aún más agresivo (hasta 150 Hz).
2. Reducción de ruido (noise reduction / denoiser / noise removal / noise suppression)
Suele funcionar bien aplicado a sonidos bajos y constantes, como los de los motores eléctricos (aire acondicionado, ventilador, etc.) pero aquellos que son muy fuertes o dispersos son más complicados de reducir.
Estos sonidos pueden tener nombres más específicos como hum (cuando son más graves) y hiss (más agudos). También están los clics (pequeñas crepitaciones constantes o espaciadas) y los crackles (similar al sonido crepitante). Esta configuración puede serte útil al buscar filtros de eliminación de ruidos entre aquellos que tenga tu programa de edición.
Recuerda que cualquier tipo de reducción de ruido afecta afecta a todo el espectro sonoro y a la calidad del audio, produciendo, por ejemplo, un sonido “enlatado” si la aplicamos de forma muy agresiva. Conviene entonces, aplicarla levemente y probar parámetros más potentes poco a poco hasta dar con el punto adecuado para reducir la mayor cantidad de ruido posible en nuestro audio pero sin que pierda realismo.
3. Compresión
En este caso hablamos del control de la dinámica del sonido, no de la compresión de archivos. En términos prácticos, el compresor de audio sirve para nivelar el volumen del sonido, haciéndolo más homogéneo, evitando picos no deseados y asegurando que las partes más sutiles no desaparezcan para mantener el habla siempre inteligible. Es importante para garantizar una experiencia auditiva más agradable y consistente.
El nivel en dB (decibelios) a partir del cual se empezará a aplicar la compresión, o sea, a bajar el volumen de forma automática es el umbral (threshold). En el ejemplo de la imagen está fijado en -12dB, así que todo lo que esté por debajo de -12dB (-13, -14, -15… dB) no sufrirá ninguna modificación en absoluto. El límite inferior de ruido permite que nuestro ruido de fondo no suba más allá del nivel en dB que le indiquemos. La idea detrás de esto es que cuando editemos voces, por ejmplo, no suba el ruido de fondo entre las pausas. En el ejemplo, todo lo que esté por debajo de -40dB no subirá.
La velocidad a la que se disminuirá el volumen, es el tiempo de ataque (attack) y la velocidad con la que el volumen vuelve al nivel normal, tiempo de decaimiento (releaser).
El ratio, es la cantidad de compresión que se va a aplicar. Si, por ejemplo, hemos puesto el umbral en -12dB y aplicamos una proporción de 2:1 y nuestro audio tiene un pico de 0dB, con esta configuración ese pico se verá reducido a -6dB.Es un efecto que hay que aplicar con sutileza para no generar distorsión ni provocar un efecto artificial al sonido. A menudo los softwares incluyen configuraciones predefinidas especialmente pensadas para diálogo y locuciones (voice over, speech o audio leveler).
4. Normalizar
Cuando se normaliza el audio, se aplica una cierta cantidad de ganancia de forma que el archivo alcance un nivel de volumen que nosotros le hayamos indicado. Por ejemplo, si indicamos que el pico de volumen máximo sea -6dB, se aplicará una ganancia proporcional a toda la señal de nuestro archivo que elevará los picos máximos de volumen de nuestro archivo a esos -6dB objetivo pero también afectará al resto del audio.
El objetivo de la normalización no es solo conseguir el máximo volumen para un archivo, también es importante para mantener un nivel constante y equilibrado entre diversos archivos, por ejemplo si tienes un diálogo grabado con dos micrófonos, normalizar ambas pistas impedirá que una de las voces tenga mayor presencia que la otra.
Además de por volumen, existe un proceso de normalización basado en la sonoridad, que tiene en cuenta la percepción humana y que se mide en LUFs. Por ejemplo, una referencia común para el podcasting, es que la señal se ajuste a -16 LUFS, y una plataforma como Youtube recomienda de -13 a -15 LUFS
Orden de los efectos
A la hora de editar audio, el orden de los efectos/plugins puede marcar la diferencia en el resultado. Como recomendación general, es aconsejable seguir esta secuencia de acciones:
-
Ecualizar, para eliminar frecuencias no deseadas, sin aplicarles otros efectos, que podrían empeorar la situación.
-
Reducir el ruido, para que el compresor y otros efectos no te molesten más tarde.
-
Comprimir la señal para nivelar el volumen de tu audio.
-
Normalizar el volumen final del archivo.
Una vez que ya tenemos clara toda la teoría respecto uso de efectos y filtros, es hora de aplicarlos en nuestros audios usando Audacity:
Audacity: Filtros de ecualización
5. El pódcast como herramienta educativa
Como defensores de la inclusión de las tecnologías multimedia en el territorio docente debemos conocer todas aquellas herramientas que nos ayuden a potenciar nuestro trabajo educativo, y una de las que más relevancia ha tomado en los últimos tiempos es el pódcast.
Un pódcast es un formato de audio o video donde los episodios se descargan o transmiten a través de internet, generalmente a través de plataformas como iTunes, Spotify, SoundCloud o iVoox, y cuyo formato es similar al de un programa de radio, una charla o, en el caso de los pódcast de ficción, de una radionovela.
Las razones por la que los pódcast son una herramienta educativa muy potente son los siguientes:
-
Enriquece la experiencia de aprendizaje: los pódcasts pueden incluir entrevistas con expertos, discusiones en profundidad y ejemplos prácticos que enriquecen el aprendizaje.
-
Accesibilidad: pueden ser descargados y escuchados en cualquier momento y lugar, lo que los hace ideales para complementarlos con otra actividad o aprovechar aquellos momentos de espera del día en los que no tenemos nada que hacer, como un trayecto de metro, por ejemplo.
-
Consumo flexible: los estudiantes pueden escuchar los pódcasts a su propio ritmo, pausarlos o volver atrás cuando lo necesiten.
-
Interacción: se pueden incluir secciones de preguntas y respuestas o discusiones en grupo, lo que permite a los estudiantes interactuar y participar en el aprendizaje.
-
Aprendizaje de idiomas: los pódcasts pueden ser una herramienta muy efectiva para mejorar la comprensión auditiva y la pronunciación en un segundo idioma. Escuchar pódcasts en el idioma que se está aprendiendo puede ayudar a los estudiantes a mejorar su comprensión auditiva y a familiarizarse con los acentos y la pronunciación.
Estas razones hacen de los pódcasts una herramienta muy valiosa para complementar la enseñanza tradicional. Pero antes de convertirnos en unos intrépidos podcasters, ¿cuál es el proceso que debemos seguir para crear un pódcast?. En líneas generales, podemos definir cuatro pasos importantes que debemos dar para crear un pódcast:
-
Elegir el tema, definir quién participa y planificar el contenido mediante un guion y/o escaleta.
-
Grabación del pódcast mediante diferentes herramientas (app de móvil o tablet, programas de grabación de audio, aplicaciones especializadas como Anchor, etc.)
-
Edición del pódcast para corregir errores, eliminar pausas innecesarias, añadir música… y todas aquellas opciones para obtener la máxima calidad.
-
Publicación en las plataformas o webs de nuestra elección.
¿Ganas de convertirte en podcaster? Vamos a ver una par de herramientas que nos permitirán grabar pódcasts de forma fácil y con gran calidad.
La primera opción es la más sencilla: mediante la aplicación Spotify for podcasters tendrás todas las herramientas para grabar, editar y publicar el pódcast de una manera sencilla e intuitiva
Spotify for podcasters: grabación y edición de un pódcast
Spotify for podcasters: publicación del pódcast
Audacity: Edición de una intro para pódcast
Audacity: Mezcla automática de vox y música con Autoduck
6. El diseño sonoro en la creación audiovisual
¿Qué pueden tener en común la secuencia de la ducha de Psicosis, las luchas de sable láser de Star Wars o Mario atrapando una seta? Pues que son situaciones que asociamos a un particular sonido, culpable en gran manera de que se hayan convertido en elementos tan conocidos en la cultura popular: la música de Bernard Herrmann en el caso de la película de Hitchcok, o los efectos sonoros en el caso de los sables láser y el simpático fontanero.
Estos ejemplos dan cuenta de lo importante que es el diseño sonoro en cualquier creación audiovisual. Una disciplina artística que se utiliza en una amplia gama de medios, desde películas y videojuegos hasta instalaciones de arte o publicidad.
Como proceso creativo, el diseño sonoro implica la grabación, creación y selección de sonidos que evoquen emociones, acompañen la narración y transmitan información, como la ubicación espacial, el ambiente o la acción en una historia.
Aunque se asocia mucho con el cine, su origen está en la radio, más concretamente en las radionovelas, donde se desarrolló por primera vez un diseño sonoro completo que permitía a los oyentes visualizar las historias e involucrarse mucho más en la narración.
El diseño sonoro en el pódcast
La calidad de un pódcast no solo se mide por la calidad de su sonido, o el interés de los temas que se traten, también es importante saber transmitir lo que se quiere contar, y aquí es donde entra el diseño sonoro. El diseño sonoro en un pódcast es tan importante como el diseño gráfico para un cartel o la portada de un libro. En esencia, es la manera de ordenar los elementos que discurren en él y puede ser una herramienta muy poderosa para crear una experiencia auditiva envolvente y atractiva para el oyente. Entre los elementos que pueden formar parte del diseño sonoro de un pódcast podemos incluir:
Música de introducción: una melodía o pieza musical que se utiliza al comienzo de cada episodio del pódcast para dar una identidad y ambientar el programa. La música de introducción también puede ayudar a establecer el tono del programa y preparar al oyente para lo que se va a discutir.
Efectos de sonido: sonidos específicos que se utilizan para complementar y enfatizar los temas o eventos que se están discutiendo. Por ejemplo, si el pódcast está hablando sobre películas de terror, se pueden utilizar efectos de sonido sobrecogedores para darle ambiente y crear una sensación de tensión. En el caso de una narración, al igual que ocurría con las radionovelas, los efectos de sonido se usan para complementarla. Podemos añadir, por ejemplo, sonidos de fondo para ambientar o dar información sobre la historia que se está contando. Esto ayuda a que el oyente se sienta inmerso en la historia y mejora su experiencia auditiva.
Transiciones: pueden ser música de transición, ráfagas o efectos de sonido que ayudan a separar diferentes segmentos del pódcast y crear una sensación de orden y progreso a través del episodio.
Silencio: aunque pueda parecer lo contrario, es uno de los elementos más importantes del diseño sonoro. No sólo como contraste, entre el ruido y la calma, por ejemplo, sino que tiene usos muy interesantes para hacer que un mensaje sea recordado con más intensidad. Una pausa en el lugar adecuado puede captar la atención del oyente o puede anticipar algo muy importante. Piensa en grandes personalidades de la radio, seguro que la mayoría maneja perfectamente el arte de la pausa y el silencio.
Mezcla y edición: mezcla y edición de los diferentes elementos de sonido (incluyendo voces, música y efectos de sonido), con volumen y ecualización adecuados, para lograr una experiencia sonora coherente y atractiva.
El objetivo es conseguir que estos elementos sonoros entren en el orden y en el momento justo, para que el oyente se sienta inmerso y conectado con el contenido del programa.
7. Consejos para evaluar nuestro audio
Ya hemos visto cómo usar los medidores de sonido para evitar generar audios con un volumen demasiado alto o bajo y los filtros y efectos para darles coherencia y equilibrio. El segundo paso para comprobar que nuestro sonido final está correcto es someterlo a un proceso de escucha adecuado.
Cuando grabemos y editemos nuestros audios y dado que no es habitual contar con altavoces especializados o salas con tratamiento acústico como las que utilizan los profesionales para evaluar el sonido, podemos recurrir a una serie de pruebas para asegurarnos de que el nuestro no sufre ninguna deficiencia.
Por un lado, elige varias referencias de audio similares con las que comparar. Por supuesto, nunca podrás conseguir un sonido exactamente igual, pero revisar pódcasts profesionales te ayudará, por ejemplo, a saber si el sonido del tuyo está demasiado bajo o si la relación entre el volumen de la música y la voz es correcta.
También es aconsejable reproducir tu audio en distintos equipos de sonido: altavoces de ordenador, auriculares, televisión, etc. Es aconsejable probar sobre todo en móviles, por ser hoy en día el mayor dispositivo de reproducción de contenidos audiovisuales, y en altavoces grandes y/o potentes, que nos permitirán detectar errores y problemas de forma más clara que en dispositivos más limitados técnicamente. Reproduce también tus referencias en los mismos equipos y compara los resultados.
Las diferencias entre dispositivos serán evidentes. En algunos de ellos notarás, por ejemplo, graves más potentes o voces más detalladas (por tener ese equipo mayor presencia de las frecuencias medias entre las que se mueve la voz humana). Ajustar el audio para que suene perfectamente en todos ellos será muy complicado, pero te ayudará a encontrar un punto de equilibrio y descartar problemas y errores que puedan pasar desapercibidos en un dispositivo concreto.
8. Herramientas I.A. en la generación y tratamiento del sonido
-
- Adobe Podcast (Enhance Speech): con esta herramienta web de Adobe que hace uso de la I.A. podrás mejorar considerablemente tus locuciones, eliminando de forma rápida el ruido de fondo y afinando las frecuencias relativas a la voz. Solamente hay que arrastrar el archivo a la zona indicada y una vez terminado el análisis, podrás comparar el sonido original con el procesado, antes de descargarlo. La diferencia será notable, sobre todo si el audio es de mala calidad.
-
- Con Suno podrás crear canciones sin necesidad de conocimientos técnicos o musicales. La plataforma permite generar letras, melodías y voces mediante comandos. Incluso puedes partir de tu propia letra y Suno se encarga de crear voces realistas.
Puedes personalizar el tono, estilo y emoción de la música y la interpretación vocal, ajustar la instrumentación y experimentar con diferentes efectos. La versión gratuita permite generar 10 canciones diarias y usarlas para proyectos no comercial.
Aquí tienes un par de ejemplos:
-
- Como alternativa a Suno tienes Udio, que también permite dejar en manos de la IA la creación de la música y la letra, todo a partir de un simple prompt.
El resultado de "Canción sobre un grupo rebelde llamado RAM (Resistencia Animal Multimedia) que lucha a favor de la inclusión de las herramientas multimedia en la docencia. Son perseguidos para obligarles a dejar de usar la tecnología" en estilo folk rock es éste:
-
- JEN tiene como limitación principal que solo podremos crear música instrumental pero a diferencia de otras plataformas garantiza que las canciones creadas con su modelo no incurren en vulneraciones de copyright, puesto que garantizan que ha sido entrenada con música licenciada. También permite reinterpretar una canción a partir de otra que subamos a su plataforma
-
-
Si necesitas una locución pero te da vergüenza ponerte delante del micrófono, siempre puedes recurrir a la I.A. para que genere por ti un audio a partir del texto que necesites locutar. En este tutorial verás cómo hacerlo mediante la aplicación Clipchamp:
-
Generar una locución artificial mediante I.A.
- Con Eleven Labs también podrás crear locuciones realistas a partir de un texto o incluso doblar un video a otro idioma. Lamentablemente la versión gratuita solamente te permitirá 10 minutos de audio al mes.
- Otra opción interesante para crear locuciones es generarlas a partir de texto pero clonando nuestra voz o la de otra persona. Con esta herramienta solo necesitamos un audio de entre 11 y 14 segundos de la voz que queramos clonar, lo subimos a la página web y a partir de ahí podremos generar audios que simularán la voz clonada de manera bastante realista (los resultados serán mejores siguiendo las pautas recomendadas y partiendo un audio con la mejor calidad posible).
¿Eres capaz de adivinar a quién pertenecen éstas voces?
- Con Vocalremover podrás eliminar la voz de una canción o separarla junto al resto de instrumentos y descargarlos individualmente. También ofrece algunas herramientas de edición de audio como grabación, ajuste del pitch, corte o unión de distintos audios, etc.
- Splitter: permite separar los distintos instrumentos y voces de una canción y descargarlos por separado. La versión gratuita permite subir cinco canciones.