Diferencia entre revisiones de «Tecnologías multimedia e interacción/Herramientas de análisis de audio»

Contenido eliminado Contenido añadido
Jacynycz (discusión | contribs.)
Sin resumen de edición
Jacynycz (discusión | contribs.)
Sin resumen de edición
Línea 57:
 
== Detección de acordes ==
[[File:Chordata.jpg|thumb|400px|Mapa de calor de una canción utilizando detección de acordes]]
La detección de acordes viene dada por un análisis avanzado de frecuencias, ya que al disponer los datos de un espectrograma lineal se pueden obtener los acordes que suenan en cada momento. Este sistema, al igual que el de detección de tempo, es probabilista y utiliza un mapa de calor para devolver el resultado más probable del acorde que está sonando. Para hallar los acordes se separan las frecuencias de las notas con sus correspondientes frecuencias armónicas y se añaden al mapa de calor.
 
Línea 62 ⟶ 63:
 
== Obtención de coeficientes cepstrales ==
Los coeficientes cepstrales se obtienen al realizar diferentes transformadas de Fourier sobre una señal de audio. Estos coeficientes son utilizados sobretodo en la clasificación de audio ya que no ofrecen datos con un significado para una representación visual. El más utilizado para el modelado de música y la clasificación de género es el coeficiente de Mel<ref>Logan, B. (2000, October). Mel Frequency Cepstral Coefficients for Music Modeling. In ISMIR.</ref>.
 
== Ecualización de audio ==
Otro de los recursos más utilizados es la ecualización de audio. Esta herramienta permite filtrar las frecuencias, poner límites y eliminar ruido. En lo referente al análisis de audio es utilizado sobre todo para limpiar audios, aislar instruments o eliminar ruido o distorsión. Pero la ecualización de audio es más utilzada en la edición de audio y en los retoques de postproducción musical.
 
= Resultados =
En análisis de audio ofrece resultados que forman parte de la percepción computacional, ya que muchos resultado de los obtenidos son dirigidos a sistemas de aprendizaje automático, reconocimiento del habla o clasificación musical. A continuación se mencionan algunos de los resultados más notables tanto en el mundo académico como en el empresarial:
 
* Análisis de sentimiento, género, instrumentos y voz en la música<ref>Juhan Nam, "Learning Feature Representations for Music Classification," Ph.D. thesis, Stanford University, 2012</ref>.
* Utilización de algoritmos de clustering para clasificación de audio utilizando los datos de la transformada de Fourier de tiempo reducido<ref>Kobayashi, Ryoho. "Sound Clustering Synthesis Using Spectral Data." ICMC. 2003.</ref>.
* Similaridad de audio y detección de emociones mediante el análisis de la señal<ref>Li, Tao, and Mitsunori Ogihara. "Content-based music similarity search and emotion detection." Acoustics, Speech, and Signal Processing, 2004. Proceedings.(ICASSP'04). IEEE International Conference on. Vol. 5. IEEE, 2004.</ref>.
* Análisis del sonido utilizando espectroscopia de la transformada de Fourier de tiempo reducido<ref>Maas, Tobias. "Sound Analysis Using STFT Spectroscopy [D]." Bachelor Thesis, University of Bremen (2011): 1-47.</ref>.
* Reconocimiento del habla utilizando los coeficientes cepstrales de Mel <ref>Prahallad, K. "Speech Technology: A Practical Introduction." online] laboratorio, Carnegie Mellon University & International Institute of Information Technology Hyderabad.</ref><ref>Farooq, O., and S. Datta. "Mel filter-like admissible wavelet packet structure for speech recognition." IEEE Signal Processing Letters 8.7 (2001): 196-198.</ref>.
* Similaridad musical basada en el análisis de señales<ref>Logan, Beth, and Ariel Salomon. "A Music Similarity Function Based on Signal Analysis." ICME. 2001.</ref>.
 
= Programas y librerías útiles =
Para analizar archivos de audio digitalizados, se proponen los siguientes programas y librerías:
 
== Programas ==
* '''FaceFX Audio Analysis''': FaceFX es un programa que se centra principalmente en el 3D, sobretodo en el diseño de caras, pero dispone de una parte de análisis de audio bastante completa<ref>https://www.facefx.com/content/facefx-audio-analysis-and-results</ref>.
* '''Blue cat''': Uno de los grandes programas en el análisis de audio, con muchas herramientas que permiten visualizar prácticamente todos los aspectos de un archivo de audio<ref>https://www.bluecataudio.com/Products/Bundle_AnalysisPack/</ref>.
* '''Spectre''': Es sin lugar a dudas de los mejores programas de pago para el análisis de audio en tiempo real. Dispone de muchas métricas que vienen incluidas en su ''suite''. <ref>http://spectre.aurchitect.com/</ref>
* '''Audacity''': El programa de referencia cuando se habla de edición de audio ''open souce'' con una gran versatilidad a la hora de analizar y editar audio<ref>http://www.audacityteam.org/</ref>.
 
== Librerías ==
=== C++ ===
* '''ESSENTIA''': Una librería en C++ que permite la extracción de características de cualquier archivo de audio<ref>http://essentia.upf.edu/documentation/</ref>.
* '''CLAM''': Otra librería en C++ que permite la extracción de acordes y otras características musicales además de disponer de un pequeño programa de escritorio que implementa estas herramientas<ref>http://clam-project.org/</ref>.
 
=== Python ===
* '''pyAudioAnalysis''': Es el equivalente a ESSENTIA de Python, una librería muy completa con todo tipo de visualizaciones de los valores extraídos del análisis<ref>https://github.com/tyiannak/pyAudioAnalysis</ref>.
* '''Friture''': Un programa y librería de Python muy sencillo para visualización de espectro y diagramas amplitud-frecuencia de un audio<ref>http://friture.org/</ref>.
 
=== Java ===
* '''jAudio''': Alternativa de Java para herramientas de análisis con extracción de todos las características que se puedan buscar en un archivo de audio<ref>http://jaudio.sourceforge.net/</ref>.
 
= Referencias =