Clasificación de audio con tanques skyrmion
3 min read
“Siete, uno, nueve, …”: una voz humana dice números, el hardware físico los reconoce con un 97 % de precisión. Este sistema de reconocimiento de patrones fue desarrollado por físicos de la Universidad de Duisburg-Essen (UDE) en colaboración con la Universidad de Gante (Bélgica). El desarrollo hace posible resolver problemas multidimensionales rápidamente y sin necesidad de un entrenamiento intensivo en energía. El periódico Sistemas inteligentes avanzados publicó los resultados.
¿Es posible que un material inanimado reconozca patrones de manera rápida y eficiente? Esa fue la pregunta planteada por un equipo de físicos teóricos, dirigido por la profesora Dra. Karin Everschor-Sitte. Para probar su punto, los investigadores utilizaron el reconocimiento de voz.
El equipo, incluido Robin Msiska como primer autor, utilizó grabaciones de audio de dígitos hablados que van del 0 al 9 de una base de datos estándar. Los físicos han analizado el tipo y la intensidad de las frecuencias involucradas para cada instante del habla. Luego convirtieron esta información en señales de voltaje, que aplicaron a una película magnética delgada a través de 39 contactos.
Este material de película delgada contiene pequeños vórtices magnéticos (skyrmions) que reaccionan al estrés deformándose. “En pocas palabras, puede imaginarlo como un patrón de cuadrícula en blanco y negro que cambia de forma en respuesta a las señales de entrada”, dice Msiska. El material forma patrones únicos para cada número hablado, como un código QR, que se puede leer linealmente con métodos simples.
La investigación del equipo utilizó simulaciones complejas, realizadas principalmente en el Centro Flamenco de Supercomputadoras (Vlaams Supercomputer Centrum) en colaboración con la Universidad de Gante. Su sistema de hardware reconoció correctamente el 97,4% de los números. Mirando solo las voces femeninas, la cifra saltó al 98,5%. “Esto muestra el mejor rendimiento jamás reportado para computadoras de depósito en material”, informa Everschor-Sitte. Y lo hace en el más mínimo de los espacios; la muestra con la que trabajaron los físicos tiene solo un micrómetro de longitud de borde.
“Si usa una red neuronal, el entrenamiento es costoso y requiere grandes conjuntos de datos. Nuestro sistema de hardware puede resolver problemas de aprendizaje automático sin construir un sistema de millones de neuronas interconectadas; el reconocimiento de voz que se presenta aquí es solo un ejemplo. Es más rápido y usa menos energía. , explica el físico.
Según ella, se pueden encontrar aplicaciones potenciales donde es necesario detectar e interpretar varias señales: en la conducción autónoma, en el pronóstico del tiempo o en el campo médico. En colaboración con otros investigadores de la UDE, actualmente se están enfocando en un examen médico estándar: el electroencefalograma (EEG), que mide la actividad eléctrica del cerebro. Los físicos están investigando si el sistema magnético puede interpretar estos resultados de forma independiente.
Más información:
Robin Msiska et al, Clasificación de audio con tanques Skyrmion, Sistemas inteligentes avanzados (2023). DOI: 10.1002/aisy.202200388
Proporcionado por la Universität Duisburg-Essen
“Adicto a la televisión total. Experto en viajes. Gurú de Twitter. Evangelista de tocino. Creador galardonado. Aficionado al alcohol. Fanático de la música. Solucionador de problemas”.