Abbiamo creato una rete neurale in grado di identificare la posizione di una sorgente sonora nello spazio tridimensionale, imitando la percezione uditiva umana. Utilizzando solo due microfoni, il modello estrae le caratteristiche del suono convolvendo i segnali audio con le risposte impulsive dell’orecchio umano. Inoltre, isola la sorgente sonora dal rumore di fondo, raggiungendo un’elevata precisione nella localizzazione.
Funzionalità Principali
- Localizzazione Sonora 3D: Identifica con precisione la posizione delle sorgenti sonore nello spazio tridimensionale.
- Modello Uditivo Umano: Utilizza le risposte impulsive dell’orecchio umano per estrarre le caratteristiche acustiche.
- Isolamento del Rumore: Isola la sorgente sonora target dal rumore di fondo.
- Hardware Minimo: Richiede solo due microfoni per l’input, imitando l’udito umano.
- Apprendimento Profondo: Sfrutta le reti neurali per un’elaborazione del suono robusta e adattativa.
Contributi Tecnici
- Progettazione della Rete Neurale: Sviluppo di un’architettura di rete neurale personalizzata per la localizzazione sonora.
- Estrazione delle Caratteristiche: Implementazione della convoluzione con le risposte impulsive dell’orecchio umano per imitare la percezione uditiva.
- Riduzione del Rumore: Integrazione di tecniche di isolamento del rumore per migliorare l’accuratezza della localizzazione.
- Accelerazione GPU: Utilizzo di Nvidia CUDA per un addestramento e un’inferenza efficienti.
- Containerizzazione: Utilizzo di Singularity per garantire la riproducibilità e la portabilità della soluzione.
- Ambiente di Sviluppo: Gestione delle dipendenze e dei flussi di lavoro con Pipenv per una collaborazione senza intoppi.
Valore Aziendale
- Soluzione Innovativa: Fornisce un approccio innovativo alla localizzazione sonora 3D utilizzando hardware minimo.
- Elevata Precisione: Offre un’identificazione precisa della sorgente sonora anche in ambienti rumorosi.
- Efficienza dei Costi: Riduce i requisiti hardware sfruttando algoritmi avanzati.
- Scalabilità: Progettata per essere adattabile a varie applicazioni, dalla robotica all’ingegneria del suono.
- Riproducibilità: Containerizzata per una facile distribuzione e integrazione nei sistemi esistenti.
Tecnologie Utilizzate
- Python
- PyTorch
- Pipenv
- Singularity
- Nvidia CUDA