Når flere mennesker taler på samme tid, kan det være svært at forstå noget som helst af det, der bliver sagt. Her kommer “Look to listen” ind i billedet.
Googles nye teknologi kan mundaflæse, afkode forskellige måder at tale på og genkende stemmer og dermed altså adskille enkeltpersoners bidrag til et samlet lydbillede.
Teknologien kan anvendes til både lydfiler og video, og Googles eksperter får det til at virke ved at udnytte AI (Artificial Intelligence) og forskellige lydadskillende algoritmer.
Udover at isolere lyde vil teknologien fx også kunne bruges til at reducere støj på eksisterende optagelser.
Det er ret vildt!
I videoen herunder demonstreres, hvordan “Look to listen” fungerer i praksis:
Du kan læse mere om “Look to listen”, og hvordan det fungerer lige her.
Læs også:
Tale er guld – bliv klar til Voice Search
Google lancerer nyt videoformat til annoncer
Google lancerer bedre muligheder for splittest