sreda, 2. marec 2016

Prepoznavanje glasu - KAJA KUNAVER

Slika 1
Danes prepoznavanje glasu uporabljamo v vsakdanjem življenju, le da se tega ne zavedamo. Vsakič, ko pokličemo kakšno podjetje ali ko imamo zasebni klic in je oseba nedosegljiva, se oglasi telefonska tajnica, ki nam pove, da pustimo sporočilo po pisku. Pri nekaterih podjetjih lahko tudi po pisku poveš določene besede, da dobiš, kar želiš. Prepoznavanje pogovora lahko uporabljamo tudi doma npr., ko želimo da nam računalnik sam piše besedila ali elektronska sporočila. Računalnik izrečene besede prepozna in jih zapiše. To zelo pomaga tudi invalidnim ljudem, ki ne morejo uporabljati rok in slepim.



Slika 2
Prepoznavanje glasu delimo na dva dela; prepoznavanje glasu posameznega govorca in prepoznavanje govora - kaj je oseba rekla. Prepoznavanje govora je zmožnost programa, da identificira besede in fraze iz govorjenega jezika in jih spremeni v pisno obliko. Osnovni programi za prepoznavanje govora imajo omejen slovar besed in fraz ter bodo prepoznali le besede, ki bodo izrečene razločno. Namenjene so prepoznavanju govora naključnih oseb - na primer strank nekega podjetja, ki kličejo po telefonu in jih sistem za prepoznavo govora usmerja na podlagi izrečenih ukazov. Bolj napredni programi pa so prilagojeni določenemu govorcu in znajo prepoznavati tudi običajni govor.  Da bi to lahko dosegli, se mora program najprej naučiti razumeti določenega človeka, tako da ta prebere posebej v ta namen pripravljeno besedilo.


Slika 3

O prepoznavanje glasu govorca govorimo, ko program ugotovi ali govori neka določena oseba ali ne.

Preverjanje govorca (speaker verification) se uporablja pri varnostni zaščiti naših podatkov, da se zavaruje dostop do sistema (npr. telefonska banka). Sistemi delujejo na osnovi gesla, ki ga pozna in izgovori uporabnik (npr. izreči mora neko besedo, da se mu odpre dostop do sistema). Sistem na osnovi govora sestavi tako imenovani »prstni odtis glasu« in ga primerja z vnaprej posnetim zapisom, ki ga hrani program. Pri identifikaciji  govorca (speaker identification) pa »prstni odtis« primerjamo z posnetimi »prstnimi odtisi« več različnih ljudi in na podlagi najboljšega ujemanja določimo govorca.  Sistemi za preverjanje in identifikacijo govorcev lahko delujejo na podlagi točno določene fraze, ki jo mora oseba izgovoriti ali pa na podlagi prostega govora, v katerem program sam prepozna določene vzorce.  Slednji način omogoča prepoznavo govorcev tudi brez učenja - na primer v kriminalistiki za prepoznavo identičnosti govorcev na različnih zvočnih posnetkih.


Poznamo štiri dostope, kako računalnik spremeni izgovorjene glasove v elektronsko pisno obliko:
·         Ujemanje preprostih vzorcev (vsaka beseda je prepoznana v celoti; npr. miza)
·         Analiza vzorcev glasu (vsaka beseda je razbita v bite, in prepoznana po značilnostih kot so npr. samoglasniki)
·         Jezikovno oblikovanje in statistična analiza (program z znanjem slovnice in verjetnosti sledenju ene besede drugi, pospeši prepoznavanje besed)
·         Umetno živčno omrežje (računalnik lahko verodostojno prepoznava vzorce, kot npr. kako se besedo sliši) 






Slika 4
Prepoznavanje glasu je ena iz najbolj zapletenih in kompleksnih računalniški znanosti, ker vsebuje veliko lingvistike, matematike in programiranja. Za izdelovanje programov za prepoznavanje glasu potrebuješ ljudi, ki se spoznajo na ta področja. To je lingvist ali jezikoslovec, ki raziskuje naravni človeški jezik, programer, ki s pomočjo programiranja poišče algoritem za rešitev računalniškega problema, matematik, ki raziskuje vzorce, ki se lahko nahajajo v številih, prostoru, znanosti, računalnikih, navideznih ali stvarnih abstrakcijah, oziroma kjerkoli. Poleg njih bi pa omenila še kriminaliste, ki prepoznavanje glasu uporabljajo pri svojem delu, da odkriva dokaze kriminala.



Viri:

Ed Grabianowski: How Speech Recognition Works [online](citirano: 20.11.2015, 19:00) Dostopno na:  http://electronics.howstuffworks.com/gadgets/high-tech-gadgets/speech-recognition.htm
Speaker recognition;  10.9.2015, 15:14 [online](citirano: 20.11.2015, 19:23) Dostopno na:   https://en.wikipedia.org/wiki/Speaker_recognition
Speech recognition definition;  marec 2007 [online](citirano: 20.11.2015, 20:07)  Dostopno na:  http://searchcrm.techtarget.com/definition/speech-recognition
Types of Speech Recognition 2015 [online](citirano: 20.11.2015, 20:38)  Dostopno na:  http://www.lumenvox.com/resources/tips/types-of-speech-recognition.aspx
Chris Woodford: Voice recognition software; 7.6.2015 [online](citirano: 20.11.2015, 19:46) Dostopno na:  http://www.explainthatstuff.com/voicerecognition.html

 Slike: 

Slika 1: Leo; 1.6.2012 Dostopno na: http://www.sodahead.com/living/do-voice-recognition-devices-understand-you/question-2695897/ [online](citirano: 20.11.2015, 21:53)
Slika 2: http://copia.com.au/medical-speech-recognition/ [online](citirano: 20.11.2015, 21:36)
Slika 3: http://and-bmod.com/how-to-windows-speech-recognition-2/ [online](citirano: 20.11.2015, 21:57)
Slika 4: https://xiph.org/~xiphmont/demo/opus/demo3.shtml

Ni komentarjev:

Objavite komentar

Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.