Govorne in slikovne tehnologije

Podobni dokumenti
Razpoznavanje govora Uvod

Microsoft Word - Analiza rezultatov NPZ slovenscina 2018.docx

%

Gradbeništvo kot Industrija 4.0

OGROŽENI JEZIKI IN JEZIKOVNA RAZNOLIKOST V EVROPSKI UNIJI

Naslov:

Spletno raziskovanje

POTEK POUKA TUJIH JEZIKOV - dolžnost učencev je, da redno in točno obiskujejo pouk, - pri pouku sodelujejo, pišejo zapiske - k pouku redno prinašajo u

Termin in lokacija izvedbe Naslov delavnice Ciljna skupina Cilji in/ali kratek opis Izvajalec Kontaktni e-naslov 6. oktober 2018 Gimnazija Franceta Pr

Microsoft Word - IRDO doc

Microsoft Word - polensek-1.doc

STATISTIČNA ANALIZA SIMPLIA»NOČI V STARI LJUBLJANI«

Iztok KOSEM in Špela ARHAR HOLDT Trojina, zavod za uporabno slovenistiko ANALIZA BESEDIŠČA IN SKLADNJE V BESEDILIH TESTA BRALNE PISMENO

PORAJAJOČA SE PISMENOST

PowerPointova predstavitev

Microsoft Word - razvoj govora in pomen komunikacije.doc

Diapozitiv 1

Datum in kraj

PowerPoint Presentation

Microsoft PowerPoint - Standardi znanja in kriteriji ocenjevanja 2 r.ppt [Samo za branje] [Združljivostni način]

POSLOVNO OKOLJE PODJETJA

Diapozitiv 1

Na podlagi določil Zakona o visokem šolstvu (Uradni list RS št. 67/1993 in naslednji), Sklepa o določitvi strokovne komisije za opravljanje preizkusa

08_03

INFORMACIJSKO KOMUNIKACIJSKE TEHNOLOGIJE ŠTUDIJ INFORMACIJSKO KOMUNIKACIJSKIH TEHNOLOGIJ

Na podlagi petega odstavka 92. člena, drugega odstavka 94. člena in 96. člena Zakona o duševnem zdravju (Uradni list RS, št. 77/08) izdaja minister za

Diapozitiv 1

KONTINGENČNI PRISTOP K OBLIKOVANJU SISTEMA STRATEŠKEGA POSLOVODNEGA RAČUNOVODSTVA: EMPIRIČNA PREVERBA V SLOVENSKIH PODJETJIH

PROJECT OVERVIEW page 1

Microsoft Word - vprasalnik_AZU2007.doc

Da bo komunikacija z gluho osebo hitreje stekla

KRATEK POVZETEK ANALIZE NPZ V ŠOLSKEM LETU REZULTATI ZA 6. IN 9.RAZRED RAZRED/PREDMET OŠ JOŽETA MOŠKRIČA REPUBLIŠKO ODSTOPANJE POVPREČJE 6. RA

Optimizacija z roji delcev - Seminarska naloga pri predmetu Izbrana poglavja iz optimizacije

PONUDBA NEOBVEZNIH IZBIRNIH PREDMETOV 4., 5. IN 6. RAZRED ŠOLSKO LETO 2018/19

(Microsoft Word - Angle\232\350ina)

Microsoft Word - 10-Selekcijski intervju _4.del_.docx

2019 QA_Final SL

FIZIKA IN ARHITEKTURA SKOZI NAŠA UŠESA

Microsoft Word - Brosura neobvezni IP

Društvo gluhih in naglušnih Pomurja Murska Sobota

Microsoft Word - Brosura neobvezni IP 2018

Microsoft PowerPoint - Sirikt-SK-FV.ppt

KRITERIJI ZA PREVERJANJE IN OCENJEVANJE ZNANJA – SLOVENŠČINA

Elektronska pošta

20. andragoški kolokvij

PKP projekt SMART WaterNet_Opis

INTERAKTIVNE REŠITVE PROMETHEAN

Letni posvet o izobraževanju odraslih november 2013, Austria Trend Hotel Ljubljana Izhodišč

Slide 1

Razpis - podiplomski študij

PowerPointova predstavitev

Priloga Ekonomske fakultete (EF UL) k Merilom za volitve v nazive visokošolskih učiteljev, znanstvenih delavcev ter sodelavcev Univerze v Ljubljani z

Leksikon besednih oblik SSJ: nadstandardno o (ne)standardnem

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA LARA KOSI PRILAGAJANJE DELA OTROKU Z GOVORNO-JEZIKOVNO MOTNJO DIPLOMSKO DELO LJUBLJANA, 2015

Document ID / Revision : 0519/1.3 ID Issuer System (sistem izdajatelja identifikacijskih oznak) Navodila za registracijo gospodarskih subjektov

ŠTUDIJSKA PROGRAMA PRVE IN DRUGE STOPNJE

eAsistent izpis

PowerPoint-Präsentation

AAA

Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS DIDAKTIČNA IGRA PRI POUKU SLOVENŠČINE Študijski program in stopnja Study programme and le

03C

Diapozitiv 1

(Microsoft Word - Merila, metode in pravila - \350istopis )

AAA

Untitled

Predmetnik dvopredmetnega pedagoškega študijskega programa 2. stopnje Slovenski jezik in književnost Predmetnik je sestavljen iz: obveznih predmetov (

Microsoft Word - SEP, koncnaaaaaaaaaaaaaaaaaaaaaaaaaaa

Microsoft Word - Objave citati RIF in patentne prijave za MP.doc

Microsoft PowerPoint - lj_obroc_predstavitev_tiskovna_mar_2019_02AM.pptx

INDUSTRIJA 4.0: PRILOŽNOSTI DIGITALNE PREOBRAZBE PROCESA RAZVOJA BARV IN PREMAZOV TOMAŽ KERN, BENJAMIN URH, MARJAN SENEGAČNIK, EVA KRHAČ

RAM stroj Nataša Naglič 4. junij RAM RAM - random access machine Bralno pisalni, eno akumulatorski računalnik. Sestavljajo ga bralni in pisalni

Slide 1

ŠTEVCI PROMETA IN NJIHOVA UPORABA ZA NAMENE STATISTIK ČRT GRAHONJA

Prezentacija Telekoma Slovenije

Microsoft Word - M doc

AAA

Microsoft Word - 13-Selekcijski intervju.docx

AAA

SELECTION D’AGENTS TEMPORAIRES

PRIROČNIK JEZIKOVNIH IZZIVOV ZA TAJNE AGENTE SL

marketing za maksimalen roi

AAA

Darko Pevec 1.a Informatika

Folie 1

AAA

AAA

PowerPoint Presentation

Microsoft PowerPoint - Kokolj

Na podlagi 65. člena Akta o ustanovitvi zasebnega vzgojno izobraževalnega zavoda»waldorfska šola Ljubljana«z dne je po predhodni obravnavi

AAA

PowerPoint Presentation

Microsoft Word - CNC obdelava kazalo vsebine.doc

21. PEDAGOŠKA FAKULTETA Kardeljeva ploščad 16, 1000 Ljubljana, Več informacij na: Kontakt: Referat Pedagoške fakultete

RAZPIS ZA VPIS IN IZVEDBA VPISA v izobraževalne programe za odrasle v šolskem letu 2017/2018 Trg zbora odposlancev 30, 1330 Kočevje ID št.za DDV: SI57

Svet Nacionalne agencije Republike Slovenije za kakovost v visokem šolstvu na podlagi pete alineje 51

1. Medkulturnost kot pedagoško- didak:čno načelo 7. Sodelovanje šole z lokalno skupnostjo 2. Sistemska podpora pri vključevanju otrok priseljencev 6.

AAA

NASLOV PREDAVANJA IME IN PRIIMEK PREDAVATELJA

AAA

Transkripcija:

Uvod GOVORNE TEHNOLOGIJE prof. dr. France Mihelič

PREGLED PREDSTAVITVE Osnovni pojmi Uporaba Zahtevnost raziskovalnega področja Variabilnost govora Razumevanje govora Interdisciplinarnost Govorne podatkovne zbirke Razpoznavanje vzorcev Zgodovina Pomen raziskav za slovenski govor

OSNOVNI POJMI Samodejna obdelava govora Govorne tehnologije Uporaba računalnika pri analizi, vrednotenju, snovanju samodejnih postopkov in zbiranju govornih signalov. Področja: Samodejno razpoznavanje govora, Samodejno tvorjenje govora, Govorno sporazumevanje v sistemih človek stroj, Obdelava in dokumentiranje heterogenih zvočnih signalov,....

OSNOVNI POJMI Samodejno razpoznavanje govora Ugotavljanje ali potrjevanje indentite govorca. Ugotavljanje čustvenega stanja ali razpoloženja govorca Ugotavljanje jezika Ugotavljanje izgovorjenih glasov, besed, fraz, stavkov. Ugotavljanje pomena na podlagi izgovorjenega sporočila. Samodejno tvorjenje govora Lepljenje večjih govornih enot. (govorno gradivo posneto vnaprej v celoti) Sinteza govora na podlagi poljubnega vhodnega besedila Pretvarjanje konceptov v govor Govorno sporazumevanje v sistemih človek stroj Upravljanje s sistemi Večjezična komunikacija Dokumentiranje informacij Obdelava in dokumentiranje heterogenih zvočnih signalov Ugotavljanje govora Ugotavljanje in iskanje govorcev in vsebin Podnaslavljanje

UPORABA Prednosti: Omogoča komunikacijo z napravami večjemu krogu uporabnikov. Omogoča večjo storilnost in človeku prijaznejše delovno okolje. Za človeka najnaravnejši način komunikacije. Upravljanje z napravami, brez uporabe rok in/ali vida.... Področja: Upravljanje in/ali nadzor samodejnih sistemov. Sistemi za samodejno poizvedovanje z govorom. Komunikacija z računalnikom in drugimi napravami za invalidne, poškodovane ali bolne osebe. Pametna hiša, upravljanje podsistemov v vozilih,... Nadzor dostopa, vstopa. Govorno sporazumevanje v različnih jezikih. Dokumentiranje informacij. Iskanje informacij (browsing) po zvočnih in/ali multimedijskih vsebinah Forenzika Slabosti: Možnost nezanesljivega delovanja. Potrebno uvajanje uporabnikov na nov način komunikacije. Sociološki efekt (negativen odnos do avtomatizacije). Sisteme je potrebno vsaj v določeni meri razviti za vsak jezik posebej....

ZAHTEVNOST RAZISKOVALNEGA PODROČJA Variabilnost govora Okoljski, fiziološki, sociološki, razpoloženjski in drugi vplivi. Razumevanje govora Razumevanje naravnega jezika (še nedosežen cilj na področju umetne inteligence). Interdisciplinarnost Teamsko delo, sodelovanje več raziskovalnih skupin Govorne podatkovne zbirke Pri razvoju, učenju in preizkušanju samodejnih sistemov potrebujemo obsežne govorne in tekstovne podatkovne zbirke v izbranem jeziku. Časovno zahtevni samodejni postopki Zapleteni statistični postopki učenja in iskalni postopki na obsežnih podatkovnih zbirkah. 6

VARIABILNOST GOVORA Govor, kot način komunikacije med ljudmi, predstavlja kompleksen vzorec, ki je podvržen številnim činiteljem in je zato močno variabilen. neenakomerno spreminjanje hitrosti izgovarjave glasov, zvezni prehodi pri artikulaciji med posameznimi glasovi soodvisnost izgovarjave od sosednjih glasov fiziološke karakteristike govorca, čustveno razpoloženje govorca, zdravstveno stanje govorca, okolje v katerem poteka govor, socialno okolje v katerem govorec živi in njegova izobrazba,... Tvorjenje govora (v običajnih okoliščinah) je tipičen primer povratnozančnega sistema. Razumljivost govora sproti nadziramo s sluhom in prilagajamo okoliščinam sporazumevanja. Pri tem samodejno v razločnost in način izgovora vlagamo minimalno še potrebno količino truda. 7

RAZUMEVANJE GOVORA Govor je namenjen sporazumevanju med ljudmi! Razumevanje govora predstavlja bistveno komponento v celotnem postopku razpoznavanja in tvorjenja govora pri človeku. Zaradi tega človek izredno nezanesljivo razpoznava glasove nekega jezika, ki ga ne razume in ravno tako slabše razpoznava v lastnem jeziku nesmiselne besede (besede, ki ustrezajo akustičnim in fonotaktičnim zakonitostim jezika, ne nosijo pa nobenega pomena, ali besede, ki jih poslušalec ne pozna). Prav tako običajno nastopijo težave pri razumevanju govora, ko govorec tistega kar govori (bere, ponavlja na pamet) ne razume. Podobne težave nastopijo tudi pri branju (tvorjenju govora). Problema samodejnega razpoznavanja in tudi tvorjenja govora ni mogoče rešiti na nivoju razpoznavanja oziroma tvorjenja posameznih glasov. V sisteme je potrebno vgraditi dodatno znanje, ki je v veliki meri od jezika odvisno.

INTERDISCIPLINARNOST PODROČJA... Obdelava signalov Izločanje relevantne informacije iz govornega signala. Akustika Razumevanje povezav med fizikalnim govornim signalom in fiziološkimi mehanizmi, ki govor oddajajo in sprejemajo. Razpoznavanje vzorcev Postopki za določanje rojev, učenje samodejnega sistema in razvrščanje delov govornega signala. Komunikacijska in informacijska teorija Postopki ocenjevanja parametrov statističnih modelov, postopki kodiranja in dekodiranja govornega signala. Jezikoslovje Relacije med glasovi (fonetika) in besedami (slovnica) v jeziku. Pomen izgovorjenih besed (semantika) in smisel sporočila določen iz pomena besed (pragmatika). Postopki slovničnega in jezikovnega razčlenjevanja (parsing). Fiziologija Razumevanje mehanizmov višjega reda v človeškem živčnem sistemu, ki se tičejo tvorjenja in zaznavanja govora. Računalništvo Študij učinkovitih postopkov za implementacijo različnih metod, ki jih uporabljamo pri realizaciji samodejnih sistemov za razpoznavanje govora. Psihologija Razumevanje in študij činiteljev, ki vplivajo na uporabnost samodejnih sistemov v praksi.

GOVORNE PODATKOVNE ZBIRKE Za vzpostavitev in vrednotenje delovanja sistemov govornih tehnologij so potrebne obsežne govorne in tekstovne podatkovne zbirke v izbranem jeziku (narečju). Zbirka mora statistično reprezentativno predstaviti področje uporabe sistemov govornih tehnologij: čim več možnih zaporednih kombinacij glasov v izbranem jeziku, različne načine govora govorce različnega spola, starosti, narečnih skupin, različna akustična okolja... Zbirke morajo biti ustrezno dokumentirane, kar je zamuden postopek predvsem pri govoru (10 kratni ali še daljši čas trajanja posnetkov, večkratne evaluacije) Priprava podatkovnih zbirk ni vrednotena kot raziskovalni dosežek 10

RAZPOZNAVANJE VZORCEV Razpoznavanje vzorcev Vzemimo, da je celotna populacija vzorcev, ki jo obravnavamo razdeljena na več skupin (podmnožic). Vsak vzorec v populaciji naj pripada vsaj eni izmed teh skupin. Razpoznavanje vzorcev je samodejni postopek, ki za neznan vzorec ugotovi njegovo pripadnost (ime). Neznan vzorec Sistem za razpoznavanje vzorcev Ime vzorca Učenje Samodejni postopek, ki na podlagi vzorcev, pri katerih je podana tudi njihova pripadnost (ime), določi značilnosti skupin vzorcev (nadzorovano učenje). Te značilnosti kasneje uporabimo pri razpoznavanju. 11

RAZPOZNAVANJE VZORCEV neznan vzorec Vzorčenje, kvantizacija Določanje značilk Razvrščanje Leksikon, Znanje o področju Modeli enot razpoznavanja, Sintaksa vzorcev niz razpoznanih enot Pomenska analiza

ZGODOVINA RAZISKOVALNO PODROČJE JE STARO DOBRIH 50 LET. 50-ta leta Začetni poizkusi 60-ta leta Prvi sistemi in razvoj teorije 70-ta leta Razpoznavanje ločeno izgovorjenih besed 80-ta leta Razpoznavanje vezanega govora, tvorjenje govora iz besedil 90-ta leta Razumevanje in razpoznavanje naravnega govora Sistemi za dialog Sistemi za narekovanje z obsežnim slovarjem besed Korpusna sinteza govora Trenutni raziskovalni izzivi Robustnost Slovenščina Stabilno delovanje ne glede na zvočno ozadje, dialekte, način govora, vhodne enote,... Porazdeljeni sistemi za razpoznavanje govora Mobilna telefonija Večjezičnost Sistemi za govorna poizvedovanja, sporazumevanja, učenje,.... Obdelava zvočno heterogenih vsebin iskanje izbranih vsebin, oseb, ključnih besed (browsing) Večmodalno razpoznavanje govora Vključitev vidne informacije (branje iz ustnic, usmerjenost pogleda, kretnje telesa,... ) in ostalih modalnosti (tipkovnica, miška,... ) Začetek intenzivnejših raziskav za slovenski govor 13

POMEN RAZISKAV ZA SLOVENSKI GOVOR Slovenščina je eden najpomembnejših dejavnikov naše nacionalne identitete. Kompleksnejših sistemov za razpoznavanje in sintezo slovenščine tujci za nas posebej ne bodo razvili (neznanje slovenščine, premajhno tržišče). Negativen primer: Davčna svetovalka VIDA Če bomo želeli v prihodnosti komunicirati z umetnimi sistemi v lastnem jeziku, se bo potrebno z znanjem o tem področju in razvoju takih sistemov intenzivneje ukvarjati tudi pri nas. Proučevanje materinega jezika z drugimi do sedaj neobičajnimi postopki (jezikoslovni vidik). 14

SLOVENIJA - TRENUTNO STANJE ČLOVEŠKI, JEZIKOVNI IN MATERIALNI VIRI Majhno število raziskovalcev na področju govornih tehnologij: Zahtevnost od jezika odvisnih raziskav in razvoja ni odvisna od števila ljudi, ki nek jezik uporabljajo. Ni dovolj trdne povezave med raziskovalci na tehniškem in jezikoslovnem področju. Pomanjkanje primernih govornih in besedilnih zbirk v slovenskem jeziku. Trenutna materialna podpora raziskovalnih skupin iz javnih sredstev je preskromna. 15

SLOVENIJA - TRENUTNO STANJE RAZPOZNAVANJE SLOVENSKEGA GOVORA Raziskovalne in razvojne skupine skupine: Univerza v Ljubljani (FE in FRI), Univerza v Mariboru (FERI), Institut Jožef Stefan ZRC SAZU Alpineon d.o.o. Amebis HERMES Softab Področja: Razpoznavanje in potrjevanje identitete govorca Razpoznavanje ločeno izgovorjenih besed Razpoznavanje tekočega govora z omejenim slovarjem besed Razpoznavanje tekočega govora z obsežnim slovarjem besed (TV informativne oddaje) Razpoznavanje spontanega govora Govorne podatkovne zbirke: Snabi (Uni. Mb., FERI) Števke (Uni. Lj., FRI) ------ 1990 ------- Mobiluz (Uni Lj, FE) SpeechDat - slovenski govor (Uni. Mb., FERI) ------- 2000 ------- VoiceTRAN (Uni Lj, FE) SiBN (Uni. Lj., FE) BNSi (Uni. Mb., FERI) Tekstovne podatkovne zbirke: FidaPlus 6 M besed (IJS, FF, Amebis,... ) NovaBeseda 2 M besed (ZRC SAZU) SiBN tekst 2 M besed (FE) BNSi tekst 11 M besed (FRI) Večer 17 M besed (FRI) 16

SLOVENIJA - TRENUTNO STANJE RAZPOZNAVANJE SLOVENSKEGA GOVORA Področja: Razpoznavanje in potrjevanje identitete govorca Razpoznavanje ločeno izgovorjenih besed Razpoznavanje tekočega govora z omejenim slovarjem besed Razpoznavanje tekočega govora z obsežnim slovarjem besed Razpoznavanje spontanega govora Razviti eksperimentalni sistemi. Primerni za prenos v prakso. Razvoj eksperimentalnih sistemov. Trenutni rezultati slabši od primerljivih sistemov za druge jezike. (WER: SLO 35%, CZ 19%, ANG 10%) Razvoj eksperimentalnih sistemov. Odprt raziskovalni izziv tudi za ostale jezike. 17

SLOVENIJA - TRENUTNO STANJE SINTEZA SLOVENSKEGA GOVORA Raziskovalne in razvojne skupine: Univerza v Ljubljani (FE), Univerza v Mariboru (FERI), Institut Jožef Stefan Alpineon d.o.o. Amebis Področja: Sinteza govora na osnovi pred-posnetih govornih enot (difonska, korpusna sinteza) Sinteza govora na osnovi akustičnih modelov (HMM) Izdelki dostopni na tržišču: Govorec, Fonem (IJS Amebis) Proteus (Alpineon) Jaka (FE) 18

SLOVENIJA - TRENUTNO STANJE SISTEMI ZA DIALOG Raziskovalne in razvojne skupine skupine: Univerza v Ljubljani (FE in FRI), Univerza v Mariboru (FERI), HERMES Softab Alpineon Sistemi: Eksperimentalni sistemi za govorna poizvedovanja: letalske povezave (FE), prireditev Lent (FERI), Sistem za govorno prevajanje (Uni. Mb., FERI) Sistem za govorno prevajanje VoiceTRAN (Alpineon, FE, FF, Amebis, IJS) vremenske napovedi (FE), turistične informacije (Uni. Mb., FERI), Sistem M-vstopnica (HERMES Softlab, FERI) 19

SLOVENIJA - TRENUTNO STANJE MATERIALNI VIRI Raziskav in razvoja na področju tehnične obdelave slovenskega govora ni mogoče financirati le s stališča gole tržne logike (sredstva naj s povrnejo s prodajo razvitih produktov uporabnikom) ali raziskovalne vrednosti (SCI članki). Gre za družbeni nacionalni interes povezan z ohranjanjem in razvojem slovenskega jezika. Jezikoslovju v tem primeru namenjamo določene materialne stroške, medtem ko so vlaganja družbe na tem področju v tehnične rešitve marginalna. Citat: Sobotna priloga Dela 7. 6. 2008, str. 14-15 minister za razvoj Žiga Turk Meni osebno se, na primer, zdi zelo pomembna skrb za razvoj slovenskega jezika. Tega nihče drug na svetu ne bo naredil za nas, mi pa nujno potrebujemo, denimo, računalniško sintezo in razpoznavanje slovenskega jezika. 20

TUJINA - TRENUTNO STANJE MATERIALNI VIRI Kako se v zvezi s to problematiko odzivajo druge države, jezikovne skupine? Češka Pred 20 leti še močno zaostajala za Slovenijo. Trenutno pa je - tako po številu vloženih sredstev, raziskovalnih skupin in dosežkov - pred nami. Večina raziskovalnih skupin deluje na javnih raziskovalnih ustanovah in univerzah (javno financiranje). Nizozemska močno razvita industrijska država s precej večjim številom prebivalcev (potencialni uporabniki) kot Slovenija. V zadnjih dveh desetletjih več multi-institucionalnih projektov, ki so bili financirani v večini z javnimi sredstvi. Cilj zbiranje in dokumentiranje obsežnih nacionalnih govornih in tekstovnih zbirk. Japonska ena najbolj tehnološko razvitih držav na svetu. V zadnjem desetletju je potekal doslej verjetno najbolj temeljit in obsežen projekt zbiranja in dokumentiranja govora s posebnim poudarkom na spontanem govoru. Budžet približno 200 M $, večinoma podprt z javnimi sredstvi. 21