Roedd y Project WISPR (Welsh and Irish Speech Processing Resources) yn broject sylweddol a ariannwyd gan raglen Interreg yr Undeb Ewropeaidd. Rhoddwyd arian ychwanegol i’r project gan Fwrdd yr Iaith Gymraeg.
Nod y project oedd datblygu synthesis testun-i-lais ar gyfer y Gymraeg a’r Wyddeleg, a hefyd gasglu cronfeydd data llafar ar gyfer yr ieithoedd hynny. Fe’i datblygwyd ar y cyd gan yr Uned Technolegau Iaith yng Nghanolfan Bedwyr, Prifysgol Cymru, Bangor, a Trinity College Dulyn, gyda chefnogaeth Dublin City University a’r University College Dublin.
Ychydig iawn o waith oedd wedi’i wneud cyn hyn ar ddatblygu offer technoleg llais ar gyfer y Gymraeg a’r Wyddeleg. Cred aelodau’r tîm mai’r ffordd orau i hybu technoleg iaith mewn amgylchedd iaith leiafrifol yw i ddarparu offer a rhaglenni y gellir eu dosbarthu yn rhad ac am ddim ac sy’n hawdd i’r defnyddiwr cyffredin eu trin, gan eu trwyddedu’n rhyddfrydig er mwyn i ddatblygwyr fedru’u hintegreiddio yn eu meddalwedd eu hun.
Mae sythesis testun-i-lais (TiL) yn galluogi cyfrifiadur i lefaru testun. Mae hyn yn wahanol i gyfieithu peirianyddol, gan nad yw’r testun yn cael ei gyfieithu mewn TiL, dim ond ei ddarllen yn uchel. Gellir ei ddefnyddio mewn darllenwyr sgrin ar gyfer pobl â nam ar eu golwg, lle mae cynnwys sgrin y cyfrifiadur yn cael ei ddarllen yn uchel gan lais synthetig. Mae hyn yn gweithio gyda deunyddiau megis negeseuon e-bost a thudalennau gwe (weithiau mae cyflymder y llais yn cael ei gynyddu). Gellir hefyd defnyddio TiL wrth ryngweithio gyda system gyfrifiadurol dros y ffôn. Datblygiad newydd yma yw ffonau symudol sy’n medru defnyddio TiL ar gyfer tasgau megis llefaru negeseuon wedi’u tecstio.
Defnyddiodd y project WISPR fframwaith boblogaidd cod agored "Festival" ar gyfer TiL. Ychwanegodd y tîm WISPR yng Nghymru rai nodweddion defnyddiol newydd i Festival, megis galluogi Festival i ddelio gyda thestun oedd wedi’i greu mewn fformat UTF-8 (er mwyn i bob nod Cymraeg, gan gynnwys ŵ ac ŷ, gael eu trin yn gywir).
Datblygwyd Festival yn wreiddiol yn y Centre for Speech Technology Research, ym Mhrifysgol Caeredin, ac wedi hynny ym Mhrifysgol Carnegie-Mellon, UDA, dan y project "Festvox"
Mae’r holl adnoddau a chymwysiadau a ddatblygwyd yn ystod y project WISPR ar gael yn ddi-dâl at ddefnydd anfasnachol, a gellir eu llwytho i lawr o’r tudalennau hyn. Hefyd, mae’r rhan fwyaf o'r cod ffynhonnell ar gael yn rhydd yn unol â thrwydded o fath BSD (yr eithriad yw'r llais "hl_diphone" hŷn, sy'n rhydd ar gyfer defnydd anfasnachol yn unig). Mae hyn yn golygu bod modd defnyddio ffrwyth technoleg llais WISPR yn ddirwystr bron, gyda dewis eang o feddalwedd, gan gynnwys meddalwedd berchnogol a meddalwedd cod agored.
Mae’r cynnyrch yn cael eu dosbarthu yn ôl y math o bobl fydd eu hangen, fel a ganlyn:-
Yr adnoddau sydd ar gael yw:
1 Adnoddau i’r defnyddiwr cyffredin
I lwytho fersiwn Windows i lawr o’r tri llais TiL Cymraeg, cliciwch yma.
Bydd hyn yn mynd â chi at y wybodaeth gefndir a’r cyfarwyddiadau gosod.
I lwytho’r lleisiau i lawr, cliciwch y cyswllt o dan "Gosodwr", a dilynwch y cyfarwyddiadau gosod yn is i lawr y dudalen. Bydd hyn yn gosod y tri llais: siaradwr gwrywaidd o dde Cymru o ansawdd sylfaenol, siaradwr benywaidd o ogledd Cymru, a siaradwr gwrywaidd o ogledd Cymru. Mae’n bosibl newid rhwng y tri llais yn ôl eich dewis.
Cynhwyswyd dau lais naturiol eu sain sy’n dweud yr amser (un gwrywaidd ac un benywaidd) mewn arddangosiad gwe yn y wefan ganlynol.
Wrth ddefnyddio Unix, Linux neu Cygwin, mae angen llwytho Festival i lawr a’i adeiladu. Mae hwn yn cynnwys Offer Iaith Caeredin (yr Edinburgh Speech Tools - EST). Gellir cael y rhain o’r cyfeiriadur hwn (mae’n cynnwys y gwelliannau Cymraeg-benodol i god Festival). Dylid adeiladu EST cyn adeiladu Festival.
Yn nesaf, dylid llwytho i lawr y cod sy’n gyffredin i bob llais. Mae hyn yn cynnwys y ffeil " welshtoken.scm", a dylid rhoi hon yn y cyfeiriadur <Festival directory>/lib/voices/welsh/Tokenisation/
Yn olaf, gellir llwytho i lawr a gosod y lleisiau unigol. Mae’r lleisiau yn cynnwys y canlynol:
Crëwyd sawl arf newydd i’w defnyddio wrth adeiladu llais Festival newydd. Mae’r rhain ar ffurf sgriptiau Python. Iaith sgriptio yw Python a gellir ei llwytho i lawr o www.python.org. Mae’r offer fel a ganlyn:-
Integrating Festival and Windows. Rhys James Jones, Ambrose Choy, Briony Williams. InterSpeech 2006 (9th International Conference on Spoken Language Processing, Pittsburgh, USA, 17-21 September 2006).
Language Technologies |