Rhagarweiniad

Roedd y Project WISPR (Welsh and Irish Speech Processing Resources) yn broject sylweddol a ariannwyd gan raglen Interreg yr Undeb Ewropeaidd. Rhoddwyd arian ychwanegol i’r project gan Fwrdd yr Iaith Gymraeg.

Nod y project oedd datblygu synthesis testun-i-lais ar gyfer y Gymraeg a’r Wyddeleg, a hefyd gasglu cronfeydd data llafar ar gyfer yr ieithoedd hynny. Fe’i datblygwyd ar y cyd gan yr Uned Technolegau Iaith yng Nghanolfan Bedwyr, Prifysgol Cymru, Bangor, a Trinity College Dulyn, gyda chefnogaeth Dublin City University a’r University College Dublin.

Ychydig iawn o waith oedd wedi’i wneud cyn hyn ar ddatblygu offer technoleg llais ar gyfer y Gymraeg a’r Wyddeleg. Cred aelodau’r tîm mai’r ffordd orau i hybu technoleg iaith mewn amgylchedd iaith leiafrifol yw i ddarparu offer a rhaglenni y gellir eu dosbarthu yn rhad ac am ddim ac sy’n hawdd i’r defnyddiwr cyffredin eu trin, gan eu trwyddedu’n rhyddfrydig er mwyn i ddatblygwyr fedru’u hintegreiddio yn eu meddalwedd eu hun.

Synthesis Testun-i-Lais

Mae sythesis testun-i-lais (TiL) yn galluogi cyfrifiadur i lefaru testun. Mae hyn yn wahanol i gyfieithu peirianyddol, gan nad yw’r testun yn cael ei gyfieithu mewn TiL, dim ond ei ddarllen yn uchel. Gellir ei ddefnyddio mewn darllenwyr sgrin ar gyfer pobl â nam ar eu golwg, lle mae cynnwys sgrin y cyfrifiadur yn cael ei ddarllen yn uchel gan lais synthetig. Mae hyn yn gweithio gyda deunyddiau megis negeseuon e-bost a thudalennau gwe (weithiau mae cyflymder y llais yn cael ei gynyddu). Gellir hefyd defnyddio TiL wrth ryngweithio gyda system gyfrifiadurol dros y ffôn. Datblygiad newydd yma yw ffonau symudol sy’n medru defnyddio TiL ar gyfer tasgau megis llefaru negeseuon wedi’u tecstio.

Defnyddiodd y project WISPR fframwaith boblogaidd cod agored "Festival" ar gyfer TiL. Ychwanegodd y tîm WISPR yng Nghymru rai nodweddion defnyddiol newydd i Festival, megis galluogi Festival i ddelio gyda thestun oedd wedi’i greu mewn fformat UTF-8 (er mwyn i bob nod Cymraeg, gan gynnwys ŵ ac ŷ, gael eu trin yn gywir).

Datblygwyd Festival yn wreiddiol yn y Centre for Speech Technology Research, ym Mhrifysgol Caeredin, ac wedi hynny ym Mhrifysgol Carnegie-Mellon, UDA, dan y project "Festvox"

Llwyddiannau WISPR

Mae’r holl adnoddau a chymwysiadau a ddatblygwyd yn ystod y project WISPR ar gael yn ddi-dâl at ddefnydd anfasnachol, a gellir eu llwytho i lawr o’r tudalennau hyn. Hefyd, mae’r rhan fwyaf o'r cod ffynhonnell ar gael yn rhydd yn unol â thrwydded o fath BSD (yr eithriad yw'r llais "hl_diphone" hŷn, sy'n rhydd ar gyfer defnydd anfasnachol yn unig). Mae hyn yn golygu bod modd defnyddio ffrwyth technoleg llais WISPR yn ddirwystr bron, gyda dewis eang o feddalwedd, gan gynnwys meddalwedd berchnogol a meddalwedd cod agored.

Mae’r cynnyrch yn cael eu dosbarthu yn ôl y math o bobl fydd eu hangen, fel a ganlyn:-

Yr adnoddau sydd ar gael yw:

1 Adnoddau i’r defnyddiwr cyffredin

2 Adnoddau i ddatblygwyr

 

 

 

1 Adnoddau ar gyfer defnyddwyr cyffredin

1.1 Synthesis testun-i-lais Cymraeg ar gyfer Windows

I lwytho fersiwn Windows i lawr o’r tri llais TiL Cymraeg, cliciwch yma.

Bydd hyn yn mynd â chi at y wybodaeth gefndir a’r cyfarwyddiadau gosod.

I lwytho’r lleisiau i lawr, cliciwch y cyswllt o dan "Gosodwr", a dilynwch y cyfarwyddiadau gosod yn is i lawr y dudalen. Bydd hyn yn gosod y tri llais: siaradwr gwrywaidd o dde Cymru o ansawdd sylfaenol, siaradwr benywaidd o ogledd Cymru, a siaradwr gwrywaidd o ogledd Cymru. Mae’n bosibl newid rhwng y tri llais yn ôl eich dewis.

1.2 Cloc sy’n siarad ar-lein

Cynhwyswyd dau lais naturiol eu sain sy’n dweud yr amser (un gwrywaidd ac un benywaidd) mewn arddangosiad gwe yn y wefan ganlynol.

 

 

2 Adnoddau ar gyfer datblygwyr

2.1 TiL Cymraeg gan ddefnyddio Unix/Linux/Cygwin

Wrth ddefnyddio Unix, Linux neu Cygwin, mae angen llwytho Festival i lawr a’i adeiladu. Mae hwn yn cynnwys Offer Iaith Caeredin (yr Edinburgh Speech Tools - EST). Gellir cael y rhain o’r cyfeiriadur hwn (mae’n cynnwys y gwelliannau Cymraeg-benodol i god Festival). Dylid adeiladu EST cyn adeiladu Festival.

Yn nesaf, dylid llwytho i lawr y cod sy’n gyffredin i bob llais. Mae hyn yn cynnwys y ffeil " welshtoken.scm", a dylid rhoi hon yn y cyfeiriadur <Festival directory>/lib/voices/welsh/Tokenisation/

Yn olaf, gellir llwytho i lawr a gosod y lleisiau unigol. Mae’r lleisiau yn cynnwys y canlynol:

 

2.2 Sgriptiau Python i’w defnyddio wrth adeiladu llais newydd neu dasgau eraill

Crëwyd sawl arf newydd i’w defnyddio wrth adeiladu llais Festival newydd. Mae’r rhain ar ffurf sgriptiau Python. Iaith sgriptio yw Python a gellir ei llwytho i lawr o www.python.org. Mae’r offer fel a ganlyn:-

 

2.3 Sgriptiau recordio ar gyfer y Gymraeg

2.4 Data lleferydd wedi’i recordio ar gyfer y Gymraeg

 

2.5 Dogfennau technegol

 

2.6 Papurau gwyddonol

2006
2005
2004

Language Technologies
(Canolfan Bedwyr)
University of Wales, Bangor 2001 - 2006