Testun-i-Leferydd Cymraeg ar Windows
Rhyngwyneb MSAPI i System Synthesis Lleferydd Festival gyda Lleisiau Cymraeg, fersiwn 1.0

SYLWADAU

Hon yw fersiwn gyhoeddus gyntaf tri llais Cymraeg a ddatblygwyd yn sgîl prosiect WISPR (Adnoddau Llais Cymraeg a Gwyddeleg: Welsh and Irish Speech Processing Resources) gan yr Uned Technolegau Iaith (Canolfan Bedwyr), Prifysgol Cymru Bangor.

Mae cydrannau meddalwedd ychwanegol, a ddatblygwyd gan Uned Technolegau Iaith (Canolfan Bedwyr), Prifysgol Cymru Bangor, yn integreiddio Windows a Festival wrth bontio’r ddau ar safon MSAPI (Microsoft Speech API). Mae fersiwn hon yn cynnwys y lleiafswm o nodweddion sy’n cynnal ffwythiannau siarad syml MSAPI.

Mae’r llais testun-i-leferydd Cymraeg yn cynnig cynhaliaeth sylfaenol i orchymyn siarad (Speak) MSAPI.

Gellir newid cyfradd siarad y llais hefyd o fewn y gosodiad MSAPI.

Mae’r system Festival o fewn y gosodwr yn cynnwys dim ond y ffeiliau angenrheidiol, sy’n golygu mai dim ond 56Mb o faint yw gosodwr y tri llais Cymraeg.

Mae’r holl adnoddau llais gynhyrchwyd gan y prosiect WISPR wedi’u trwyddedu ar sail debyg i BSD, sy’n rhoi’r rhyddid i chi ddefnyddio’r meddalwedd hwn o fewn eich prosiectau neu’ch cynnyrch heb gost ariannol. Cyhoeddir ffynhonnell graidd y cydrannau MSAPI yn fuan, ond os oes eu hangen arnoch ar frys cysylltwch â d.b.jones@bangor.ac.uk

Cewch ddefnyddio'r mwyafrif o'r ffeiliau yn y dosbarthiad hwn at ddefnydd masnachol ac anfasnachol.

Weler Cyfyngiadau a Materion y Gwyddur Amdanynt

Dim ond ar gyfer defnydd anfasnachol y mae Prifysgol Cymru Bangor yn dosbarthu ffeiliau'r llais "hl_diphone" (h.y. y ffeiliau sydd wedi eu cadw yn http://bedwyrredhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/hl_diphone/ ). Dylid cyfeirio unrhyw ymholiadau am ddefnydd masnachol y ffeiliau hyn at yr University of Edinburgh.

 

 

LLEOLIAD LLWYTHO I LAWR

Gosodwr: http://www.e-gymraeg.org/wispr/1.0/wispr_msapi.zip

Manylion y Drwydded (yn Saesneg): http://www.e-gymraeg.org/wispr/1.0/LICENSE.html

Diolchiadau: http://www.e-gymraeg.org/wispr/1.0/DIOLCHIADAU.html

 

LLEISIAU CYNWYSEDIG

Ceir tri llais o fewn y gosodwr. Gellir dewis un o’r rhain i gychwyn, wrth osod y lleisiau eu hunain. Gellir newid y llais sydd ar waith yn hwyrach hefyd, ac fe geir y cyfarwyddiadau yn yr adran ‘Ffeil Ffurfweddu’ isod.

1)     cb_cy_llg_diphone: Gwryw, acen Ogleddol, cyfradd samplo 16k

2)     cb_cy_cw_diphone: Benyw, acen Ogleddol, cyfradd samplo 16k

3)     hl_diphone: Gwryw, acen Ddeheuol, cyfradd samplo 10k

Datblygwyd lleisiau 1) a 2) yn gyfangwbl gan brosiect WISPR. Datblygwyd llais 3) yn wreiddiol gan Dr Briony Williams, gynt o’r Centre for Speech Technology Research (CSTR), Caeredin.

 

 

FERSIYNAU BLAENOROL

The URLs below refer to previous releases of the MSAPI framework, the early ones of which were available only to beta testers and interested parties. The hl_diphone voice alone was packaged with these releases.

Sylwer mai yn Saesneg geir y nodiadau isod.

Fersiwn 0.1: Nodiadau: http://www.bangor.ac.uk/ar/cb/wispr/0.1/ReleaseNote.txt

Fersiwn 0.2: Nodiadau: http://www.bangor.ac.uk/ar/cb/wispr/0.2/

Fersiwn 0.3: Nodiadau: http://www.bangor.ac.uk/ar/cb/wispr/0.3/

At ddefnydd mewnol Canolfan Bedwyr y bwriadwyd Fersiwn 0.4, a chafodd y fersiwn hon mo’i rhyddhau’n gyhoeddus

Fersiwn 0.5: Nodiadau: http://www.e-gymraeg.org/wispr/0.5/

 

 

NODWEDDION

-        Caiff ffeil ffurfweddu ei darllen wrth ymgychwyn y llais, felly gall y rhyngwyneb MSAPI ddefnyddio unrhyw lais Festival sydd wedi’i osod (gweler y Nodiadau Technegol)

-        Caiff y gorchymyn atal siarad

-        Cydnaws â’r nodwedd newid cyflymder llais

-        Rhyngwyneb MSAPI cyflawn; does dim angen gosodiad cleient-gweinydd (gweler y Nodiadau Technegol)

-        Yn cynnal nodau wedi’u hamgodio yn UTF-8, ac yn cynnwys tocyneiddio ychwanegol ar gyfer opsiynau dewislenni

-        Tocyneiddio 'dehongli amser’ ar gyfer y Cloc Siarad Cymraeg

-        Logio gwallau (gweler y Nodiadau Technegol)

 

 

CYFYNGIADAU A MATERION Y GWYDDIR AMDANYNT

- O fewn Windows XP mae’r rhyngwyneb MSAPI yn gweithio orau. Mae’n bosib na fydd y peiriant Festival yn gweithio o fewn amgylchedd Windows 98/ME/2000. The MSAPI interface works best in Windows XP. The Festival engine might not work on Windows 98/ME/2000 machines. Mae risg wrth osod y lleisiau ar y systemau gweithredu hynny.

- Os yw’r canolwedd (middleware) lleferydd ar goll o fewn Windows (mae hyn yn digwydd yn aml o fewn Windows 98/ME), mae’r gosodwr yn cynnwys modylau cyfuno er mwyn ychwanegu’r rhain at y Panel Rheoli. (gweler yr adran ‘Ffeiliau a Grëir neu a Ddefnyddir’ isod)

- Ar hyn o bryd, dim ond Windows XP Home a Professional ellir eu gwarantu fel systemau gorchymyn ar gyfer y lleisiau. Credir, fodd bynnag, y gall Windows 2000 Professional gynnal y gosodwr hefyd.

 - Mae nifer o agweddau MSAPI heb eu cynnal, e.e. newid lefel y sain.

- Ansawdd y llais yn diraddio’n achlysurol wrth newid o’r naill lais I’r llall

- Mae ansawdd llais hl_diphone yn is nag ansawdd y ddau lais arall, am fod rhaid i Windows ail-samplu’r llais cyn ei allbynnu.

 

 

GOFYNION SYSTEM

- Windows XP Home/Professional

- Prosesydd Intel Pentium neu un o gyflymder tebyg (argymhellir 233 MHz neu gyflymach)

- 64 MB RAM

- 60 MB yn rhydd ar y disg galed

 

 

CYFARWYDDIADAU GOSOD

I osod y llais:

- dad-zipiwch holl gynnwys y ffeil zip i fewn i ffolder dros dro

- rhowch glic ddwbl ar y rhaglen setup.exe

- dilynwch y cyfarwyddiadau ar y sgrîn

- os oes angen gwneud hynny, ail-gychwynnwch Windows

I glywed y llais

- Ewch at y Panel Rheoli a dewiswch yr eicon Speech.

- Yn y blwch deialog Speech Properties, cliciwch y tab 'Text to Speech'.

- Yn y gwymplen dewis llais, dewiswch 'Festival Welsh Diphone Voice 1.0'

- Rhowch unrhyw destun Cymraeg o fewn y blwch testun islaw

- Gwasgwch y botwm 'Preview Voice' i wrando ar y llais. Gwasgwch ‘Stop’ i dewi’r llais

Os cewch anhawsterau wrth osod y lleisiau, cysylltwch â d.b.jones@bangor.ac.uk

 

 

FFURFWEDDIAD

Festival 1.96 beta (Crëwyd gan Alan Black ar Fedi 19eg 2005, gydag ychwanegiadau Canolfan Bedwyr i gynnal UTF-8) adeiladwyd gan Microsoft Visual Studio .NET compiler (Crewyd y Makefiles o fewn Cygwin)

MSAPI ddatblygwyd â Microsoft Speech SDK 5.1

Modylau cyfuno sydd wedi’u cynnwys o fewn y gosodwr:

SpPhones.msm – Modwl Cyfuno Set Ffonau Cyffredinol

Am fanylion pellach gweler: http://www.microsoft.com/speech/download/old/ups.asp

I osod canolwedd lleferydd Microsoft a rhoi eicon Speech o fewn eich Panel Rheoli (os nad yw yno’n barod):

  Sp5.msm

  Sp5Intl.msm

  SpCommon.msm

  (gweler y testun 'Microsoft Speech SDK Setup 5.1' o fewn ffeil gymorth Microsoft Speech SDK 5.1)

 

 

FFEILIAU A FFOLDERI A GRËIR

      C:\festival\festival              (Prif ffolder)

      C:\festival\festival\lib          (Ffeiliau llyfrgell y llais)

      C:\festival\festival\lib\etc

      C:\festival\festival\lib\multisyn

      C:\festival\festival\lib\voices\...

      C:\festival\festival\win32        (Lleoliad y Dll a rhaglenni win32 eraill)

      C:\festival\festival\win32\tmp    (Ffolder creu ffeiliau wav dros dro)

      C:\festival\festival\win32\log    (Logio gwallau)

 

 

NODIADAU I DDATBLYGWYR/NODIADAU TECHNEGOL

FFEIL FFURFWEDDU

 Rhaid rhoi ffeil ffurfweddu yn C:\festival\festival\win32\config\config.ini. Mae’r ffeil yn cynnwys dau bâr allwedd=gwerth. Rhaid i’r allweddi canlynol fod yn bresennol:

 command (yr union orchymyn i’w ddefnyddio i gychwyn y llais o linell orchymyn Festival, gan gynnwys y cromfachau o’i amgylch)

 sampling_rate (y gyfradd samplo, mewn Hz)

Er enghraifft:

command=(voice_cb_cy_llg_diphone)
sampling_rate=16000

Dyma’r gorchmynion ar gyfer y lleisiau sydd o fewn y fersiwn hon:

(voice_cb_cy_llg_diphone): Gwryw, acen Ogleddol
(voice_cb_cy_cw_diphone): Benyw, acen Ogleddol
(voice_hl_diphone): Gwryw, acen Ddeheuol, gyda chyfradd samplo is na’r lleisiau Gogleddol.

16000 yw’r gyfradd samplo (sampling_rate) ar gyfer y ddau lais cyntaf, a 10000 ar gyfer hl_diphone.

Os oes angen llais gwahanol, gellir newid y ffeil ffurfweddu ar amrantiad, heb orfod ail-gychwyn y rhyngwyneb MSAPI.

LOGIO GWALLAU

 Fe geir ffeiliau log o fewn C:\festival\festival\win32\log gyda’r enwau YYYYMM.txt, sy’n olrhain unrhyw wallau sy’n digwydd wrth ddefnyddio’r rhyngwyneb Festival/MSAPI.

 Er enghraifft:

 2005/05/24 09:46:13     Error       festival_eval_command - (voice_hl_diphone) (0)
 2005/05/25 12:28:13     Error       festival_text_to_wave - 'Maximize' (0)

 Caiff y wybodaeth ei gofnodi yn y ffurf ganlynol:

 Dydd ac Amser           Math        Manylion y gwall     - Gwybodaeth ychwanegol    (Y cod gwall gynhyrchwyd gan GetLastError)

 CREU FFOLDER DROS DRO

Mae angen y ffolder hwn i storio’r ffeil wav dros dro cyn i MSAPI ei chwarae. Heb y ffolder hwn, ni ellir cadw’r ffeil wav ac, o ganlyniad, ni glywir y llais.

COD FFYNHONNELL

Mae Fersiwn Windows Festival wedi’i adeiladu yn erbyn fersiwn 1.96 beta o Festival, a’r offer lleferydd sy’n gysylltiedig â’r fersiwn honno. Fe’u ceir fan hyn:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/Software/Festival/WISPR/Merged/Snapshots/MSAPI_V1.0_20060822/festival

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/Software/Festival/WISPR/Merged/Snapshots/MSAPI_V1.0_20060822/speech_tools

Tarddiad y ffolderi llais cyffredin o fewn y gosodiad hwn (LTS, Lexicon, Tokenisation):

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/common/Snapshot/MSAPI_V1.0_20060822/festival/lib/voices/

Tarddiad y ffolder cb_cy_llg_diphone sydd o fewn y pecyn:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/cb_cy_llg_diphone/Snapshot/MSAPI_V1.0_20060822

Tarddiad y ffolder cb_cy_cw_diphone sydd o fewn y pecyn:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/cb_cy_cw_diphone/Snapshot/MSAPI_V1.0_20060822

Tarddiad y ffolder hl_diphone sydd o fewn y pecyn:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/hl_diphone/Snapshot/MSAPI_V1.0_20060822

Ceir y datrysiad MSAPI fan hyn:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/Software/MSAPI/Snapshot/MSAPI_V1.0_20060822

Sylwer:

Tarddiad voices.scm yw:

http://bedwyr-redhat.bangor.ac.uk/svn/repos/WISPR/FestVox_Voices/common/Snapshot/MSAPI_V1.0_20060822/festival/lib/voices/

Language Technologies
(Canolfan Bedwyr)
University of Wales, Bangor 2001 - 2006