Please use this identifier to cite or link to this item: https://www.um.edu.mt/library/oar/handle/123456789/106801
Title: Preparation of a free-running text corpus for Maltese concatenative speech synthesis
Other Titles: Perspectives on Maltese linguistics
Authors: Borg, Mark
Bugeja, Keith
Vella, Colin
Mangion, Gordon
Gafa`, Carmel
Keywords: Phonetics
Speech synthesis
Speech processing systems
Text-to-speech software
Maltese language
Issue Date: 2014
Publisher: Akademie Verlag
Citation: Borg, M., Bugeja, K., Vella, C., Mangion, G., & Gafa`, C. (2014). Preparation of a free-running text corpus for Maltese concatenative speech synthesis. In A. Borg, S. Caruana, & A. Vella (Eds.), Perspectives on Maltese linguistics (pp. 297-318). Berlin: Akademie Verlag.
Abstract: Sistemi ta' sinteżi tat-taħdit jeħtieġu korpus ta' diskors għani mil-lat fonetiku. Dan l-istudju jixhed għal metodu ġdid li, b'mod awtomatiku, joħloq korpus ta' testi għall-Malti li fuqu jinbena repożitorju diġitali ta' taħdit. Korpus ta' madwar 33 miljun kelma nġabar minn siti elettroniċi, gazzetti, kotba u dokumenti uffiċjali; wara li dan tnaddaf u nqaleb għal rappreżentazzjoni fonetika (minn grafemi), ġie analizzat bl-għan li tinħareġ statistika biex tgħin jinqabdu l-ħsejjes kollha li hemm bżonn għall prosodija ta' ilħna sintetiċi. B'hekk, ġie magħżul korpus iżgħar li, għaldaqstant, xorta jiġbor fih il-karatteristiċi u l-ħsejjes kollha tal-korpus il-kbir. Il-metodu li ntuża biex bih jinħoloq dan il-korpus huwa indirizzat bir-reqqa f'din il-pubblikazzjoni. Il-kwalità tal-korpus hi mill-aqwa meta mqabbla ma' korpora maħluqa minn metodi oħra, inkluża l-għażla manwali.
URI: https://www.um.edu.mt/library/oar/handle/123456789/106801
Appears in Collections:Scholarly Works - FacICTCS

Files in This Item:
File Description SizeFormat 
Preparation_of_a_free_running_text_corpus_for_Maltese_concatenative_speech_synthesis_2014.pdf
  Restricted Access
820.24 kBAdobe PDFView/Open Request a copy


Items in OAR@UM are protected by copyright, with all rights reserved, unless otherwise indicated.