Skip to content

nilc-nlp/entoa-tts

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Entoa-TTS is a dataset composed of 20 audio files and transcriptions (both manual and automatic by WhisperX), from NURC-SP Minimal Corpus: 6 Formal Elocutions (EF) totaling 4h28min52s; 5 formal dialogues between the speakers, with the presence of a documenter (D2) totaling 5h22min07s; 9 interviews about different topics, carried out by an interviewer with the interviewee (DID) totaling 6h11min20s. Although NURC-SP Minimal Corpus has 21 pairs of audio-transcription, one of them (SP_D2_062) was removed as its audio quality was not good for training TTS.

To compose the dataset part called "prosodic" it was used only terminal intonational units (terminal boundaries mark the conclusion of the utterance) from NURC-SP Minimal Corpus. For the part called "automatic" the 20 audio files of NURC-SP Minimal Corpus were segmented and transcripted by WhisperX. This dataset is used to compare the training of TTS models with terminal intonational units and with the segments generated by WhisperX. The prosodic parte of Entoa-TTS has 12:32:25 hours and the automatic part has 13:16:41 hours.

Dataset

Hugging Face Dataset

Models

Examples - FastSpeech2

ID Speech Ground Truth FastSpeech2 CMLTTS FastSpeech2 CMLTTS + ENTOA-PROSODIC FastSpeech2 CMLTTS + ENTOA-AUTOMATIC
01 eu quase não vou ao cinema teatro...
02 ah às vezes eu vou...
03 eu tenho ido a teatro.
04 deve ser como na televisão
05 então no teatro eu acho que é bem mais difícil...
06 a televisão é horroroso quando eles estão fazendo programa.
07 eu sei que não há preparação toda.
08 porque o grupo que trabalha em hair é enorme né
09 tenho impressão que ali levou tanto tempo de ensaio
10 me chocou tremendamente
11 eu saber que o filme é bom
12 eu gostei bastante
13 eu me lembro de vários filmes não lembro os nomes
14 por isso é que eu deixo de ir ao cinema
15 hoje tá tudo meio louco né
16 assisti em araraquara.
17 eu num lembro o nome do filme...
18 a molecada adorou.
19 eles adoraram o filme...
20 porque eu saio cansada mesmo
21 eu fico numa tensão nervosa
22 nós saímos pra ir ao teatro.
23 não conseguimos entrar fomos assistir esse filme.
24 eu acho que influi bastante
25 eu acho que teatro tá bem mais caro
26 eu acho que o público pre prefere cinema ainda
27 eu não entendi a pergunta
28 eu acho que o cinema tá perdendo viu
29 o que eu noto é isso
30 principalmente nos fins de semana

Releases

No releases published

Packages

No packages published