Kaldi的Phones文件夹下面的文件介绍
里面共有三种格式 csl, int, txt ,其实内容都是一样的,
align_lexicon
表示对齐文件,是由lexiconp.txt的第一列第三列提取出来生成
context_indep
非正常音素集合,包含(静音(SIL),口语噪声(SPN),非口语噪声(NSN)和笑声(LAU)
silence
静音音素
nonsilence
正常音素 可以认为和上面的silence是互斥的,两个文件音素的合集可以认为是整个音素集
sets
包含了一些列的音素集,在聚类音素时被分组,以建立相关的问题集(决策树的决策条件)
extra_question
包含了自动生成以外的问题
disambig
文件里面包含的是消歧符号 ,这些消歧符号在phones.txt中当作音素使用
word_boundary
音素和词位的关联信息,建立这种对应关系是需要这些信息在音素网络中恢复词的边界
roots
建立音素上下文决策树信息,里面的shared 表示共享根,一般语气和语调会在同一行,认为共享