https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C475KOm_zrgu4lQARvep2SAkyRJRH-nhEQBuKg4okgcHYvQWjoV7yWodPC8FbmbqcBLk24Stjy46hafpf_cjj5hb&uniplatform=NZKPT

摘要
Abstract
第一章 绪论
1.1 选题背景
1.2 研究对象和目标
1.3 研究意义
1.4 论文的特色和创新
1.5 论文结构框架
第二章 西班牙语发音词典研究
2.1 发音词典简述
2.2 发音词典的地位与构建方法
2.3 词汇标音方法综述
2.4 西班牙语的语音特征分析
2.4.1 西班牙语发音规则
2.4.2 设计音素集归纳的新发音规则
2.5 西班牙语发音词典设计
2.5.1 西班牙语发音音素集的设计
2.5.2 西班牙语发音词典词表的构建
2.6 本章小结
第三章 西班牙语军事词汇的获取
3.1 军事领域的选择原因
3.2 军事语料的网络来源
3.3 语料的收集与整理
3.3.1 西班牙语军事网站的语料爬虫方法
3.3.2 非军事网站的语料爬虫方法
3.3.3 军事语料的清洗
3.4 军事词汇收集的成果展示
3.5 本章小结
第四章 基于RNN的西班牙语词汇字音转换
4.1 字音转换任务建模
4.2 基于RNN的字音转换模型
4.2.1 基于向量表示的字符嵌入输入层
4.2.2 基于循环神经网络的特征提取层
4.2.3 适用于端到端训练的连接时序分类层
4.3 实验设计与结果分析
4.3.1 实验数据准备
4.3.2 模型的构建与训练
4.3.3 实验结果分析
4.4 本章小结
第五章 西班牙语军事词汇发音预测原型系统设计
5.1 模型构建与训练
5.1.1 基于Word2vec的字符嵌入模型构建与训练
5.1.2 基于keras的字音转换模型构建与训练
5.2 发音预测原型系统设计与实现
5.3 本章小结
第六章 总结与展望

战略支援部队信息工程大学河南省

面向军事领域的西班牙语发音词典构建与预测研究

[1]赵皎谷. 面向军事领域的西班牙语发音词典构建与预测研究[D].战略支援部队信息工程大学,2021.DOI:10.27188/d.cnki.gzjxu.2021.000003.

赵皎谷

摘要:近年来,随着人工智能、大数据等技术的不断进步,以数据驱动为主要方法的自然语言处理得到了更加广泛的应用。本文拟利用数据驱动的办法实现西班牙语词汇的发音预测,从而实现西班牙语发音词典的快速构建。在西班牙语语音合成系统和语音识别系统中,发音词典是承载词汇发音信息的重要基础资源,发音词典的标注准确性以及规模大小将直接影响整个系统的性能。从语言类型学角度看,西班牙语属于屈折型语言,依靠词形变化体现不同的人称、时态、语态、单复数以及词性等。大量的词形变化导致发音词典难以覆盖新增词汇。利用字音转换技术实现自动标注,可有效缓解发音词典集外词缺失的问题。目前,国内外对西班牙语字音转换技术研究还比较匮乏,本文尝试研究西班牙语词汇发音规律,通过人工标注小型发音词典,采用数据驱动的字音转换技术,实现西班牙语发音词典的自动预测功能。本研究取得的主要成果如下:(1)研究西班牙语词汇的发音特点,设计制定了包含44个音素的西班牙语音素集,人工标注并检查核对,构建了一个涵盖91040词条的通用型西班牙语发音词典。(2)选取特定的西班牙语军事网站,通过直接下载词表和利用python编程进行网络爬虫和筛选,构建了一个涵盖22416词条的西班牙语军事词汇集。(3)通过研究对比不同的统计模型以及神经网络模型,提出了基于字符嵌入+循环神经网络(RNN)+连接时序分类(CTC)的端到端词汇标音模型。基于该模型完成了对西班牙语军事词汇集的发音预测,其准确率达到了91.88%。(4)基于Python组件streamlit设计了基于B/S架构的西班牙语军事词汇发音预测原型系统,用于测试所建模型的架构和预测发音功能,有助于研究成果的推广应用。综上,本研究基于神经网络模型对小型西班牙语发音词典进行建模,实现了西班牙语军事词汇的发音预测,完成了发音词典的快速构建过程。

西班牙语;发音词典;字音转换;循环神经网络;连接时序分类;

10.27188/d.cnki.gzjxu.2021.000003

评:主要是来找支撑“发音单位”这个概念的资料,粗略看了下目录,觉得就是用RNN做了个语音识别项目

“C:\Users\tellw\open_title\papers\speech_recognition\面向军事领域的西班牙语发音词典构建与预测研究_赵皎谷.caj”

创建于2023.3.22/17.59,修改于2023.3.22/17.59