一种汉语智慧教学方法
未命名
09-07
阅读:133
评论:0
1.本发明涉及信息技术领域,尤其涉及一种汉语智慧教学方法。
背景技术:
2.各地经济的交流使各地区人发生交流的机率变大,在和其他地区人的交流中,大多数人会选用普通话。使用普通话可以消除不同方言间的隔阂,利于提高交际能力。每个地区有自己的方言,方言中的音节与普通话有区别,会影响教学。学生对于方言中较少出现而普通话中使用到的音节缺乏练习,发音不准,导致普通话发音不准确。不准确的普通话影响了人与人之间的交流。目前的汉语教学较为常规,缺少对地方的针对性。方言与普通话发音相近的地区对于普通话学习容易轻视,方言与普通话发音差异大的地区对于普通话教学容易畏难。根据地方语音针对性设计汉语教学,增加学生的学习兴趣,减少学生的学习难度。因此如何让汉语教学能够更好的适应学生的特点,自定义教学内容,是一个未解决的问题。
技术实现要素:
3.本发明提供了一种汉语智慧教学方法,主要包括:
4.获取学生普通话发音的语音材料;结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布;根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关,具体包括:基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征;采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响,所述采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响,具体包括:根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性,基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响;根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误,具体包括:根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音;根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题;根据学生的汉语发音音节特点,判断方言语种,并匹配学生方言语种的汉语练习题,包括:根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言语种具有共性的方言语种的汉语练习题。
5.进一步可选地,所述获取学生普通话发音的语音材料包括:
6.根据学生管理系统获取学生的籍贯信息,确定学生所处的方言区域,获得学生方言语种;收集学生普通话发音的语音材料,所述学生普通话发音的语音材料包括学生的汉语发音录音;采用语音信号的分析与处理技术,对语音信号进行去噪、语音端点检测、语音分割处理,获取干净的语音信号数据。
7.进一步可选地,所述结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布包括:
8.获取学生语音材料,并使用语音转换工具audacity软件将其转换为数字化的语音文件;利用语音分析工具praat软件对学生语音材料进行基本频率、声调、音素方面的分析,确定音节错误的位置;对于确定的音节错误位置,使用语音识别工具kaldi和deepspeech软件,对该位置的语音进行识别,并将结果与标准的普通话音节进行比较,确定是否存在音节错误;对于存在音节错误的语音材料,进行标注并记录具体的错误类型和位置;对记录下的错误进行统计分析,确定学生在普通话音节上的错误特征和频率分布。
9.进一步可选地,所述根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关包括:
10.构建方言发音库和普通话发音库,获得发言发音特征和普通话发音特征;采用智能化语音识别技术对学生发音进行判别,得到学生的发音错误列表;根据层次聚类算法,将学生按照方言发音特征进行聚类;通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征;判断学生发音错误是否符合其所在聚类的方言发音特征;根据判断结果确定学生发音错误是否与方言发音有关;包括:基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征;
11.所述基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征,具体包括:
12.使用语音识别软件和标注工具收集学生的语音数据。提取相应的方言发音特征,包括声母、韵母、声调。将每个学生的方言发音特征表示为向量形式,每个向量对应一个学生。计算每对学生之间的余弦相似度,并构建距离矩阵或相似度矩阵。初始时,将每个学生看作一个簇,将距离或相似度最近的两个簇合并为一个新的簇,直至所有学生都被合并到一个簇中,形成一个完整的层次结构。最终,根据生成的层次结构,选择不同的聚类结果。通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征。
13.进一步可选地,所述采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响包括:
14.确定不同方言和普通话的语音特征,包括声母、韵母、声调;获取不同方言和普通话的语音材料,并转换为数字化格式;使用软件工具对录音分别分段、标注每个音节的声母、韵母和声调信息;采用凝聚性方法构建聚类层次结构,对方言和普通话音节的声母、韵母和声调进行比较,统计出它们的出现频率和比例;根据音韵学规律,分析不同方言与普通话的音节差异,包括声母、韵母和声调的异同;收集各方言语种学生的语音数据,对收集到的录音数据进行分析,比较不同方言语种学生的普通话音节错误;同时,记录影响学生发音的方言语音特点,包括声母、韵母、声调;通过对数据进行分析,得出不同方言语种学生在普通话音节中存在的音节差异;采用深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响;包括:根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性;基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响;
15.所述根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性,具体包括:
16.根据语音识别技术,获取不同方言与普通话的音节数据。采用欧氏距离度量方法,计算每对音节之间的相似度或距离,并得到距离矩阵。根据距离矩阵,采用凝聚性方法构建聚类层次结构,逐步合并最相似的音节。在每次合并聚类后,通过完全链接合并策略,更新距离矩阵;根据聚类层次结构,判断不同方言与普通话的音节之间的差异性,并得到聚类结果,确定它们之间的差异性。
17.所述基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响,具体包括:
18.根据业务需求,收集学生的普通话发音录音数据,包括不同方言语种的学生录音数据。采用语音识别技术,将录音数据转换为文本数据,并根据录音数据对应的方言语种和普通话标准,对文本数据进行标注,得到标注后的语音数据集。获取已在源任务上训练好的深度神经网络模型。根据语音数据集,使用源模型对语音信号进行特征提取,提取出每个语音信号的mfcc特征,得到特征向量集合。根据判断不同方言语种对学生普通话的音节错误的影响的需求,采用微调fine-tuning的迁移学习策略。将源模型的全部参数作为初始参数,在目标任务数据集上持续训练。根据评估指标,包括准确率、f1分数,评估迁移学习模型在目标任务上的性能,得到模型性能评估结果。根据模型性能评估结果,调整迁移学习算法,包括微调策略、模型参数、训练策略,优化模型性能。使用训练好的迁移学习模型对新的语音信号进行预测,判断学生普通话发音是否存在方言影响,并准确识别语音中的错误之处。输出结果为错误的音节和对应位置。
19.进一步可选地,所述根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误包括:
20.搜集不同方言的音节特点,并与普通话音节进行对比,分析可能导致普通话音节错误的因素;基于音节特点和错误分析,采用循环神经网络方法设计普通话语音纠错模型;获取学生普通话录音数据,将录音数据存储在云端,并对录音进行处理;利用机器学习算法,对录音数据进行分析和处理,提取出学生的语音特征,包括声调、声母、韵母,并采用狄利克雷过程将其与普通话的音节进行对比,找出可能存在的音节错误;通过模型预测,得出不同方言语种的学生可能存在的普通话音节错误;包括:根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音;
21.所述根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音,具体包括:
22.根据学生方言语种信息和汉语音韵系统,获取不同方言语种的声母、韵母、声调发音规律。通过比对汉语音韵系统和学生方言音韵系统的声母、韵母、声调发音差异,确定学生可能存在的声母、韵母、声调发音问题。采用狄利克雷过程,选择狄利克雷分布作为先验分布,设置集中度参数。初始化一个空的簇集合作为簇。对于每个学生声母、韵母、声调发音样本,根据当前的簇分配概率进行分配,使用吉布斯采样方法,根据簇分配概率进行样本分配。对于每个簇,根据分配给它的学生声母、韵母、声调发音样本,更新簇的参数,根据具体任务选择不同的参数更新方法。对于未分配到任何簇的学生声母、韵母、声调发音样本,新建一个簇,并更新其参数。当达到最大迭代次数时,结束算法。输出最终的簇的集合作为需要重点指导的声母、韵母、声调发音。
23.进一步可选地,所述根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题包括:
24.获取不同方言语种学生普通话中可能存在的的声母、韵母、声调错误,设计针对不同方言语种的汉语练习题,包括声母练习、韵母练习、声调练习、连音练习;根据目标方言语种所属地区的文化背景,设计与文化相关的练习题,包括歌曲填词、地方俚语;根据不同级别学生的汉语水平,设计不同难度的练习题,包括初级练习题以发音为主,高级练习题则涉及语音变化规律;其中,所述不同级别学生的汉语水平根据学生汉语发音错误频率判定。
25.进一步可选地,所述根据学生的汉语发音音节特点,判断方言语种,并匹配学生方言语种的汉语练习题包括:
26.获取学生的普通话发音的语音材料,将语音材料导入语音处理软件praat中,对这段语音进行基频、共振峰、音高的提取和分析;使用语音分析工具语音特征比较器,将提取的参数与各方言语音的典型特征进行比较;根据比较结果,确定学生的方言语种;根据学生的学生的方言语种匹配该方言语种的汉语练习题;若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题;包括:根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言语种具有共性的方言语种的汉语练习题;
27.所述根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言语种具有共性的方言语种的汉语练习题,具体包括:
28.通过语音录音设备采集各地方言的语音数据,包括声母、韵母和声调信息。根据数据集特征,对语音数据进行标准化或归一化处理。获取语音数据集的协方差矩阵,并计算特征值和特征向量。特征值代表了语音数据集特征空间中的方差,而特征向量则表示了特征空间中的方向。选择前k个特征向量作为主成分,其中k根据具体需求确定。选择特征值大于预设阈值的特征向量作为主成分。基于所选的主成分,构建投影矩阵,用于将原始数据集投影到新的低维空间。通过投影矩阵,进行降维处理,将原始数据集与投影矩阵相乘,得到降维后的数据集。通过特定的方法提取其频谱特征,并将其降维成二维或三维数据。将数据集分成训练集和测试集。使用k-means分类算法,对训练集进行训练和拟合,并使用测试集进行预测。使用评估指标对模型性能进行评估。使用训练好的模型对新的音节数据进行分类,识别别不同地区的音节共性;若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题。
29.本发明实施例提供的技术方案可以包括以下有益效果:
30.本发明通过获取学生普通话发音的语音材料以及语音分析数据,识别学生语音材料中普通话的音节错误。同时,考虑到不同地域学生的方言发音特点,分析不同方言与普通话的音节差异,判断学生汉语发音错误是否与学生方言发音有关。通过音韵学分析方法,获取不同方言与普通话的音节差异,进一步预测不同方言语种的学生可能存在的普通话音节错误。根据这些分析结果,设计针对不同方言语种的汉语练习题,帮助学生提高普通话发音准确性。最终,通过判断学生汉语发音音节特点,匹配学生方言语种的汉语练习题,更加有效地提高学生的汉语发音水平。本发明中的技术可以帮助教师更好地了解学生汉语发音情况,针对性地进行教学和辅导,提高学生的汉语语音水平。
附图说明
31.图1为本发明的一种汉语智慧教学方法的流程图。
32.图2为本发明的一种汉语智慧教学方法的示意图。
具体实施方式
33.为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
34.本实施例一种汉语智慧教学方法具体可以包括:
35.步骤101,获取学生普通话发音的语音材料。
36.根据学生管理系统获取学生的籍贯信息,确定学生所处的方言区域,获得学生方言语种。收集学生普通话发音的语音材料,所述学生普通话发音的语音材料包括学生的汉语发音录音。采用语音信号的分析与处理技术,对语音信号进行去噪、语音端点检测、语音分割处理,获取干净的语音信号数据。例如,学生管理系统中获取到某个学生的籍贯信息是湖南省岳阳市,因此确定该学生所处的方言区域为湖南话区。接下来,根据湖南话区的方言特征来确定该学生可能使用的方言语种,如湘潭话、衡阳话、岳阳话。然后,收集该学生普通话发音的语音材料;接着,对语音材料进行去噪处理,去除环境噪声和录音设备自身的噪声。然后进行语音端点检测,确定录音中的语音区间,并进行语音分割处理,将单字、词语、句子语音分割出来,得到干净的语音信号数据。
37.步骤102,结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布。
38.获取学生语音材料,并使用语音转换工具audacity软件将其转换为数字化的语音文件;利用语音分析工具praat软件对学生语音材料进行基本频率、声调、音素方面的分析,确定音节错误的位置。对于确定的音节错误位置,使用语音识别工具kaldi和deepspeech软件,对该位置的语音进行识别,并将结果与标准的普通话音节进行比较,确定是否存在音节错误。对于存在音节错误的语音材料,进行标注并记录具体的错误类型和位置。对记录下的错误进行统计分析,确定学生在普通话音节上的错误特征和频率分布;例如,对一名学生的语音材料进行分析,发现其在发音字母“zh”和“ch”时经常出现错误。使用praat软件分析其语音材料,发现其基本频率和声调相对稳定,但在“zh”和“ch”这两个音节上出现了明显的峰值偏移和能量突变。使用kaldi和deepspeech软件对这两个音节进行识别,发现其中“zh”音节错误率高达25%,其中大部分错误是停顿时间过短或过长导致的;而“ch”音节错误率约为16%,其中大部分是因为音节清晰度不够,发音过轻或过重导致的。对于这些错误,进行标注并记录错误类型和位置,统计分析发现该学生的错误特征为“zh”音节停顿时间不准确、“ch”音节发音清晰度不够,错误频率分别为25%和16%。
39.步骤103,根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关。
40.构建方言发音库和普通话发音库,获得发言发音特征和普通话发音特征。采用智能化语音识别技术对学生发音进行判别,得到学生的发音错误列表。根据层次聚类算法,将学生按照方言发音特征进行聚类。通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征。判断学生发音错误是否符合其所在聚类的方言发音特征;根据判断结
果确定学生发音错误是否与方言发音有关。例如,某学生管理系统获取的学生籍贯为广东省揭阳市,确定该学生所处的方言区域为粤语区。通过智能化语音识别技术对该学生发音进行判别,得到该学生的发音错误列表为:l和n的区分不清、r和l的区分不清、s和sh的区分不清。通过调查或个人交流,获得该学生在方言发音方面的特征为:粤语区的l和n不区分、r和l不区分、s和sh不区分。构建方言发音库和普通话发音库,确定每个音节在两个库中的发音差异为:l和n、r和l、s和sh。将该学生发音错误列表与方言发音库进行对比,发现该学生的发音错误与方言发音有关。根据层次聚类算法,将该学生按照方言发音特征进行聚类,发现该学生属于粤语区聚类。通过聚类结果,确定该学生的方言发音特征为:l和n不区分、r和l不区分、s和sh不区分。进一步判断该学生发音错误是否符合其所在聚类的方言发音特征,发现该学生发音错误符合其所在聚类的方言发音特征,因此判定该学生发音错误与方言发音有关。
41.基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征。
42.使用语音识别软件和标注工具收集学生的语音数据。提取相应的方言发音特征,包括声母、韵母、声调。将每个学生的方言发音特征表示为向量形式,每个向量对应一个学生。计算每对学生之间的余弦相似度,并构建距离矩阵或相似度矩阵。初始时,将每个学生看作一个簇,将距离或相似度最近的两个簇合并为一个新的簇,直至所有学生都被合并到一个簇中,形成一个完整的层次结构。最终,根据生成的层次结构,选择不同的聚类结果。通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征。例如,有10个学生来自南方,想研究他们的方言发音特征,并将他们按照方言相似度聚类。使用语音识别软件和标注工具收集他们的语音数据,并提取方言发音特征,包括声母、韵母和声调。将每个学生的方言发音特征表示为向量形式,得到一个10x3的矩阵。接着,计算每对学生之间的余弦相似度,得到一个10x10的相似度矩阵。初始时,将每个学生看作一个簇,然后选取相似度最高的两个簇,例如,学生1和学生2的相似度最高,将他们合并为一个新的簇。此时,我们有9个簇。接着,再选取相似度最高的两个簇进行合并,例如,新的簇和学生3的相似度最高,将他们合并为一个新的簇。此时,我们有8个簇。重复以上步骤,直到所有学生都被合并到一个簇中,形成一个完整的层次结构。最终,根据生成的层次结构选择不同的聚类结果,例如,将他们分为三个聚类,每个聚类包含3-4个学生,分别代表不同的方言区域。通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征。
43.步骤104,采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响。
44.确定不同方言和普通话的语音特征,包括声母、韵母、声调。获取不同方言和普通话的语音材料,并转换为数字化格式。使用软件工具对录音分别分段、标注每个音节的声母、韵母和声调信息。采用凝聚性方法构建聚类层次结构,对方言和普通话音节的声母、韵母和声调进行比较,统计出它们的出现频率和比例。根据音韵学规律,分析不同方言与普通话的音节差异,包括声母、韵母和声调的异同。收集各方言语种学生的语音数据,对收集到的录音数据进行分析,比较不同方言语种学生的普通话音节错误;同时,记录影响学生发音的方言语音特点,包括声母、韵母、声调;通过对数据进行分析,得出不同方言语种学生在普通话音节中存在的音节差异;采用深度神经网络模型,确定不同方言语种对学生普通话的
音节错误的影响;例如,比较北京话和广东话的声母、韵母和声调差异,收集北京话和广东话的语音材料,使用录音设备录制并将其转换为数字化格式。使用语音识别软件和手动标注的方式,对录音进行分段并标注每个音节的声母、韵母和声调信息。采用凝聚性聚类方法,对声母、韵母和声调进行聚类分析,并得到聚类层次结构图。统计每个声母、韵母和声调在北京话和广东话中出现的频率和比例。根据音韵学规律,分析北京话和广东话在声母、韵母和声调上的异同。例如,比较北京话和广东话的声母差异,发现在普通话中有21个声母,而广东话中有19个,北京话中则有23个声母。其中,北京话中有特有的辅音声母ch、sh、zh和
ü
、ng,而广东话中没有。同时,北京话中的声母f、v、r、l在广东话中没有对应的发音。在声母的使用上,北京话和广东话都有初声和轻声之分,但在具体发音上有所差异。例如,北京话中的b、p、m、f、d、t、n、l声母在轻声中有明显的变化,而广东话则较少。
45.根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性。
46.根据语音识别技术,获取不同方言与普通话的音节数据。采用欧氏距离度量方法,计算每对音节之间的相似度或距离,并得到距离矩阵。根据距离矩阵,采用凝聚性方法构建聚类层次结构,逐步合并最相似的音节。在每次合并聚类后,通过完全链接合并策略,更新距离矩阵;根据聚类层次结构,判断不同方言与普通话的音节之间的差异性,并得到聚类结果,确定它们之间的差异性。例如,将四川话和普通话的音节数据分别表示为以下两个序列:四川话音节序列:ba,ma,da,ga,ka,na,ha;普通话音节序列:ba,ma,da,ga,ka,na,la,ha;根据这两个序列,计算它们之间的距离矩阵,根据距离矩阵,使用凝聚性方法构建聚类层次结构,逐步合并最相似的音节。在每次合并聚类后,使用完全链接合并策略,更新距离矩阵。最终,根据聚类层次结构判断四川话和普通话的音节之间的差异性,并得到聚类结果,确定它们之间的差异性。例如,得到以下聚类结果:(ba,ma,da,ga,ka,na,ha),(la),根据这个聚类结果,得出结论:四川话和普通话在音节方面的差异主要在于普通话有一个单独的音节"la",而其他音节基本相同。
47.基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响。
48.根据业务需求,收集学生的普通话发音录音数据,包括不同方言语种的学生录音数据。采用语音识别技术,将录音数据转换为文本数据,并根据录音数据对应的方言语种和普通话标准,对文本数据进行标注,得到标注后的语音数据集。获取已在源任务上训练好的深度神经网络模型。根据语音数据集,使用源模型对语音信号进行特征提取,提取出每个语音信号的mfcc特征,得到特征向量集合。根据判断不同方言语种对学生普通话的音节错误的影响的需求,采用微调fine-tuning的迁移学习策略。将源模型的全部参数作为初始参数,在目标任务数据集上持续训练。根据评估指标,包括准确率、f1分数,评估迁移学习模型在目标任务上的性能,得到模型性能评估结果。根据模型性能评估结果,调整迁移学习算法,包括微调策略、模型参数、训练策略,优化模型性能。使用训练好的迁移学习模型对新的语音信号进行预测,判断学生普通话发音是否存在方言影响,并准确识别语音中的错误之处。输出结果为错误的音节和对应位置。例如,收集1000个学生的普通话发音录音数据,其中有200个学生使用广东话、200个学生使用福建话、200个学生使用湖南话、200个学生使用四川话、200个学生使用普通话。使用语音识别技术将这些录音数据转换为文本数据,并对文本数据进行标注,得到标注后的语音数据集。使用已经在源任务上训练好的深度神经网
络模型,使用mfcc特征提取方法提取出每个语音信号的特征向量集合。目标是判断不同方言语种对学生普通话的音节错误的影响,因此采用微调fine-tuning的迁移学习策略。使用源模型的全部参数作为初始参数,在目标任务数据集上持续训练。使用训练集中的80%的数据进行训练,使用剩余的20%的数据进行验证。采用adam优化器和交叉熵损失函数进行训练,训练的迭代次数为1000次。在训练过程中,对模型的性能进行监控,并根据验证集的性能调整微调策略、模型参数和训练策略,以优化模型性能。最终,使用训练好的迁移学习模型对新的语音信号进行预测,并输出错误的音节和对应位置。
49.步骤105,根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误。
50.搜集不同方言的音节特点,并与普通话音节进行对比,分析可能导致普通话音节错误的因素。基于音节特点和错误分析,采用循环神经网络方法设计普通话语音纠错模型。获取学生普通话录音数据,将录音数据存储在云端,并对录音进行处理;利用机器学习算法,对录音数据进行分析和处理,提取出学生的语音特征,包括声调、声母、韵母,并采用狄利克雷过程将其与普通话的音节进行对比,找出可能存在的音节错误。通过模型预测,得出不同方言语种的学生可能存在的普通话音节错误;例如,在广东话中,韵母“ei”和“ui”经常被错误地发成“ai”和“oi”,这可能是因为这些韵母在广东话中的发音相似,易于混淆。此外,在客家话中,“i”韵母经常被错误地发成“e”,这可能是因为在客家话中,“i”韵母的发音比普通话更加接近“e”。因此,当学生通过普通话语音纠错系统进行录音时,系统可以通过对录音数据进行分析和处理,提取出学生的语音特征,并将其与普通话的音节进行对比,找出可能存在的音节错误。例如,如果系统检测到学生在发音时经常将“ei”和“ui”发成“ai”和“oi”,则系统会通过模型预测学生可能存在这些错误。
51.根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音。
52.根据学生方言语种信息和汉语音韵系统,获取不同方言语种的声母、韵母、声调发音规律。通过比对汉语音韵系统和学生方言音韵系统的声母、韵母、声调发音差异,确定学生可能存在的声母、韵母、声调发音问题。采用狄利克雷过程,选择狄利克雷分布作为先验分布,设置集中度参数。初始化一个空的簇集合作为簇。对于每个学生声母、韵母、声调发音样本,根据当前的簇分配概率进行分配,使用吉布斯采样方法,根据簇分配概率进行样本分配。对于每个簇,根据分配给它的学生声母、韵母、声调发音样本,更新簇的参数,根据具体任务选择不同的参数更新方法。对于未分配到任何簇的学生声母、韵母、声调发音样本,新建一个簇,并更新其参数。当达到最大迭代次数时,结束算法。输出最终的簇的集合作为需要重点指导的声母、韵母、声调发音。例如,有一组学生方言语种信息,包含3个学生,分别使用晋语、湖南话、四川话,学生1:晋语,说话带有轻微口吃,声调较为模糊,学生2:湖南话,说话速度较快,声调上扬,发音清晰,学生3:四川话,说话速度较慢,声调下降,韵母发音不准确;通过比对汉语音韵系统和学生方言音韵系统的声母、韵母、声调发音差异,确定学生可能存在的声母、韵母、声调发音问题,学生1:可能存在声调发音不准确的问题,学生2:发音比较标准,没有明显问题,学生3:可能存在韵母发音不准确的问题;然后根据狄利克雷过程和吉布斯采样方法进行学生声母、韵母、声调发音样本的聚类。输出最终的簇的集合作为需要重点指导的声母、韵母、声调发音。最终的聚类结果可能是这样的:簇1:晋语,声调发音不
准确的问题,簇2:湖南话,发音比较标准,簇3:四川话,韵母发音不准确的问题。
53.步骤106,根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题。
54.获取不同方言语种学生普通话中可能存在的的声母、韵母、声调错误,设计针对不同方言语种的汉语练习题,包括声母练习、韵母练习、声调练习、连音练习;根据目标方言语种所属地区的文化背景,设计与文化相关的练习题,包括歌曲填词、地方俚语;根据不同级别学生的汉语水平,设计不同难度的练习题,包括初级练习题以发音为主,高级练习题则涉及语音变化规律。其中,所述不同级别学生的汉语水平根据学生汉语发音错误频率判定;例如,针对学习普通话的广东学生,可能存在的声母错误包括将“sh”读成“s”、“zh”读成“z”;韵母错误包括将“an”读成“en”、“ong”读成“ang”;声调错误则包括不正确区分一二声和三四声。因此,设计声母练习题如“将下列字母中发音不同的字母标出来”、韵母练习题如“将下列字母组成正确的读音”、声调练习题如“判断下列词语的声调是否正确”、连音练习题如“将下列连读的字音组成正确的句子”。在文化相关的练习题方面,选择广东地区的经典方言歌曲,让学生填词,同时介绍歌曲背后的文化故事;或者介绍广东地区的俚语、谚语,让学生了解当地文化特色。在不同级别学生的汉语水平方面,设计初级练习题如基础发音练习、拼音练习,高级练习题则涉及声调变化规律、语音变化规律。
55.步骤107,根据学生的汉语发音音节特点,判断方言语种,并匹配学生方言语种的汉语练习题。
56.获取学生的普通话发音的语音材料,将语音材料导入语音处理软件praat中,对这段语音进行基频、共振峰、音高的提取和分析;使用语音分析工具语音特征比较器,将提取的参数与各方言语音的典型特征进行比较;根据比较结果,确定学生的方言语种。根据学生的学生的方言语种匹配该方言语种的汉语练习题;若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题;例如,学生a来自四川省,普通话发音中有明显的川音特点。首先,收集学生a的普通话语音材料。然后,将这些语音材料导入praat中,对其进行基频、共振峰、音高的提取和分析。接下来,使用语音分析工具语音特征比较器,将学生a的语音特征与四川话、北京话、上海话这些其他方言语音的典型特征进行比较。比较结果显示,学生a的语音特征与四川话的典型特征非常相似,确定学生a的方言语种为四川话。根据学生a的方言语种,匹配该方言语种的汉语练习题,例如“四川话发音练习”、“四川话口音练习”。如果没有相应的练习题,选择与四川话有共性的其他方言语种的汉语练习题,例如“重庆话发音练习”、“贵州话口音练习”。
57.根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言语种具有共性的方言语种的汉语练习题。
58.通过语音录音设备采集各地方言的语音数据,包括声母、韵母和声调信息。根据数据集特征,对语音数据进行标准化或归一化处理。获取语音数据集的协方差矩阵,并计算特征值和特征向量。特征值代表了语音数据集特征空间中的方差,而特征向量则表示了特征空间中的方向。选择前k个特征向量作为主成分,其中k根据具体需求确定。选择特征值大于预设阈值的特征向量作为主成分。基于所选的主成分,构建投影矩阵,用于将原始数据集投影到新的低维空间。通过投影矩阵,进行降维处理,将原始数据集与投影矩阵相乘,得到降维后的数据集。通过特定的方法提取其频谱特征,并将其降维成二维或三维数据。将数据集
分成训练集和测试集。使用k-means分类算法,对训练集进行训练和拟合,并使用测试集进行预测。使用评估指标对模型性能进行评估。使用训练好的模型对新的音节数据进行分类,识别别不同地区的音节共性;若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题;例如,要对中国的各地方言进行识别,首先需要采集不同方言的语音数据,包括普通话、广东话、上海话。然后对这些语音数据进行标准化或归一化处理,得到相同维度的数据集。接着,获取语音数据集的协方差矩阵,并计算特征值和特征向量。选择前k个特征向量作为主成分,其中k根据具体需求确定。选择特征值大于预设阈值的特征向量作为主成分。通过投影矩阵,进行降维处理,将原始数据集与投影矩阵相乘,得到降维后的数据集。然后,将数据集分成训练集和测试集。使用k-means分类算法,对训练集进行训练和拟合,并使用测试集进行预测。使用评估指标对模型性能进行评估。通过训练好的模型,对新的音节数据进行分类,识别别不同地区的音节共性。若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题。
59.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本技术构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
技术特征:
1.一种汉语智慧教学方法,其特征在于,所述方法包括:获取学生普通话发音的语音材料;结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布;根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关,具体包括:基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征;采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响,所述采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响,具体包括:根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性,基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响;根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误,具体包括:根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音;根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题;根据学生的汉语发音音节特点,判断方言语种,并匹配学生方言语种的汉语练习题,包括:根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言语种具有共性的方言语种的汉语练习题。2.根据权利要求1所述的方法,其中,所述获取学生普通话发音的语音材料,包括:根据学生管理系统获取学生的籍贯信息,确定学生所处的方言区域,获得学生方言语种;收集学生普通话发音的语音材料,所述学生普通话发音的语音材料包括学生的汉语发音录音;采用语音信号的分析与处理技术,对语音信号进行去噪、语音端点检测、语音分割处理,获取干净的语音信号数据。3.根据权利要求1所述的方法,其中,所述结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布,包括:获取学生语音材料,并使用语音转换工具audacity软件将其转换为数字化的语音文件;利用语音分析工具praat软件对学生语音材料进行基本频率、声调、音素方面的分析,确定音节错误的位置;对于确定的音节错误位置,使用语音识别工具kaldi和deepspeech软件,对该位置的语音进行识别,并将结果与标准的普通话音节进行比较,确定是否存在音节错误;对于存在音节错误的语音材料,进行标注并记录具体的错误类型和位置;对记录下的错误进行统计分析,确定学生在普通话音节上的错误特征和频率分布。4.根据权利要求1所述的方法,其中,所述根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关,包括:构建方言发音库和普通话发音库,获得发言发音特征和普通话发音特征;采用智能化语音识别技术对学生发音进行判别,得到学生的发音错误列表;根据层次聚类算法,将学生按照方言发音特征进行聚类;通过聚类结果,获取每个聚类中的学生列表,确定每个聚类的方言发音特征;判断学生发音错误是否符合其所在聚类的方言发音特征;根据判断结果确定学生发音错误是否与方言发音有关;包括:基于层次聚类算法,将学生按照方言发音特征进行聚类,确定每个聚类的方言发音特征。
5.根据权利要求1所述的方法,其中,所述采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响,包括:确定不同方言和普通话的语音特征,包括声母、韵母、声调;获取不同方言和普通话的语音材料,并转换为数字化格式;使用软件工具对录音分别分段、标注每个音节的声母、韵母和声调信息;采用凝聚性方法构建聚类层次结构,对方言和普通话音节的声母、韵母和声调进行比较,统计出它们的出现频率和比例;根据音韵学规律,分析不同方言与普通话的音节差异,包括声母、韵母和声调的异同;收集各方言语种学生的语音数据,对收集到的录音数据进行分析,比较不同方言语种学生的普通话音节错误;同时,记录影响学生发音的方言语音特点,包括声母、韵母、声调;通过对数据进行分析,得出不同方言语种学生在普通话音节中存在的音节差异;采用深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响;包括:根据不同方言与普通话的音节资料,采用凝聚性方法构建聚类层次结构,确定它们之间的差异性。基于深度神经网络模型,确定不同方言语种对学生普通话的音节错误的影响。6.根据权利要求1所述的方法,其中,所述根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误,包括:搜集不同方言的音节特点,并与普通话音节进行对比,分析可能导致普通话音节错误的因素;基于音节特点和错误分析,采用循环神经网络方法设计普通话语音纠错模型;获取学生普通话录音数据,将录音数据存储在云端,并对录音进行处理;利用机器学习算法,对录音数据进行分析和处理,提取出学生的语音特征,包括声调、声母、韵母,并采用狄利克雷过程将其与普通话的音节进行对比,找出可能存在的音节错误;通过模型预测,得出不同方言语种的学生可能存在的普通话音节错误;包括:根据不同方言语种声调、声母、韵母发音的差异,获取学生可能存在的声母、韵母、声调问题,并确定需要重点指导的声母、韵母、声调发音。7.根据权利要求1所述的方法,其中,所述根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题,包括:获取不同方言语种学生普通话中可能存在的的声母、韵母、声调错误,设计针对不同方言语种的汉语练习题,包括声母练习、韵母练习、声调练习、连音练习;根据目标方言语种所属地区的文化背景,设计与文化相关的练习题,包括歌曲填词、地方俚语;根据不同级别学生的汉语水平,设计不同难度的练习题,包括初级练习题以发音为主,高级练习题则涉及语音变化规律;其中,所述不同级别学生的汉语水平根据学生汉语发音错误频率判定。8.根据权利要求1所述的方法,其中,所述根据学生的汉语发音音节特点,判断方言语种,并匹配学生方言语种的汉语练习题,包括:获取学生的普通话发音的语音材料,将语音材料导入语音处理软件praat中,对这段语音进行基频、共振峰、音高的提取和分析;使用语音分析工具语音特征比较器,将提取的参数与各方言语音的典型特征进行比较;根据比较结果,确定学生的方言语种;根据学生的学生的方言语种匹配该方言语种的汉语练习题;若学生的方言语种没有相应汉语练习题,则匹配与该方言语种有共性的其他有汉语练习题的方言语种的汉语练习题;包括:根据不同方言的音节特点,获取不同方言语种音节的共性,对于无法判别的方言语种匹配和该方言
语种具有共性的方言语种的汉语练习题。
技术总结
本申请提供一种汉语智慧教学方法,包括:获取学生普通话发音的语音材料;结合语音分析数据,识别学生语音材料中的普通话的音节错误,确定学生在普通话音节上的错误特征和频率分布;根据不同地域学生的方言发音特点,判断学生的汉语发音错误是否与学生方言发音有关;采用音韵学分析方法,获取不同方言与普通话的音节差异,判断不同方言语种对学生普通话的音节错误的影响;根据不同方言语种对学生普通话的音节错误的影响,预测不同方言语种的学生可能存在的普通话音节错误;根据不同方言语种学生普通话中可能存在的的声母、韵母、声调错误和不同方言语种所属地区的文化背景,设计针对不同方言语种的汉语练习题。不同方言语种的汉语练习题。不同方言语种的汉语练习题。
技术研发人员:张伟 马文耀
受保护的技术使用者:广东海洋大学
技术研发日:2023.06.19
技术公布日:2023/9/6
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种箍型瓶及其生产工艺的制作方法 下一篇:一种自动化汽车电子摆件
