一种计算机作曲方法、系统、电子设备及存储介质

未命名 08-03 阅读:118 评论:0


1.本发明涉及计算机作曲技术领域,特别涉及一种计算机作曲方法、系统、电子设备及存储介质。


背景技术:

2.当今社会对音乐的需求越来越多,但音乐创作本身,是只有具备专业知识才能进行的工作,而计算机作曲领域的出现,大大降低制作音乐的门槛,实现快速产出大量音乐以满足社会需求,因此计算机作曲成为当下人工智能研究中的热门方向之一。
3.现有的计算机作曲方法,考虑影响音乐质量因素过于单一,生成的音乐参差不齐且缺乏创新性。


技术实现要素:

4.本发明的目的是提供一种计算机作曲方法、系统、电子设备及存储介质,以解决现有的计算机作曲方法,考虑影响音乐质量因素过于单一,生成的音乐参差不齐且缺乏创新性的问题。
5.为实现上述目的,本发明提供了如下方案:
6.一种计算机作曲方法,包括:
7.获取不同种类的情绪音乐中的多维度特征,构建特征数据集;所述多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征;
8.基于乐理知识生成音乐约束条件;所述音乐约束条件包括:音高约束、音长约束和音强约束;
9.基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。
10.可选地,获取不同种类的情绪音乐中的多维度特征,构建特征数据集,具体包括:
11.根据与情绪相关的乐理规则将音乐数据库中的音乐划分为不同的种类的情绪音乐;
12.将不同种类的情绪音乐转换为声波图像,并提取所述声波图像中的声波特征;所述声波特征包括:梅尔频谱、短时傅里叶、谱质心和过零率;
13.采用n-gram统计方法统计不同种类的情绪音乐的音高数据,得到n-gram统计特征;
14.从乐理专业知识角度统计不同种类的情绪音乐的乐理参数特征;所述乐理参数特征包括:调式、节奏、速度、各音符占比、各音高占比、全音阶占比和音高范围;
15.基于所述声波特征、所述n-gram统计特征以及所述乐理参数特征构建特征数据集。
16.可选地,基于乐理知识生成音乐约束条件,具体包括:
17.统计音乐数据库中的音高数据,确定最大音高和最小音高;
18.基于所述最大音高和所述最小音高确定音高生成范围;所述音高约束为生成的音高不能超过所述音高生成范围;
19.以固定时间t为音乐小节;所述音长约束为生成的音乐的音长必须满足每n个音长的和为t,n的个数不限;
20.设定音强固定值;所述音强约束为生成的音乐的音强为设定的音强固定值。
21.可选地,基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐,具体包括:
22.以所述音乐约束条件生成所述进化算法的种群个体;所述种群个体表示生成的音乐;
23.在迭代过程中通过所述多特征数据集构建评价模型对生成的音乐进行评价,输出最优的生成音乐。
24.可选地,在迭代过程中通过所述多特征数据集构建评价模型对生成的音乐进行评价,输出最优的生成音乐,具体包括:
25.计算生成的音乐的声波特征与所述特征数据集中声波特征的相似度,得到第一相似度;并基于所述第一相似度计算第一评价结果;
26.统计生成的音乐中的音高数据,并根据统计结果和所述特征数据集中的n-gram统计特征计算第二评价结果;
27.基于所述特征数据集中的乐理参数特征确定乐理规则;
28.基于所述乐理规则对生成的音乐进行打分,得到第三评价结果;
29.基于所述第一评价结果、所述第二评价结果以及所述第三评价结果却动最优的生成音乐。
30.本发明还提供了一种计算机作曲系统,包括:
31.特征数据集构建模块,用于获取不同种类的情绪音乐中的多维度特征,构建特征数据集;所述多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征;
32.音乐约束条件生成模块,用于基于乐理知识生成音乐约束条件;所述音乐约束条件包括:音高约束、音长约束和音强约束;
33.最优音乐生成模块,用于基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。
34.本发明还提供了一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述的计算机作曲方法。
35.本发明还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述的计算机作曲方法。
36.根据本发明提供的具体实施例,本发明公开了以下技术效果:
37.本发明利用情绪音乐规则对音乐数据库中的音乐进行分类,并构建特征数据集。在生成音乐时给予与不同种类的情绪音乐相关的约束条件,并以特征数据集构建评价模型作为进化算法的适应度函数,对生成的音乐进行评价,得到最优的生成音乐。本发明解决了现有音乐生成方法由于数据来源过于单一,在生成音乐结果中存在一定技术局限性的问题。
附图说明
38.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
39.图1为本发明实施例一提供的计算机作曲方法的流程图;
40.图2为本发明实施例一提供的计算机作曲方法的原理图。
具体实施方式
41.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
42.本发明的目的是提供一种计算机作曲方法、系统、电子设备及存储介质,以解决现有的计算机作曲方法,考虑影响音乐质量因素过于单一,生成的音乐参差不齐且缺乏创新性的问题。
43.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
44.实施例一
45.本发明实施例一提供了一种计算机作曲方法,如图1-2所示,该方法包括以下步骤:
46.s1:获取不同种类的情绪音乐中的多维度特征,构建特征数据集;多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征。
47.进一步地,s1具体包括:
48.s11:获取原始音乐数据库。
49.s12:对选择的音乐数据库分类,通过已知的与情绪相关的乐理规则分类音乐数据库,将音乐数据库分为四类情绪:开心、愤怒、悲伤、平静。表1所示为具体的乐理规则,表2为不同情绪音乐在规则中的表现。
50.表1音乐情绪分类的具体规则
[0051][0052]
表2不同情绪音乐在规则中的表现
[0053][0054]
s13:将分类后的音乐与对应情绪相对应,组建为各自独立的情绪音乐数据库;
[0055]
s14:提取不同种类的情绪音乐的多维度特征构建成情绪音乐多特征数据集。多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征。
[0056]
进一步地,步骤s14具体包括:
[0057]
s141:提声波特征,步骤如下:
[0058]
将不同种类的情绪音乐转为声波图像表示,提取对应优选后的特征数据(梅尔频谱、短时傅里叶、谱质心和过零率),将不同特征纵向叠加为数据矩阵,对应为声波特征数据。具体特征及计算公式如表3所示:
[0059]
表3特征提取公式
[0060][0061]
f为音频信号频率,x(t)为输入信号,h(τ-t)为分析窗函数,τ为以时间t为中心的切片长度,e(n)为连续时域信号x(t)短时傅里叶变化后对应频率的谱能量,sgn(n)为符号函数,
[0062]
s142:提取n-gram统计特征,步骤如下:
[0063]
采用语言类模型n-gram的统计方法为基础,统计不同种类的情绪音乐的音高数据,得到n2、n3数据;其中n2为统计的相邻两个音高组合的概率数据,n3为相邻三个音高组合概率数据,最终统计出来的数据集为n-gram统计特征数据。
[0064]
n-gram统计模型表达式如下:
[0065][0066]
公式表示统计音符组合为n时的n-gram数据,p(wn,w
n+1
,...,wm)表示在一首音乐中w
n+1
,...,wm的音高组合出现次数在全部长度为m-n的音高组合中的占比,以n=2和n=3确定n2、n3。其具体含义为:n2为在统计的2音高组合中,以确定第一个音高值的前提下,第二音高为不同数值时对应的概率;n3为在统计的3音高组合中,已确定前两个音高值的前提下,第三音高为不同数值时对应的概率。以矩阵形式记录不同音符组合的占比情况,其中,纵向为已知音符,横向为最后一个音符。n2、n3组成对应数据矩阵作为n-gram统计特征数据。
[0067]
s143:设计乐理参数特征,步骤如下:
[0068]
从乐理专业知识角度,统计不同种类的情绪音乐的多项参数指标,包括的参数有调式、节奏、速度、各音符占比、各音高占比、全音阶占比、音高范围,最终得到乐理参数特征数据。
[0069]
s2:基于乐理知识生成音乐约束条件;音乐约束条件包括:音高约束、音长约束和音强约束。
[0070]
一首音乐需要具备三项基本要素为音高、音长、音强,在计算机作曲中,生成音乐时对这三项要素设置不同约束条件,进一步地,s2具体包括:
[0071]
s21:对音高,需要统计音乐数据库的音高数据,获得最大音高、最小音高、每一个音高对应数量,在最大、最小音高范围内生成音高,且在生成音高时,避免生成音乐数据库未出现音高。限制生成音乐个体的音高,在情绪音乐数据集的音高范围内随机生成。音高约束为生成的音高不能超过音高生成范围。
[0072]
s22:对音长,需要统计音乐数据库的音长数据,获得各音长占比,以各音长出现比例随机生成音长,同时,以固定时间t作为音乐的小节,音长约束为生成音长必须满足每n个音长和为t,其中,n的个数不限。
[0073]
s23:对音强,设置为一个不变的固定值;音强约束为生成的音乐的音强为设定的固定值。
[0074]
s3:基于音乐约束条件,以多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。进化算法可以但不限于遗传算法、nsga
‑ⅲ
算法、免疫算法等。
[0075]
以设计的音乐约束条件作为进化算法计算机作曲时种群个体生成,使用多特征数据集中的数据对应设计多特征评价方法评价音乐,以评价结果作为适应度函数输出,训练迭代模型最终得到优质音乐。
[0076]
进一步的,步骤s3具体包括:
[0077]
s31:以音高、音长、固定音强组成的完整音乐作为种群个体.
[0078]
s32:提取生成音乐个体与多特征数据集中声波特征一致的特征,对比两个特征数据的相似度,作为s
wave

[0079]
提取生成音乐的梅尔频谱、短时傅里叶、谱质心、过零率特征数据,与多特征数据集中的声波特征比较相似度,比较相似度的方法为pearson相关系数,公式为以此确实生成音乐与数据库音乐的相似度。公式中,η表示某一数据集,表示这一数据集的均值,γ表示另一不同数据集,表示另一数据集的均值,公式计算结果ρ表示数据集η与数据集γ之间的相关性。
[0080]
以公式s
wave
=∑ρi/m计算第一评价结果,其中,ρi为多个特征计算的相似度结果,m为特征数。
[0081]
s33:统计生成音乐的音高数据的n2、n3,其中,n2为连续两个音高组合,n3为连续三个音高组合。通过构建的公式s
n-gram
=∑n
2i
+∑n
3l
计算第二评价结果,其中,n
2i
为生成音乐的两音高组合对应多特征数据集的n-gram统计特征中统计出来的n2组合概率,n
3l
对应多特征数据集的、n-gram统计特征中统计出来的n3组合概率。
[0082]
s34:从乐理专业角度,利用公式s
rule
=∑s
ri
,选择多条乐理规则,每条规则都有不同的惩奖分值,对每个音乐个体进行规则评分,s
rule
为多条规则最终的得分和。
[0083]
设计能够评价音乐质量的乐理规则,对生成音乐的每一首音乐进行评价,具体评价规则如下表:
[0084]
表4乐理评价规则
[0085][0086]
音高跨度指的是连续两个音的音高跨度不超过一个八度;离调率指的是出现不符合大调或者小调规则的音符;平行五度、平行八度指的是连续三个音符中,音高同时向上或同时向下连续两次音跨度为五度或者八度;重复音符限制条件为一个音符音高重复次数不超过四次;全音阶比中的全音阶c、d、e、f、g、a、b,计算生成音高的全音阶占比后,与对应多特征数据集中乐理参数特征统计出的数据比较差异;音符独特性为统计生成音高中每小节不同音符的个数,对照参数为乐理参数特征中的参数。
[0087]
按权重设置乐理规则对生成音乐的打分情况,将最终得分srule作为第三评价结果。
[0088]
s35:在计算机作曲时将算法迭代过程作为多目标优化问题,以s
wave
、s
n-gram
、s
rule
作为三目标函数值,将在约束规则下生成种群的每一音乐个体都通过多指标评价后择优,保证最终计算机作曲方法的生成结果为优质音乐。
[0089]
实施例二
[0090]
针对实施例一提供的计算机作曲方法,本发明实施例二提供了一个具体的实施例,具体过程如下:
[0091]
步骤1、首先利用不同情绪音乐存在的差异性,通过乐理参数总结规则分类原始音乐数据库,原始音乐数据库包括1034首钢琴曲,将音乐库分为开心音乐库、愤怒音乐库、悲伤音乐库和平静音乐库这四类情绪音乐库。
[0092]
步骤2、分别提取四类情绪音乐库中每一首音乐的多项特征数据,特征包括声波特征、n-gram统计特征和乐理参数特征,作为能够代表不同情绪音乐库特点的数据集。
[0093]
步骤3、生成音乐时,设定限制条件,限制的条件包括音高范围、不同音长出现概率、音长分段结构,音乐每小节固定长度设为2048,音强统一设置为90。
[0094]
步骤4、将满足步骤3条件的音乐作为遗传算法初始音乐的输入,适应度函数选择构建评价模型,利用步骤2数据集作为基础参照数据构建三项评价指标,评价包括声波特征相似度、n-gram评价和规则评价三项,使三者融合的评价结果评判音乐优劣。
[0095]
步骤5、网络训练模块,以步骤4设置流程,利用构建好的评价模型优化生成音乐,设置迭代次数为500,最终得到较为稳定评价结果且质量好的音乐。
[0096]
实施例三
[0097]
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供了一种计算机作曲系统。
[0098]
该系统包括:
[0099]
特征数据集构建模块,用于获取不同种类的情绪音乐中的多维度特征,构建特征数据集;多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征。
[0100]
音乐约束条件生成模块,用于基于乐理知识生成音乐约束条件;音乐约束条件包括:音高约束、音长约束和音强约束。
[0101]
最优音乐生成模块,用于基于音乐约束条件,以多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。
[0102]
实施例四
[0103]
本发明实施例四提供一种电子设备,包括存储器及处理器,该存储器用于存储计算机程序,该处理器运行计算机程序以使电子设备执行实施例一提供的计算机作曲方法。
[0104]
实施例五
[0105]
基于实施例四的描述,本发明实施例五提供一种存储介质,其上存储有计算机程序,计算机程序可被处理器执行以实现实施例一的计算机作曲方法。
[0106]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0107]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种计算机作曲方法,其特征在于,包括:获取不同种类的情绪音乐中的多维度特征,构建特征数据集;所述多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征;基于乐理知识生成音乐约束条件;所述音乐约束条件包括:音高约束、音长约束和音强约束;基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。2.根据权利要求1所述的计算机作曲方法,其特征在于,获取不同种类的情绪音乐中的多维度特征,构建特征数据集,具体包括:根据与情绪相关的乐理规则将音乐数据库中的音乐划分为不同的种类的情绪音乐;将不同种类的情绪音乐转换为声波图像,并提取所述声波图像中的声波特征;所述声波特征包括:梅尔频谱、短时傅里叶、谱质心和过零率;采用n-gram统计方法统计不同种类的情绪音乐的音高数据,得到n-gram统计特征;从乐理专业知识角度统计不同种类的情绪音乐的乐理参数特征;所述乐理参数特征包括:调式、节奏、速度、各音符占比、各音高占比、全音阶占比和音高范围;基于所述声波特征、所述n-gram统计特征以及所述乐理参数特征构建特征数据集。3.根据权利要求1所述的计算机作曲方法,其特征在于,基于乐理知识生成音乐约束条件,具体包括:统计音乐数据库中的音高数据,确定最大音高和最小音高;基于所述最大音高和所述最小音高确定音高生成范围;所述音高约束为生成的音高不能超过所述音高生成范围;以固定时间t为音乐小节;所述音长约束为生成的音乐的音长必须满足每n个音长的和为t,n的个数不限;设定音强固定值;所述音强约束为生成的音乐的音强为设定的音强固定值。4.根据权利要求1所述的计算机作曲方法,其特征在于,基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐,具体包括:以所述音乐约束条件生成所述进化算法的种群个体;所述种群个体表示生成的音乐;在迭代过程中通过所述多特征数据集构建评价模型对生成的音乐进行评价,输出最优的生成音乐。5.根据权利要求4所述的计算机作曲方法,其特征在于,在迭代过程中通过所述多特征数据集构建评价模型对生成的音乐进行评价,输出最优的生成音乐,具体包括:计算生成的音乐的声波特征与所述特征数据集中声波特征的相似度,得到第一相似度;并基于所述第一相似度计算第一评价结果;统计生成的音乐中的音高数据,并根据统计结果和所述特征数据集中的n-gram统计特征计算第二评价结果;基于所述特征数据集中的乐理参数特征确定乐理规则;基于所述乐理规则对生成的音乐进行打分,得到第三评价结果;基于所述第一评价结果、所述第二评价结果以及所述第三评价结果却动最优的生成音
乐。6.一种计算机作曲系统,其特征在于,包括:特征数据集构建模块,用于获取不同种类的情绪音乐中的多维度特征,构建特征数据集;所述多维度特征包括:声波特征、n-gram统计特征以及乐理参数特征;音乐约束条件生成模块,用于基于乐理知识生成音乐约束条件;所述音乐约束条件包括:音高约束、音长约束和音强约束;最优音乐生成模块,用于基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。7.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1-5中任一项所述的计算机作曲方法。8.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的计算机作曲方法。

技术总结
本发明公开了一种计算机作曲方法、系统、电子设备及存储介质,涉及计算机作曲领域,该方法包括:获取不同种类的情绪音乐中的多维度特征,构建特征数据集;所述多维度特征包括:声波特征、N-gram统计特征以及乐理参数特征;基于乐理知识生成音乐约束条件;所述音乐约束条件包括:音高约束、音长约束和音强约束;基于所述音乐约束条件,以所述多特征数据集构建评价模型作为进化算法的适应度函数进行计算机作曲乐,得到最优的生成音乐。本发明解决了现有音乐生成方法由于数据来源过于单一,在生成音乐结果中存在一定技术局限性的问题。乐结果中存在一定技术局限性的问题。乐结果中存在一定技术局限性的问题。


技术研发人员:江乐旗 赵忆玮 陈昊 黎明 揭丽琳 黎政秀 李军华
受保护的技术使用者:南昌航空大学
技术研发日:2023.05.23
技术公布日:2023/8/2
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐