一种字母数字串听读相似度的定量评估方法与流程

未命名 08-15 阅读：123 评论：0

1.本发明属于计算机技术中的模式识别领域，涉及一种字母数字串听读相似度的定量评估方法。

背景技术：

2.字母数字串是26个英文字母(不区分大小写)和10个数字(0到9)组成的字符串，在生产和生活中的应用很广泛，如航班号、火车车次号、汽车车牌号、身份证号、房间号等。
3.朗读者逐字符读出一个字母数字串(以下简称串)，听者听出这个串的过程为听读过程。在生活和工作中有很多听读过程。如在空中交通管制中，管制员呼叫航班号，并对该航班发布指令；飞行员接受并执行管制员的指令，就是一个听读过程，其中管制员呼叫的航班号就是一个字母数字串，发布的指令中也包括很多的字母数字串(如高度、速度、方向等)。
4.字母数字串的听读中，朗读者可能会将一个串误读成与之相似的其他串；就算读得无误，听者也可能会误听成另外一个串。误读、误听会给生活和工作带来不便、失误甚至重大失误。比如在上述空中交通管制的例子中，如果飞行员将管制员呼叫的其他航班号误听为自己的航班号，并按管制员的指令执行，将会严重危及飞行安全。字母数字串听读相似是造成误读、误听的主要原因。如果事先将相似的串找出来，就可以提醒朗读者、听者注意，采取相应措施，如多读几遍，与听者核对，改变读法，或者用不容易误读误听的串代替等。
5.实际上字母数字串听读相似也有不同的程度，有时候非常相似，有时候只是有一点相似。程度不同，我们采取的措施也会不同，所以我们需要定量表示听读相似度，并找出一种对字母数字串听读相似度进行定量评估的方法。

技术实现要素：

6.本发明的目的是提供一种字母数字串(以下简称串)听读相似度的定量评估方法，具体内容如下：
7.内容1，字母数字串相似度的定量。下面从串误读误听的概率出发，给出字母数字串相似度的定义。
8.内容1.1，听读正确和错误。在朗读端，将一个串s1呈现给朗读者，由其按字符逐个读出；听端的听者按听到的内容呈现出一个串s2。如果s1和s2相同，则称听读正确；如果s2没有呈现出来，或者虽然呈现出来了，但和s1不同，则称听读错误。“呈现”方式由具体应用决定，可以呈现在朗读者、听者的脑海里，可以写在纸上，也可以用其他有意义的方式。
9.s1呈现出来了，s2未呈现，称为漏听，算一次听读错误。s1未呈现，s2呈现，称为幻听，不是一个完整的听读过程，既非听读正确，也非听读错误，不统计在听读总数中。
10.内容1.2，听读正确和错误的概率。在特定应用场景，在朗读者和听者不特定的情况下，在s1呈现n次时，s2呈现且和s1相同的次数为m次，则听读正确的概率p1＝m/n，听读错误的概率p2＝(n-m)/n。显然有p1+p2＝1。
11.内容1.3，串集。在特定场景下，有可能作为s1呈现出来的所有串构成的集合，称串集，设为s。显然有s1∈s。再假定s2∈s(含义是，如果听者听到的串不在串集中，可直接判断有错，不算一次听读过程，所以可假定s2∈s)。
12.内容1.4，听读配对概率。对特定的s1、s2，s1在朗读端呈现r次时，听端呈现s2的次数为t次，则s1、s2的原始听读配对概率p0(s1，s2)＝t/r。
13.s1、s2的听读配对概率p(s1，s2)为p0(s1，s2)和p0(s2，s1)中的最小值。显然有p(s1，s2)＝p(s2，s1)。
14.s中所有满足s1≠s2(s1∈s，s2∈s)的p(s1，s2)(即：将s1错听为s2的概率)值中的最小值设为e1，最大值设为e2。
15.对所有s1(s1∈s)，所有p(s1，s1)(即：s1正确听读的概率)值中的最小值称为c1。
16.e1、e2、c1都可以视为s本身的参数。
17.内容1.5，串集评估。
18.对s，如果e2≥c1，则称s为不合格串集；否则为合格串集。在合格串集中，如果c1-e2(已有e2《c1)的值(如10)很小，则称s为不良串集。
19.不合格串集意味着，在串集中至少有一个串，将其误听成另一个不同的特定串的概率很大，甚至大过将某个特定串听对的概率。这种串集本身就是听读错误的温床，是不应该使用的。
20.不良串集意味着，在串集中至少有一个串，将其误听成另一个不同的特定串的概率很大，接近所有串听对概率中的最小值。这种串集中有些串对的听读相似度比较高，应予改良。
21.本发明中，如不特别说明，串集都指合格串集。
22.串集评估的意义在于，通过串集的设计，尽量降低串的听读相似度。对不合格串集、不良串集，可采取措施予以改良，如剔除部分串、改变字母数字的读法等。
23.内容1.6，字母数字串听读相似度(简称串相似度)的定义。设s为合格串集，s1∈s，s2∈s，s1、s2的听读相似度x(s1，s2)的定义如下：
24.(1)0≤x≤100；
25.(2)s1≠s2，且p(s1，s2)≤e1时，x＝0；
26.(3)s1＝s2时，x＝100；
27.(4)对s1≠s2，s3≠s4，如p(s1，s2)《p(s3，s4),要求x(s1，s2)《x(s3，s4)。当p(s1，s2)＝p(s3，s4),不要求x(s1，s2)＝x(s3，s4)。
28.内容2，音符听读相似度评估。
29.字符是组成串的单元。根据字符朗读所用时间的长短不同，一个字符可分解成1到3个音符，具体分解方法随应用场合的不同而不同，表1是分解的一个例子。如：8分解成一个音符8，f分解成2个音符f1和f2，x分解成3个音符x1、x2、x3。字符的听读相似度按分解成的音符进行评估。
30.可以将一个音符看成串(单个音符的串)。串由音符组成，因此音符听读相似度(简称音符相似度)是在所有音符组成的集合(设其元素数为sn)上定义的字母数字串相似度。
31.音符相似度是评估串相似度的基础。根据上述定义可知，其取值在0到100之间，如果两个音符相同，相似度是100；如果不同，其相似度是0到100(不含)的值。
32.音符相似度评估有多种方法，可用语音分析方法，也可用统计分析方法，或者直接使用经验值。但最后都可以用一个sn*sn的二维数组(音符相似度表)表示相似度。
33.内容3，字母数字串相似度计算。
34.设a、b是某个合格串集上的两个串。其中：
35.a由m个音符组成(m是a的长度)，依次为a1、a2、
……
、am，其中m》0。
36.b由n个音符组成(n是b的长度)，依次为b1、b2、
……
、bn,其中n》0。
37.a、b的串综合长度(定义及计算方法见内容3.3)如果不同，a的应小于b的；如相同，在字典顺序中，a排在b的前面。如不满足上述条件，将a、b互换即可。
38.a、b的听读相似度(以下称串相似度)r＝qa1b+qa2b+
……
+qaib+
……
+qamb。其中，qaib(1≤i≤m)是ai、b的字符对串加权相似度。计算出a的每个字符ai对串b整体的字符对串加权相似度qaib，相加即可得a、b的听读相似度r。下面说明qaib的计算方法。
39.内容3.1，音符综合间距的计算。
40.串中的每个音符，都有一个音符综合间距与之对应。设音符为c，其音符综合间距为pp。
41.根据c计算pp的算法有两种。
42.音符综合间距算法一：c是某个字符的唯一音符时，pp＝1；c是某个多音符字符的第1个音符时，pp＝0.5；c是某个多音符字符的第2个音符时，pp＝1；c是某个多音符字符的第3个音符时，pp＝0.5。
43.音符综合间距算法二：c是某个字符的唯一音符时，pp＝1；c是某个多音符字符的第1个音符时，pp＝0.25；c是某个多音符字符的第2个音符时，pp＝1；c是某个多音符字符的第3个音符时，pp＝0.25。
44.内容3.2，音符综合位置的计算。
45.串由音符组成。每个音符都对应一个在串中的综合位置(设为p)。下面以a为例，说明音符综合位置的计算方法。
46.第1个音符对应的p＝0。
47.如某个音符(假定为ai)的综合位置为p，则其下个音符的综合位置为p+pp。pp为ai的音符综合间距，采用算法一或算法二。
48.内容3.3，串综合长度的计算。
49.串综合长度为串中所有音符的音符综合间距之和。音符综合间距的计算采用算法一。
50.内容3.4，长度因子l的计算。
51.l＝l1/l2。用于qaib的计算，反映串的长度差异对相似度的影响。其中，l1是a的串综合长度；l2是b的串综合长度。
52.一对串中两个串自身的综合长度和两个综合长度的差值，是影响串相似度的重要因素，此因素用长度因子l表达。如果两个串综合长度相等，综合长度在区分串上的作用为0，这时综合长度因素对相似度的贡献达到最高，l＝1。如果两个串自身综合长度都较大，且综合长度差较小，在区分串上的作用也较小，l接近1；随着综合长度差的增大，两个串越来越容易区分，综合长度因子逐渐减小。如果两个串综合长度较小，综合长度差在区分串上的作用较明显，l就比较小。上述公式很好地体现了长度因子的作用。
53.内容3.5，a中各音符位置权重qi的计算。
54.a中有1到m共m个音符位置，用q1、q2、
……
、qi、
……
、qm表示各位置在相似度中的权重。音符位置不同，对相似度的影响也不同。越靠前，听者对其越敏感，对区分串的意义越大，特别是第一个音符，对区分串的作用最大；随着位置逐渐靠后，听者对其敏感度下降，对相似度的影响降低，且不同位置对相似度影响的差异越来越小。此特点用倒数函数描述。
55.设权重总和为1(100％)，则有q1+q2+
……
+qi+
……
+qm＝1。
56.计算时，先使i从1开始到m，依次计算qi的临时值，为qi＝1/(p+3)，其中p为音符ai的音符综合位置。计算音符综合位置时，音符综合间距采用算法一。
58.接下来再对q1到qm的值求和(结果为t)，再令qi＝qi/t,求出的就是qi的最终值。
59.内容3.6，音符(ai)对串(b)的加权相似度qaib的计算。
60.ai分别和b中的音符b1、b2、
……
、bj、
……
、bn配对，求出ai、bj(1≤j≤n)的综合相似度yij(yi1、yi2、
……
、yij、
……
、yin)；再以yij(1≤j≤n)为依据，计算ai、b音符对串原始相似度aib；最后aib乘以长度因子l、ai的位置权重qi，得到qaib，即qaib＝aib*l*qi。分三步详述如下：
61.内容3.6.1,音符ai对音符bj的综合相似度yij的计算
62.先给出计算公式：yij＝(1-2/(pi*pi+pi+5))^|pi-pj|)*rij。(公式
①
)
63.其中1-2/(pi*pi+pi+5))^|pi-pj|代表了位置与相似度的关系，也称为位置相似度；rij称为字符相似度，与位置无关，根据ai和bj的具体值，从内容2所述的二维数组中查出即可。
64.上式中，pi为ai在a中的音符综合位置，pj为bj在b中的音符综合位置。计算音符综合位置时，音符综合间距的计算采用算法二。
65.内容3.6.2,ai、b音符对串原始相似度aib的计算。
66.求出yij(1≤j≤n)的总和t和最大值w。
67.aib＝w+((t-w)/n)*(100-w)/100。(公式
②
)。
68.其中w为yij(1≤j≤n)中的最大值。根据经验可知，对aib贡献最大的就是w；其他值对aib也有贡献，体现在((t-w)/n)*(100-w)/100中。
69.公式
②
中，(t-w)/n是yij去除w后的算术平均值，但以100-w/100的权计入aib。如果w为100，则公式
②
为0，保证了aib不超过1，因为根据定义，相似度的值不可能超过100％。如果w＝0，一定有aib＝0。
70.aib的最终结果，不会小于w，也不会大于100。
71.内容3.6.3,qaib的计算。
72.如前所述：qaib＝qi*l*aib。
73.本发明的有益效果：
74.一，通过对使用场景的分析，系统提出了字母数字串(简称串)听读相似度的问题。一方面与单词拼写相似度、字符识别相似度等问题进行了明确区分；另一方面将字符听读相似度，字符位置等因素纳入了关注范围，使本发明提出的方法更具实用性。
75.二，将串听读相似度建立在了字符听读相似度的基础之上，而不是简单地对字符进行相同或不同的判断，反映了实际上大量存在的字符不同，但读音相同或相近的情况。
76.三，充分分析了影响串听读相似度的要素及其规律。即：(1)串的长度及长度差值
对听读相似度的影响是反比关系；(2)除了字符相同会使串更相似外，字符相近也会对串的相似度有影响，其规律为正比关系；(3)相同或相似字符所处位置对串相似度有重大影响，越靠近前面的，或者相同或相近字符在位置上越靠近的，对相似度影响越大，位置对相似度的影响是指数规律。
77.四，根据影响串听读相似度的要素及其规律，在对大量实例进行分析的基础上，提出了详细的计算方法和相应的经验公式，确定了经验值。
附图说明
78.图1为本发明一种字母数字串听读相似度的定量评估方法的字母数字串相似度计算流程图，描述了计算两个字母数字串(设为a、b)听读相似度的过程和有关公式。
79.图2为本发明一种字母数字串听读相似度的定量评估方法的字母数字相似度表，给出了字母数字(10个数字26个字母共36个字符)分解为音符，以及音符两两之间听读相似度的一种具体取值。
80.图3为本发明一种字母数字串听读相似度的定量评估方法的字母数字串相似度计算过程示例表，通过4个例子，描述了串相似度的计算过程。
81.图4为本发明一种字母数字串听读相似度的定量评估方法的字母数字串相似度计算结果示例表，给出了用本发明的方法计算出来的若干串对的相似度，显示了计算方法的有效性和合理性。
具体实施方式
82.下面结合附图、附表，通过一些实例，说明本发明的具体实施方式。所述实施方式是发明内容如何实施、应用的说明，不意味着对它的任何限制。
83.步骤1，确定串集。
84.根据具体应用确定串集，并对其进行评估。评估方法是用本发明计算典型串对的相似度，根据这些串对的相似度评估串集；在有统计数据支持的情况下，也可以直接用本发明内容1.5的概率法进行评估。如评估结果为不合格或不良串集，可通过以下方法改良：
85.(1)尽量减少串集中串的数量；
86.(2)避免过短的串，特别是单字符串；
87.(3)改变字符的读法。如00读成百，000读成千，0000读成万，d读成dog等；
88.(4)其他方法。
89.本实施方案以长度为1到8的所有字母数字串为串集。这是一个不良串集，但适合说明本发明的具体实施方式。
90.步骤2，制作字母数字串相似度表。
91.根据所用语言、使用环境等因素将字符分解为音符，制作字母数字串相似度表。可采用的方法有：(1)音标和拼音分析，对英文字母，通过音标分析；对汉字，通过声母、韵母、音调进行分析。(2)声波分析，采集朗读字符的声波，通过对声波的分析分解字符、评估音符相似度。(3)概率统计，统计大量字符听读的结果，计算听对、听错的概率，据此确定音符相似度。(4)经验值，根据经验直接评估，将字符分解为音符，填写音符相似度。
92.本实施方案中，数字以汉语普通话发音为准，字母以标准发音为准，兼顾方言和习
惯影响，给出了字符分解为音符的一种方法，以及音符相似度的经验值，参见表1。
93.步骤3，软件设计。
94.根据本发明内容设计相关软件，用于计算串相似度。根据需要，可单独设计软件，也可嵌入其他系统。
95.本次实施设计了一个简单的软件，字符相似度表采用表1。在界面中输入两个串，直接算出相似度。
96.步骤4，计算。
97.下面结合表2和图1，通过一个例子说明计算过程。
98.表2中第1列为每个例子的基本情况，包括串对、长度因子、最终计算出来的相似度等。本表共有4个列子。
99.第2列为行号，每个例子分别编行号。
100.第3列为a中每个音符的权重值qi。
101.第4列为a中的音符，每个音符占一行。
102.第5列为a中的音符对b的音符对串的加权相似度qaib。
103.第6列为a中的音符对b的音符对串的原始相似度aib。
104.此后各列为b的音符，每个音符占一列，标记了音符列号。列号各例子统一编，在表格第一行。
105.以表2中的第4个例子，计算串a(5674)和串b(8sx)为例说明计算过程。串a每个音符一行，分别为5、6、7、4，行号分别为1、2、3、4；串b每个音符一列，分别为8、s1、s2、x1、x2、x3，列号分别为1、2、3、4、5。
106.步骤4.1，串对的合法性。
107.步骤4.1.1，a、b均在规定串集中。
108.步骤4.1.2，a的综合长度(4)小于b的综合长度(4.5)，排序合法。
109.步骤4.2，算出长度因子l＝4/4.5＝88.89％。
110.步骤4.3，计算a各位权重q1、q2、q3、q4。
111.q1：q2：q3：q4＝1/(1+3):1/(2+3):1/(3+3):1/(4+3)＝0.25:0.2:0.16:0.14。
112.t＝q1+q2+q3+q4＝0.25+0.2+0.16+0.14＝0.75。
113.q2＝(1/5)/0.75＝26。同理：q3＝21；q4＝18。q1＝100-26-21-18＝35。
114.计算中因误差舍去的值都加在q1上，保证q1+q2+q3+q4＝100。
115.表中的权重按百分数表示。
116.步骤4.4，设a、b的相似度为r，令r的初值为0，分别计算5(a1)、6(a2)、7(a3)、4(a4)对b的qaib，累加起来就得r。
117.步骤4.4.1，计算5对b的qaib
118.步骤4.4.1.1，计算5对8(b1)的yij值y11。参见内容3.6.1。
119.用公式
①
计算，其中i＝1,j＝1,rij即r11是5和8的字符相似度，为0。
120.计算结果y11＝100*0＝0，在第1个字符列(对应字符8)表示。字符列又细分为两列。第1列表示y11的第一个因子，即位置相似度，本处为100；第2列表示音符相似度，即音符5和8的相似度，本处为0。两列的数字均以百分数表示。
121.步骤4.4.1.2，计算5对s1(b2)的yij值y12。
122.用公式
①
计算，其中i＝1,j＝2,rij即r12＝0。
123.y12＝60*0＝0。
124.步骤4.4.1.3，继续计算5对x1,5对x2,5对x3的yij值。计算过程同上，计算结果见表2。
125.步骤4.4.1.3，计算aib
126.对第1行各列的值，求出总数t＝0，最大值w＝0。
127.用公式
②
计算出aib＝0。
128.qaib即qa1b＝q1*l*aib＝35*88.89％*0＝0；
129.至此r＝r+qa1b＝0+0＝0。
130.步骤4.4.2，计算6对b的qaib。
131.具体过程见表2第4例第2行，参考步骤4.4.1。
132.qa2b＝0。
133.至此r＝r+qa2b＝0+0＝0。
134.步骤4.4.3，计算7对b的qaib。
135.具体过程见表2第4例第3行，参考步骤4.4.1。
136.qa3b＝0。
137.至此r＝r+qa3b＝0+0＝0。
138.步骤4.4.4，计算4对b的qaib。
139.具体过程见表2第4例第3行，参考步骤4.4.1。
140.qa4b＝14.31。
141.至此r＝r+qa4b＝0+14.31＝14.31。
142.5674和8sx的相似度是14.31。
143.可参考其他例子理解上述过程。
144.步骤5，典型串相似度对照。
145.选择多对典型串，以步骤4的方法计算其相似度，列于表3。
146.表3中，对每对串，对相似度进行了人工定性评估，分为不相似、相似、相同三种情况。
147.表3中，还可以根据相似度计算结果，对相似度进行定性评估。相似度数值和相似度定性评估对应关系如下：
148.[0,80)不相似；
[0149]
[80,100):相似；
[0150]
[100,100]:相同。
[0151]
各串对的相似度计算数值和人工评估的结果一致，说明了计算方法的有效性和合理性。
[0152]
虽然本发明已以较佳实施例公开如上，但其并非用以限定本发明，任何熟悉此技术的人，在不脱离本发明的精神和范围内，都可做各种的改动与修饰，因此本发明的保护范围应该以权利要求书所界定的为准。

技术特征：
1.一种字母数字串听读相似度的定量评估方法，其特征在于：在串集和听读配对概率的基础上，以定量方式定义了字母数字串(简称串)的听读相似度，给出了串相似度的计算公式。字母数字串中的字母数字根据朗读所用时长分解为为1到3个音符。2.根据权利要求1所述的一种字母数字串听读相似度的定量评估方法，其特征在于：对所述串集的评估，属于串集s的两个串s1和s2，当在朗读端呈现s1时，听端呈现s2的概率为p0(s1，s2)；p0(s1，s2)和p0(s2，s1)中的最小值为听读配对概率p(s1，s2)；在s中，所有满足s1≠s2的p(s1，s2)值中的最小值设为e1，最大值设为e2；对所有s1，所有p(s1，s1)值中的最小值设为c1；对s，如果e2≥c1，则s为不合格串集；否则为合格串集。在合格串集中，虽有e2<c1，但如果c1-e2的值(如10)很小，则称s为不良串集。3.根据权利要求1所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述以定量方式定义字母数字串的听读相似度，设s为合格串集，s1∈s，s2∈s，s1、s2的听读相似度x(s1，s2)的定义为：(1)0≤x≤100；(2)s1≠s2，且p(s1，s2)≤e1时，x＝0；(3)s1＝s2时，x＝100；(4)对s1≠s2，s3≠s4，如p(s1，s2)<p(s3，s4),则x(s1，s2)<x(s3，s4)；当p(s1，s2)＝p(s3，s4)时,不要求x(s1，s2)＝x(s3，s4)。4.根据权利要求1所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述字母数字分解为音符，每个音符都有一个音符综合间距与之对应；设音符为c，其音符综合间距为pp；根据c计算pp的算法有两种。算法一：c是某个字符的唯一音符时，pp＝1；c是某个多音符字符的第1个音符时，pp＝0.5；c是某个多音符字符的第2个音符时，pp＝1；c是某个多音符字符的第3个音符时，pp＝0.5。算法二：c是某个字符的唯一音符时，pp＝1；c是某个多音符字符的第1个音符时，pp＝0.25；c是某个多音符字符的第2个音符时，pp＝1；c是某个多音符字符的第3个音符时，pp＝0.25。5.根据权利要求1所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述串相似度的计算公式，对合格串集上的两个串a、b，若a由m个音符ac1、ac2、
……
、acm(m>0)组成，b由n个音符bc1、bc2、
……
、bcn(n>0)组成，其中m、n分别称为a、b的长度，l1、l2分别为a、b的综合长度；综合长度不同时，a的小于b的；综合长度相同时，在字典顺序中，a排在b的前面(如不是，a、b互换即可)；a、b的听读相似度r＝qa1b+qa2b+
……
+qaib+
……
+qamb(1≤i≤m)；其中，qaib＝qi*l*aib，qi是a中各字符位置的权重，l是长度因子。6.根据权利要求5所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述长度因子l及串综合长度l1、l2，其特征在于，l＝l1/l2；其中，l1是a的串综合长度；l2是b的串综合长度；串综合长度为串中所有音符的音符综合间距之和；音符综合间距的计算采用算法一。7.根据权利要求5所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述qi为q1、q2、
……
、qi、
……
、qm，所述q1、q2、
……
、qi、
……
、qm之和为1，且qi＝1/(p+3)；其中，p为音符ai的音符综合位置，此处音符综合位置的计算方法为：第1个音符对应的p＝0，如某个音符(假定为ai)的综合位置为p，则其下个音符的综合位置为p+pp，pp为ai的音符综合间距，采用算法一。8.根据权利要求5所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所
述aib,首先计算出a中音符ai和b中各音符bj的综合相似度yi1、yi2、
……
、yij、
……
、yin，再求出其和t和最大值w，最后算出aib，公式为：aib＝w+((t-w)/n)*(100-w)/100。9.根据权利要求8所述的一种字母数字串听读相似度的定量评估方法，其特征在于：所述ai和bj的综合相似度yij，yij＝(1-2/(pi*pi+pi+5))^|pi-pj|)*rij，其中rij是音符ai和音符bj的相似度，pi为ai在a中的音符综合位置，pj为bj在b中的音符综合位置，此处音符综合位置的计算方法为：第1个音符对应的p＝0，如某个音符(假定为ai)的综合位置为p，则其下个音符的综合位置为p+pp，pp为ai的音符综合间距，采用算法二。

技术总结
朗读者读出一个字母数字串(简称串)，听者可能误听其为另一个串，原因是两个串有听读相似性。本发明提出了一种定量计算听读相似性(简称相似度)的方法。相似度值在0(很不相似)到100(两个串完全相同)之间。两个串越相似，相似度越大。串中的字符根据朗读所用时长，分解为1到3个音符。串相似度与音符的听读相似度(与串相似度的定义相同，可通过语音分析获取其值，或直接取经验值)有关。两个串中的音符两两配对(音符对)，音符本身的相似度，音符在串中的位置都对串的相似度有影响。音符越靠前、在两个串中的位置越接近，对串相似度的影响越大。相似度还与两个串的长度差有关，差值越大越不相似。本发明综合上述因素给出了计算公式。式。式。

技术研发人员：高妍赵丹妮黄坤岭
受保护的技术使用者：高妍
技术研发日：2023.02.15
技术公布日：2023/8/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

一种字母数字串听读相似度的定量评估方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种字母数字串听读相似度的定量评估方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表