妊娠期糖尿病患者个性化营养方案推荐方法及系统与流程

未命名 07-15 阅读:107 评论:0


1.本公开涉及智能分析技术领域,尤其涉及一种妊娠期糖尿病患者个性化营养方案推荐方法及系统。


背景技术:

[0002][0003]
传统的糖尿病饮食推荐算法面对越来越多的患者数据而无法精确地在患者身体指标与推荐的食物之间的关系进行匹配,一方面是用户项目数据的稀疏性问题,另一方面是冷启动问题,由于一些新物品以往从未有用户与其进行交互,导致推荐算法无法对其进行推荐,进而使得用户无法探索大量的全新物品。


技术实现要素:

[0004]
本公开实施例提供一种妊娠期糖尿病患者个性化营养方案推荐方法及系统,能够至少解决现有技术中的部分问题,也即无法精确地在患者身体指标与推荐的食物之间的关系进行匹配。
[0005]
本公开实施例的第一方面,
[0006]
提供一种妊娠期糖尿病患者个性化营养方案推荐方法,包括:
[0007]
获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;
[0008]
抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;
[0009]
将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息。
[0010]
在一种可选的实施方式中,
[0011]
所述基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:
[0012]
基于所述病情画像信息结合预设营养食谱,确定所述预设营养食谱中所述妊娠期糖尿病患者的可食用食谱;
[0013]
基于所述饮食偏好信息,确定所述可食用食谱中所包含的饮食偏好因子,并根据所述饮食偏好因子设定偏好权重系数;
[0014]
结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。
[0015]
在一种可选的实施方式中,
[0016]
所述结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:
[0017][0018][0019]
其中,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度,m、n分别表示所述妊娠期糖尿病患者的数量和可食用食谱的数量,s
ij
表示所述妊娠期糖尿病患者i对可食用食谱j的饮食偏好因子,表示所述饮食偏好因子对应的偏好权重系数,w
con
(j)表示可食用食谱集合,r
mn
表示所述评分矩阵,r
mn
表示所述妊娠期糖尿病患者m对可食用食谱n的评分。
[0020]
在一种可选的实施方式中,
[0021]
所述构建妊娠期糖尿病对应的营养知识图谱包括:
[0022]
基于预先训练好的知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息,其中,所述知识抽取模型基于多个神经网络模型构建,用于抽取输入所述知识抽取模型的输入信息的实体信息和关系信息;
[0023]
基于所抽取的实体信息和关系信息通过预先训练好的知识融合模型进行知识融合,确定所述实体信息和所述关系信息对应的知识三元组,其中,所述知识融合模型基于分类模型构建,用于对所述实体信息和所述关系信息进行分类;
[0024]
将所述知识三元组作为图节点,不同知识三元组之间的关系作为连接边,构建所述营养知识图谱。
[0025]
在一种可选的实施方式中,
[0026]
所述知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息之前,所述方法还包括训练所述知识抽取模型:
[0027]
分别建立以词性为特征的第一特征模板以及以上下文窗口为特征的第二特征模板,并按照所述第一特征模板构建第一训练语料、和按照所述第二特征模板构建第二训练语料;
[0028]
用所述第一训练语料和所述第二训练语料分别训练待训练的知识抽取模型,确定所述第一训练语料对应的第一训练知识抽取模型,以及所述第二训练语料对应的第二训练知识抽取模型,并分别用所述第一训练知识抽取模型和所述第二训练知识抽取模型对预先获取的未标注语料集进行标注预测,并确定所述第一训练知识抽取模型标注预测结果对应的第一标注预测可信度以及所述第二训练知识抽取模型标注预测结果对应的第二标注预测可信度;
[0029]
迭代执行如下操作直至达到预设迭代阈值:
[0030]
若所述第一标注预测可信度高于第一预设标注阈值,则将高于所述第一预设标注阈值对应的第一训练语料加入所述第二训练语料中;或者
[0031]
若所述第二标注预测可信度高于第二预设标注阈值,则将高于所述第二预设标注阈值对应的第二训练语料加入所述第一训练语料中。
[0032]
在一种可选的实施方式中,
[0033]
在通过预先训练好的知识融合模型进行知识融合之前,所述方法还包括训练所述知识融合模型:
[0034]
将随机生成的多个初始负例三元组以及多个初始正例三元组通过预设评分函数确定所述多个初始负例三元组中每个头实体的对应的第一负例评分、以及每个尾实体对应的第二负例评分、所述多个初始正例三元组中每个头实体对应的第三负例评分、以及每个尾实体对应的第四负例评分;
[0035]
根据所述第一负例评分、所述第二负例评分、所述第三负例评分以及所述第四负例评分,通过预设分类函数为所述多个初始负例三元组分配第一概率分布值以及为所述多个初始正例三元组分配第二概率分布值;
[0036]
基于所述多个初始负例三元组以及所述第一概率分布值,所述多个初始正例三元组以及所述第二概率分布值,通过反向传播优化算法迭代优化待训练的知识融合模型的损失函数,直至达到迭代次数或者满足预设收敛条件。
[0037]
在一种可选的实施方式中,
[0038]
所述将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度包括:
[0039]
所述确定不同营养知识图谱的图谱相似度如下公式所示:
[0040][0041]
其中,sim2(j)表示所述图谱相似度,d、h分别表示直接关系数和间接关系数,r表示间接关系对应的权重系数,fj、f
average
分别表示妊娠期糖尿病患者对营养知识图谱j的评分向量集合、妊娠期糖尿病患者对所有营养知识图谱的平均评分的向量集合;
[0042]
融合所述图谱相似度以及所述食谱兴趣度如下公式所示:
[0043][0044]
其中,gr表示推荐值评分,a(j)表示所有营养知识图谱中两个图谱交集的集合,time(j)、hot(j)分别表示时效性权值和热度权值,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。
[0045]
本公开实施例的第二方面,
[0046]
提供一种妊娠期糖尿病患者个性化营养方案推荐系统,包括:
[0047]
第一单元,用于获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;
[0048]
第二单元,用于抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿
病对应的营养知识图谱;
[0049]
第三单元,用于将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息。
[0050]
本公开实施例的第三方面,
[0051]
提供一种妊娠期糖尿病患者个性化营养方案推荐设备,包括:
[0052]
处理器;
[0053]
用于存储处理器可执行指令的存储器;
[0054]
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
[0055]
本公开实施例的第四方面,
[0056]
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
[0057]
本公开的妊娠期糖尿病患者个性化营养方案推荐方法,
[0058]
除了考虑妊娠期糖尿病中糖尿病本身影响的情况下,还综合考虑妊娠期的影响;在实际应用中,通过设置饮食偏好因子对应的偏好权重系数,能够进一步提高饮食偏好因子在最后食谱兴趣度中的占比,使得所推荐的食谱不仅满足妊娠期糖尿病患者的健康需求,还是符合妊娠期糖尿病患者的饮食习惯的,充分获取用户信息,精准确定用户的实时信息需求和偏好,全面满足用户需求;
[0059]
本技术在训练过程中仅需要少量己标注语料进行初次训练,通过迭代训练加入可信度高的语料扩充训练集,能够大大减少在标注语料环节消耗的人力和物力。此外,因为构建的两个特征集相互之间是独立的,两个在独立特征集上训练得到的模型也可以说是相互独立的。在训练过程中,两个模型把标注过的可靠性高的结果交换至对方,在交换各自可信度高的标注语料的过程中,也是在学习各自识别特征的过程,因此两个模型的识别性能都会随着迭代而提高,最终融合两个模型的参数完成对模型的训练,提高模型识别的精准度;
[0060]
本技术通过将实体或关系投影到低维度的空间中,可以有效利用实体之间的语义信息,并且可以利用高频实体的语义信息来帮助低频实体表示,通过对关系在头尾实体的每个维度都进行建模,实体和关系的信息可以有效交互;通过设置对角矩阵函数,使得头尾实体只在一个维度上发生交互作用,能够有效降低过拟合现象;并且结合复数表示函数,将实体和关系的表示拓展到复数领域,能够有效表示非对称关系。
附图说明
[0061]
图1为本公开实施例妊娠期糖尿病患者个性化营养方案推荐方法的流程示意图;
[0062]
图2为本公开实施例食物子类别的示意图;
[0063]
图3为本公开实施例营养素类别的示意图;
[0064]
图4为本公开实施例妊娠期糖尿病患者个性化营养方案推荐系统的结构示意图。
具体实施方式
[0065]
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术
人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0066]
下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
[0067]
图1为本公开实施例妊娠期糖尿病患者个性化营养方案推荐方法的流程示意图,如图1所示,所述方法包括:
[0068]
s101. 获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;
[0069]
示例性地,妊娠期糖尿病属于糖尿病患者中较为特殊的一个时期,不同类型的糖尿病患者的用户需求具有明显的区别,妊娠期糖尿病除了需要考虑糖尿病本身影响的情况下,还需要综合考虑妊娠期的影响;在实际应用中,由于获取的用户信息不够全面丰富,分析技术不完善等因素影响,难以精准确定用户的实时信息需求和偏好,因此也难以全面满足用户需求。
[0070]
示例性地,病情画像信息可以包括糖尿病患者类型、血糖值、血脂值等,还可以包括饮食特征点和运动特征点等。从多源异构数据中提取出糖尿病患者的各个不同的病理特征点(如糖尿病患者类型特征点、血糖值特征点、血脂值特征点)、各个不同的饮食特征点 (粥特征点、包子特征点、馒头特征点) 和各个不同的运动特征点(跑步特征点、慢走特征点)等。
[0071]
病情画像是要描述用户病情方面的特征,是实现信息推荐的前提。本技术通过用户基本特征、面向用户需求的饮食信息以及用户交互信息,构建用户病情画像信息。
[0072]
其中,用户基本特征可以包括用户id、性别、年龄、及病情史等; 面向用户需求的饮食信息可以包括针对用户病情或者身体状态所能食用的饮食信息;用户交互信息可以包括用户在社交软件平台中信息发布、阅读、收藏、参与互动等行为信息等。需要说明的是,构建用户病情画像信息可以参考现有方法,本技术实施例对此并不进行限定。
[0073]
示例性地,妊娠期糖尿病患者的饮食偏好信息可以包括从第三方平台,例如外卖平台所获取的用户的标签信息,可选地,若用户在外卖平台中所选外卖类型均为偏辣、偏油类型,则可以从外卖平台中获取用户对应的标签,将其作为妊娠期糖尿病患者的饮食偏好信息。
[0074]
在一种可选的实施方式中,
[0075]
所述基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:
[0076]
基于所述病情画像信息结合预设营养食谱,确定所述预设营养食谱中所述妊娠期糖尿病患者的可食用食谱;
[0077]
基于所述饮食偏好信息,确定所述可食用食谱中所包含的饮食偏好因子,并根据所述饮食偏好因子设定偏好权重系数;
[0078]
结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。
[0079]
示例性地,预设营养食谱包括多种类型的食谱,可用于不同类型的用户,结合病情
画像从预设营养食谱中筛选出妊娠期糖尿病患者的可食用食谱,例如完全母乳喂养阶段,每日摄入热量增加400-500kcal、每日最少摄入175克碳水化合物、每日额外补充400ug叶酸、补充fe、ca制剂或适合孕期的微营养素复合制剂等,在可食用食谱的基础上进一步筛选出妊娠期糖尿病患者感兴趣的食谱;
[0080]
在饮食偏好信息中可以包括多种饮食偏好因子,具体地,饮食偏好因子可以包括辛辣、偏甜、面食、流食、油炸等口味信息,若食谱中包含饮食偏好因子,则表示用户偏向于对食谱更为感兴趣;
[0081]
此外,还可以结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,具体地,评分矩阵可以如下公式所示:
[0082][0083]
其中,r
mn
表示所述评分矩阵,r
mn
表示所述妊娠期糖尿病患者m对可食用食谱n的评分。
[0084]
在一种可选的实施方式中,
[0085]
所述结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:
[0086][0087][0088]
其中,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度,m、n分别表示所述妊娠期糖尿病患者的数量和可食用食谱的数量,s
ij
表示所述妊娠期糖尿病患者i对可食用食谱j的饮食偏好因子,表示所述饮食偏好因子对应的偏好权重系数,w
con
(j)表示可食用食谱集合,r
mn
表示所述评分矩阵,r
mn
表示所述妊娠期糖尿病患者m对可食用食谱n的评分。
[0089]
其中,通过设置饮食偏好因子对应的偏好权重系数,能够进一步提高饮食偏好因子在最后食谱兴趣度中的占比,使得所推荐的食谱不仅满足妊娠期糖尿病患者的健康需求,还是符合妊娠期糖尿病患者的饮食习惯的,有利于提高用户体验。
[0090]
s102. 抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;
[0091]
示例性地,知识图谱可以很好地描述客观世界中的实体和关系,弥补了机器学习算法和深度学习算法描述能力弱的问题。在知识图谱中,现实世界中的客观的事物称为实体,例如物体、人物、机构等,两个实体之间的关联称为关系,例如学生和学校之间的关系。实体和关系以三元组<头实体,关系,尾实体》的方式保存在知识图谱中。知识图谱通过将
海量数据中的信息转化为结构化的三元组,使得自身在很好地描述数据的同时又可以有效地存储和使用数据。
[0092]
随着生活水平的提高、社会的不断进步和发展,人们发现饮食对身体健康起着十分重要的作用。糖尿病前期患者可以通过干预饮食和运动等生活方式来长期降低糖尿病的发生率。在饮食中最重要的就是营养元素的均衡,不同身体状况的人适宜或不适宜的营养元素成分含量不同。营养学医生在诊断时,可以根据自身学得的营养学相关知识和经验对不同患者提供不同的饮食或运动的建议,虽然营养学专家可以给出每日摄入营养成分的相关建议,但是对于大多数人来说,每个人的身体状况都是在不断地发生变化的,特别是对于妊娠期糖尿病患者而言,经常去寻求营养学专家的建议是比较麻烦的。因此将营养学专业书籍中的知识标注出来以及将互联网中存在的大量营养学、饮食、族病相关的数据提取出来构建营养学领域的知识图谱,以此来为用户提供及时准确的饮食建议是非常有必要的。
[0093]
在一种可选的实施方式中,
[0094]
所述构建妊娠期糖尿病对应的营养知识图谱包括:
[0095]
基于预先训练好的知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息,其中,所述知识抽取模型基于多个神经网络模型构建,用于抽取输入所述知识抽取模型的输入信息的实体信息和关系信息;
[0096]
基于所抽取的实体信息和关系信息通过预先训练好的知识融合模型进行知识融合,确定所述实体信息和所述关系信息对应的知识三元组,其中,所述知识融合模型基于分类模型构建,用于对所述实体信息和所述关系信息进行分类;
[0097]
将所述知识三元组作为图节点,不同知识三元组之间的关系作为连接边,构建所述营养知识图谱。
[0098]
示例性地,在知识图谱的构建过程中最核心环节是知识抽取和知识融合,其中,知识融合又分为实体信息融合与关系信息融合。结构化数据是经过规范化处理的数据,在知识抽取时只需要根据本身的特性就很容易识别其中的知识。而半结构化、非结构化数据由于载体不同以及编码格式不统一导致规范性差于结构化数据,所以要根据各自的特性,专门进行知识抽取。
[0099]
实体抽取也称作命名实体识别,实体抽取的准确性直接影响知识抽取的质量和效率,因此,实体抽取是知识图谱构建和知识抽取的基础和关键。
[0100]
进一步地,通过在结构化、半结构化和非结构化语料文本中抽取了实体信息与关系信息,但抽取出的这些知识的问题如下:一方面,半结构化或非结构化语料文本存在信息冗余;另一方面,数据之间相互独立,没有明显上下层结构的语义关系,使得在半结构化或非结构化的语料文本中抽取的知识是不能直接使用的,需要通过知识融合对抽取的知识进行整理。
[0101]
在一种可选的实施方式中,
[0102]
基于预先训练好的知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息,其中,所述知识抽取模型基于多个神经网络模型构建,用于抽取输入所述知识抽取模型的输入信息的实体信息和关系信息;
[0103]
在所述知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息之前,所述方法还包括训练所述知识抽取模型:
[0104]
分别建立以词性为特征的第一特征模板以及以上下文窗口为特征的第二特征模板,并按照所述第一特征模板构建第一训练语料、和按照所述第二特征模板构建第二训练语料;
[0105]
用所述第一训练语料和所述第二训练语料分别训练待训练的知识抽取模型,确定所述第一训练语料对应的第一训练知识抽取模型,以及所述第二训练语料对应的第二训练知识抽取模型,并分别用所述第一训练知识抽取模型和所述第二训练知识抽取模型对预先获取的未标注语料集进行标注预测,并确定所述第一训练知识抽取模型标注预测结果对应的第一标注预测可信度以及所述第二训练知识抽取模型标注预测结果对应的第二标注预测可信度;
[0106]
迭代执行如下操作直至达到预设迭代阈值:
[0107]
若所述第一标注预测可信度高于第一预设标注阈值,则将高于所述第一预设标注阈值对应的第一训练语料加入所述第二训练语料中;或者
[0108]
若所述第二标注预测可信度高于第二预设标注阈值,则将高于所述第二预设标注阈值对应的第二训练语料加入所述第一训练语料中。
[0109]
示例性地,可以根据序列标注任务场景,制定特征集并从中选择两个独立的特征,建立对应的特征模版,本技术中将词性和上下文窗口作为特征建立了对应的第一特征模板和第二特征模板,将采集的文本语料分别按照两套特征模板的格式整理成训练语料,也即第一特征模板对应的第一训练语料和第二特征模板对应的第二训练语料。
[0110]
将大量未标注的语料输入初次训练得到的模型,进行标注预测,并对预测结果评价可信度;最后,将预测结果中可信度高的标注语料加入到对方的训练语料中,用扩充后的新语料集继续训练模型。这个过程重复送代,直到触发约定条件后停止训练。
[0111]
本技术在训练过程中仅需要少量己标注语料进行初次训练,通过迭代训练加入可信度高的语料扩充训练集,能够大大减少在标注语料环节消耗的人力和物力。此外,因为构建的两个特征集相互之间是独立的,两个在独立特征集上训练得到的模型也可以说是相互独立的。在训练过程中,两个模型把标注过的可靠性高的结果交换至对方,在交换各自可信度高的标注语料的过程中,也是在学习各自识别特征的过程,因此两个模型的识别性能都会随着迭代而提高,最终融合两个模型的参数完成对模型的训练,提高模型识别的精准度。
[0112]
在一种可选的实施方式中,
[0113]
在通过预先训练好的知识融合模型进行知识融合之前,所述方法还包括训练所述知识融合模型:
[0114]
对所抽取的所述实体信息和所述关系信息进行知识打分,将所述知识打分超过预设分数阈值的实体信息和所述关系信息构建为知识融合训练集,所述对所抽取的实体信息和所述关系信息进行知识打分包括:
[0115][0116]
其中,s
h,r,t
表示实体信息和关系信息的知识分数,n表示所有训练三元组的数量,nr表示关系信息r在训练三元组中的数量,n
h,r
表示头实体h和关系r在训练三元组中共同出现的数量,nh表示头实体h在训练三元组中的数量,n
r,t
表示关系r和尾实体t在训练三元组
中共同出现的数量;
[0117]
通过预先训练好的知识融合模型中的分类函数对所述知识融合训练集的实体信息和关系信息进行分类,确定实体信息和关系信息的空间距离,将空间距离小于预设距离阈值的信息作为同一类别,构建知识三元组。
[0118]
示例性地,对所抽取的不同数据源的营养知识分别进行实体定义可以根据知识库中现有的实体类型及关系并结合对专业书籍和网站中数据的分析,在营养学专家的指导下,围绕营养、医疗和人群三个方面,把营养学实体分为八大类,包括食物、菜肴、营养素、疾病、症状、器官、功能和人群。图2为本公开实施例食物子类别的示意图,参考《中国食物成分表》中对食物的分类,可以将食物类别细分为谷类、薯类淀粉、干豆类、油脂类等16个子类,同时,图3为本公开实施例营养素类别的示意图,还可以将营养素类别分为碳水化合物、脂类、蛋白质等7个子类。
[0119]
对所抽取的不同数据源的营养知识分别进行关系定义可以包括:禁忌食用、适宜食用、副作用中至少一种;
[0120]
其中,禁忌食用关系包括:“治疗-食物”、“人群-食物”、“疾病-食物〞、“症状食物”等,指因人体处于某种特别状态导致自身不能或不适宜食用某些食物,如果食用不确定会出现异常反应,但是会有潜在的不良反应危险,为将来的饮食推荐生成食谱提供安全性保障。
[0121]
其中,适宜食用关系包括:“疾病-食物”、“症状-食物”、“人群-食物“,指当人体处于特定状态下时,食用某种食物有益于改善当前状态,或对健康有益。其存在意义为让饮食推荐系统在生成食谱时,能够考虑更多的影响因素,得到更加个性化的食谱推荐。
[0122]
其中,副作用关系包括:“治疗-痪病〞、“治疗-症状〞,指病人在接受某种治疗或服用某种药物时,除达到预期的治疗效果外,还会出现的负面的疾病或症状,通过这些关系,为将来的饮食推荐提供发掘更多食物与疾病、症状及治疗关系的可能。
[0123]
通过相关技术和方法在结构化、半结构化和非结构化语料文本中抽取了实体与实体关系,但抽取出的这些知识的问题如下:一方面,半结构化或非结构化语料文本存在信息冗余:另一方面,数据之间相互独立,没有明显上下层结构的语义关系,使得在半结构化或非结构化的语料文本中抽取的知识是不能直接使用的,需要通过知识融合对抽取的知识进行整理。
[0124]
在一种可选的实施方式中,
[0125]
在通过预先训练好的知识融合模型进行知识融合之前,所述方法还包括训练所述知识融合模型:
[0126]
将随机生成的多个初始负例三元组以及多个初始正例三元组通过预设评分函数确定所述多个初始负例三元组中每个头实体的对应的第一负例评分、以及每个尾实体对应的第二负例评分、所述多个初始正例三元组中每个头实体对应的第三负例评分、以及每个尾实体对应的第四负例评分;
[0127]
根据所述第一负例评分、所述第二负例评分、所述第三负例评分以及所述第四负例评分,通过预设分类函数为所述多个初始负例三元组分配第一概率分布值以及为所述多个初始正例三元组分配第二概率分布值;
[0128]
基于所述多个初始负例三元组以及所述第一概率分布值,所述多个初始正例三元
组以及所述第二概率分布值,通过反向传播优化算法迭代优化待训练的知识融合模型的损失函数,直至达到迭代次数或者满足预设收敛条件。
[0129]
在构建知识图谱之前,所述方法还包括:进行知识图谱链路预测,用于填充不完整三元组;
[0130]
知识图谱链路预测的目的在于填充不完整的三元组,链路预测任务主要考察三元组作为一个整体,其实体与关系间的联系,
[0131]
根据所述头实体的向量表示、所述尾实体的向量表示,以及预设的复数表示函数、对角矩阵函数以及所述头实体、所述尾实体与实体关系的矩阵表示,确定所述头实体、所述尾实体与实体关系的语义表示;
[0132][0133]
其中,fr(h,t)表示头实体h、尾实体t与实体关系r的语义表示,d表示头实体和尾实体的向量数量,re{}表示复数表示函数,diag表示对角矩阵函数,表示第i个头实体和第j个尾实体的实体关系r对应的矩阵表示,表示第i个头实体的向量表示,表示第j个尾实体的向量表示;
[0134]
通过将实体或关系投影到低维度的空间中,我们可以有效利用实体之间的语义信息,并且可以利用高频实体的语义信息来帮助低频实体表示。通过对关系在头尾实体的每个维度都进行建模,每个关系r都有o(d2)个维度的参数,实体和关系的信息可以有效交互;同时为了避免随着关系矩阵维度的增加,模型会更加复杂,很容易出现过拟合的现象,通过设置对角矩阵函数,使得头尾实体只在一个维度上发生交互作用,能够有效降低过拟合现象;并且结合复数表示函数,将实体和关系的表示拓展到复数领域,能够有效表示非对称关系。
[0135]
s103、将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息。
[0136]
在一种可选的实施方式中,
[0137]
所述将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度包括:
[0138]
所述确定不同营养知识图谱的图谱相似度如下公式所示:
[0139][0140]
其中,sim2(j)表示所述图谱相似度,d、h分别表示直接关系数和间接关系数,r表示间接关系对应的权重系数,fj、f
average
分别表示妊娠期糖尿病患者对营养知识图谱j的评分向量集合、妊娠期糖尿病患者对所有营养知识图谱的平均评分的向量集合;
[0141]
融合所述图谱相似度以及所述食谱兴趣度如下公式所示:
[0142][0143]
其中,gr表示推荐值评分,a(j)表示所有营养知识图谱中两个图谱交集的集合,time(j)、hot(j)分别表示时效性权值和热度权值,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。
[0144]
可选地,可以将本文基于计算出的推荐值评分进行排序,最终选取前k个推荐值评分对应的食谱形成推荐列表。
[0145]
示例性地,对任意一条待推荐信息,其被推荐与否既受其与当前信息内容相似度的影响,也与其是否具备吸引用户阅读的特点相关,因此需要综合考虑这两类因素进行推荐度总权值的计算。其中,时效性权值和热度权值可以用于指示内容推荐过程中信息的时效性和热度,能够进一步提高信息推荐的准确度。此外,直接关系和间接关系能够用于指示信息之间的远近程度,其中,直接关系表示两个信息之间关联较近,间接关系表示两个信息之间关联较远,通过为间接关系分配对应的权重值,能够进一步加强两个信息之间的关联。
[0146]
本技术通过将知识图谱中食谱向量化表示,计算食谱间语义相似度,并与基于用户行为的相似度进行融合,计算出最终的食谱相似度,进而生成推荐列表,达到结合外部评分和内部信息的效果,能够弥补现有推荐算法忽略食谱自身内部信息的缺陷,缓解了推荐过程中遇到的数据稀疏性问题和冷启动问题,提高了推荐的准确率与合理性。
[0147]
本公开实施例的第二方面,
[0148]
提供一种妊娠期糖尿病患者个性化营养方案推荐系统,图4为本公开实施例妊娠期糖尿病患者个性化营养方案推荐系统的结构示意图,包括:
[0149]
第一单元,用于获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;
[0150]
第二单元,用于抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;
[0151]
第三单元,用于将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息。
[0152]
本公开实施例的第三方面,
[0153]
提供一种妊娠期糖尿病患者个性化营养方案推荐设备,包括:
[0154]
处理器;
[0155]
用于存储处理器可执行指令的存储器;
[0156]
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
[0157]
本公开实施例的第四方面,
[0158]
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
[0159]
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
[0160]
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

技术特征:
1.一种妊娠期糖尿病患者个性化营养方案推荐方法,其特征在于,包括:获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息;所述构建妊娠期糖尿病对应的营养知识图谱包括:基于预先训练好的知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息,其中,所述知识抽取模型基于多个神经网络模型构建,用于抽取输入所述知识抽取模型的输入信息的实体信息和关系信息;基于所抽取的实体信息和关系信息通过预先训练好的知识融合模型进行知识融合,确定所述实体信息和所述关系信息对应的知识三元组,其中,所述知识融合模型基于分类模型构建,用于对所述实体信息和所述关系信息进行分类;将所述知识三元组作为图节点,不同知识三元组之间的关系作为连接边,构建所述营养知识图谱;在所述知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息之前,所述方法还包括训练所述知识抽取模型:分别建立以词性为特征的第一特征模板以及以上下文窗口为特征的第二特征模板,并按照所述第一特征模板构建第一训练语料、和按照所述第二特征模板构建第二训练语料;用所述第一训练语料和所述第二训练语料分别训练待训练的知识抽取模型,确定所述第一训练语料对应的第一训练知识抽取模型,以及所述第二训练语料对应的第二训练知识抽取模型,并分别用所述第一训练知识抽取模型和所述第二训练知识抽取模型对预先获取的未标注语料集进行标注预测,并确定所述第一训练知识抽取模型标注预测结果对应的第一标注预测可信度以及所述第二训练知识抽取模型标注预测结果对应的第二标注预测可信度;迭代执行如下操作直至达到预设迭代阈值:若所述第一标注预测可信度高于第一预设标注阈值,则将高于所述第一预设标注阈值对应的第一训练语料加入所述第二训练语料中;或者若所述第二标注预测可信度高于第二预设标注阈值,则将高于所述第二预设标注阈值对应的第二训练语料加入所述第一训练语料中。2.根据权利要求1所述的方法,其特征在于,所述基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:基于所述病情画像信息结合预设营养食谱,确定所述预设营养食谱中所述妊娠期糖尿病患者的可食用食谱;基于所述饮食偏好信息,确定所述可食用食谱中所包含的饮食偏好因子,并根据所述饮食偏好因子设定偏好权重系数;
结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。3.根据权利要求2所述的方法,其特征在于,所述结合所述妊娠期糖尿病患者的历史评分信息,构建评分矩阵,根据所述评分矩阵、所述饮食偏好因子以及所述偏好权重系数,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度包括:,,其中,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度,m、n分别表示所述妊娠期糖尿病患者的数量和可食用食谱的数量,s
ij
表示所述妊娠期糖尿病患者i对可食用食谱j的饮食偏好因子,表示所述饮食偏好因子对应的偏好权重系数,w
con
(j)表示可食用食谱集合,r
mn
表示所述评分矩阵,r
mn
表示所述妊娠期糖尿病患者m对可食用食谱n的评分,述第二预设标注阈值对应的第二训练语料加入所述第一训练语料中。4.根据权利要求1所述的方法,其特征在于,在通过预先训练好的知识融合模型进行知识融合之前,所述方法还包括训练所述知识融合模型:将随机生成的多个初始负例三元组以及多个初始正例三元组通过预设评分函数确定所述多个初始负例三元组中每个头实体的对应的第一负例评分、以及每个尾实体对应的第二负例评分、所述多个初始正例三元组中每个头实体对应的第三负例评分、以及每个尾实体对应的第四负例评分;根据所述第一负例评分、所述第二负例评分、所述第三负例评分以及所述第四负例评分,通过预设分类函数为所述多个初始负例三元组分配第一概率分布值以及为所述多个初始正例三元组分配第二概率分布值;基于所述多个初始负例三元组以及所述第一概率分布值,所述多个初始正例三元组以及所述第二概率分布值,通过反向传播优化算法迭代优化待训练的知识融合模型的损失函数,直至达到迭代次数或者满足预设收敛条件。5.根据权利要求1所述的方法,其特征在于,所述将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度包括:所述确定不同营养知识图谱的图谱相似度如下公式所示:,其中,sim2(j)表示所述图谱相似度,d、h分别表示直接关系数和间接关系数,r表示间接关系对应的权重系数,f
j
、f
average
分别表示妊娠期糖尿病患者对营养知识图谱j的评分向量
集合、妊娠期糖尿病患者对所有营养知识图谱的平均评分的向量集合;融合所述图谱相似度以及所述食谱兴趣度如下公式所示:,其中,g
r
表示推荐值评分,a(j)表示所有营养知识图谱中两个图谱交集的集合,time(j)、hot(j)分别表示时效性权值和热度权值,ins(i,j)表示所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度。6.一种妊娠期糖尿病患者个性化营养方案推荐系统,其特征在于,包括:第一单元,用于获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;第二单元,用于抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;第三单元,用于将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息;所述第二单元还用于:基于预先训练好的知识抽取模型从不同数据源的营养知识中抽取实体信息和关系信息,其中,所述知识抽取模型基于多个神经网络模型构建,用于抽取输入所述知识抽取模型的输入信息的实体信息和关系信息;基于所抽取的实体信息和关系信息通过预先训练好的知识融合模型进行知识融合,确定所述实体信息和所述关系信息对应的知识三元组,其中,所述知识融合模型基于分类模型构建,用于对所述实体信息和所述关系信息进行分类;将所述知识三元组作为图节点,不同知识三元组之间的关系作为连接边,构建所述营养知识图谱;所述第二单元还用于训练所述知识抽取模型:分别建立以词性为特征的第一特征模板以及以上下文窗口为特征的第二特征模板,并按照所述第一特征模板构建第一训练语料、和按照所述第二特征模板构建第二训练语料;用所述第一训练语料和所述第二训练语料分别训练待训练的知识抽取模型,确定所述第一训练语料对应的第一训练知识抽取模型,以及所述第二训练语料对应的第二训练知识抽取模型,并分别用所述第一训练知识抽取模型和所述第二训练知识抽取模型对预先获取的未标注语料集进行标注预测,并确定所述第一训练知识抽取模型标注预测结果对应的第一标注预测可信度以及所述第二训练知识抽取模型标注预测结果对应的第二标注预测可信度;迭代执行如下操作直至达到预设迭代阈值:若所述第一标注预测可信度高于第一预设标注阈值,则将高于所述第一预设标注阈值对应的第一训练语料加入所述第二训练语料中;或者若所述第二标注预测可信度高于第二预设标注阈值,则将高于所述第二预设标注阈值对应的第二训练语料加入所述第一训练语料中。
7.一种妊娠期糖尿病患者个性化营养方案推荐设备,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至5中任意一项所述的方法。8.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。

技术总结
本公开提供一种妊娠期糖尿病患者个性化营养方案推荐方法及系统,包括获取妊娠期糖尿病患者的病情画像信息,以及所述妊娠期糖尿病患者的饮食偏好信息,基于所述病情画像信息和所述饮食偏好信息,确定所述妊娠期糖尿病患者对预设营养食谱的食谱兴趣度;抽取与所述妊娠期糖尿病患者所对应的营养领域中不同数据源的营养知识,对所述营养知识进行实体对齐后融合不同数据源的营养知识,构建妊娠期糖尿病对应的营养知识图谱;将所述营养知识图谱进行向量化表示,确定不同营养知识图谱的图谱相似度,融合所述图谱相似度以及所述食谱兴趣度,生成食谱推荐信息。本公开的方法能够准确地进行个性化营养方案推荐。行个性化营养方案推荐。行个性化营养方案推荐。


技术研发人员:李利明 贺志晶
受保护的技术使用者:北京四海汇智科技有限公司
技术研发日:2023.06.07
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐