数据处理方法、装置、增强实现设备及存储介质与流程
未命名
09-15
阅读:109
评论:0
1.本技术涉及增强现实技术领域,具体而言,涉及一种数据处理方法、装置、增强实现设备及存储介质。
背景技术:
2.游泳运动是男女老少都喜欢的体育项目之一,可以改善心血管系统、增强抵抗力、健美形体,是一项非常方便健康的有氧运动。在开始学习游泳的时候,都是由教练亲自教学,然后学员根据教练的游泳动作进行学习,但是这种方式,学员无法准确掌握教练的关键动作的准确度,因此,如何能够使得学员更加准确地了解教练的关键动作,提高学习的准确性,是目前急需解决的问题。
技术实现要素:
3.本技术的一些实施例的目的在于提供一种数据处理方法、装置、增强实现设备及存储介质,通过本技术的实施例的技术方案,通过第一增强现实设备采集多媒体数据;根据预先训练的姿势识别模型,对所述多媒体数据进行识别,得到所述多媒体数据中的第一身体姿势信息,其中,所述第一身体姿势信息至少包括身体关键点位置和角度信息,所述姿势识别模型是通过对神经网络模型进行训练得到的;将所述第一身体姿势信息发送至第二增强现实设备,以使所述第二增强现实设备显示所述第一身体姿势信息中的关键点信息和角度信息,本技术实施例中通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
4.第一方面,本技术的一些实施例提供了一种数据处理方法,包括:
5.通过第一增强现实设备采集多媒体数据;
6.根据预先训练的姿势识别模型,对所述多媒体数据进行识别,得到所述多媒体数据中的第一身体姿势信息,其中,所述第一身体姿势信息至少包括身体关键点位置和角度信息,所述姿势识别模型是通过对神经网络模型进行训练得到的;
7.将所述第一身体姿势信息发送至第二增强现实设备,以使所述第二增强现实设备显示所述第一身体姿势信息中的关键点信息和角度信息。
8.本技术的一些实施例通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
9.在一些实施例,所述姿势识别模型通过如下方式获得:
10.获取样本图像;
11.对所述样本图像进行预处理,得到处理后的图像,其中,所述预处理至少包括剪裁、缩放或归一化;
12.将所述处理后的图像输入到初始神经网络中,进行前向传播计算,得到前向检测结果;
13.根据所述前向检测结果,计算损失函数;
14.若所述损失函数的值小于预设值,则将与所述损失函数对应的初始神经网络确定为所述姿势识别模型;
15.基于所述姿势识别模型,根据所述前向检测结果和非极大值抑制算法,确定关键点位置信息;
16.根据所述关键点位置信息和关键点之间的连接关系,确定所述样本图像中的人体姿态图像;
17.根据所述人体姿态图像中的关键点和连接关系,计算关键点的方向和角度信息。
18.本技术的一些实施例通过预先训练的姿势识别模型,识别多媒体数据中的身体姿势信息,其中,该姿势识别模型是通过对神经网络模型进行训练得到的,在获取到教练的多媒体数据后,识别该多媒体数据中的第一身体姿势信息,提高识别的准确性。
19.在一些实施例,所述方法还包括:
20.采用视频编辑软件,将示范的多媒体数据中的示范动作,剪辑成一个或多个视频片段;
21.对所述视频片段进行分辨率调整,得到调整后的视频片段;
22.将所述调整后的视频片段输入到3d建模软件中,生成3d模型;
23.对所述3d模型进行优化,得到优化后的3d模型;
24.将所述优化后的3d模型渲染成示教数据,并将所述示教数据发送至所述第二增强现实设备。
25.本技术的一些实施例,通过将多媒体数据转换成3d模型,并对该3d模型进行优化和渲染处理后,得到示教数据,并发送至第二增强现实设备,这样,用户就可以通过第二增强现实设备查看示教数据,3d模型的显示更加清楚。
26.在一些实施例,所述方法还包括:
27.接收第二增强现实设备采集的环境图像,所述环境图像至少包括水下景观和潜水器材;
28.采集计算机视觉技术,对所述环境图像中的水下景观进行识别和分析,得到识别结果;
29.采用机器学习算法对所述环境图像中的潜水器材进行判断和分类,得到分类结果;
30.根据所述识别结果和所述分类结果,生成场景模型;
31.将所述场景模型和所述示教数据进行融合,得到融合场景数据;
32.将所述融合场景数据发送至所述第二增强现实设备。
33.本技术的一些实施例,通过采用增强现实技术,将教练的示范动作与学员的实际潜水环境相融合,增强学员的沉浸感和参与度。
34.在一些实施例,所述方法还包括:
35.接收第二增强现实设备的学员的第二身体姿势信息;
36.将所述第一身体姿势信息与所述第二身体姿势信息进行比较;
37.若所述第一身体姿势信息和所述第二身体姿势信息的误差大于预设值,则通过所述第二增强现实设备显示指导信息。
38.本技术的一些实施例通过通过比较学员的姿势和教练示范的姿势,可以分析出差异和改进点,提供更准确、详细的示范和指导。
39.在一些实施例,所述方法还包括:
40.根据所述第一身体姿势信息和所述第二身体姿势信息的比较结果,采用评估指标和评分系统,对学员姿势进行打分和评价。
41.本技术的一些实施例通过将教练的第一身体姿势信息和学员的第二身体姿势信息进行比较,根据比较的而结果,对学员的姿势进行评估和反馈。可以评估指标和评分系统,对学员的姿势进行打分和评价,以便更好地指导学员进行改进。
42.在一些实施例,所述方法还包括:
43.通过所述第一增强现实设备接收用户输入语音指令,所述语音指令用于指导学员调整身体姿势或呼吸方法;
44.将所述语音指令转换成文本控制指令,并将所述文本控制指令发送至所述第二增强现实设备。
45.本技术的一些实施例通过在增强现实设备上集成语音识别和语音合成技术,可以通过语音交互的方式为学员提供指导信息。
46.第二方面,本技术的一些实施例提供了一种数据处理方法装置,包括:
47.采集模块,用于通过第一增强现实设备采集多媒体数据;
48.识别模块,用于根据预先训练的姿势识别模型,对所述多媒体数据进行识别,得到所述多媒体数据中的第一身体姿势信息,其中,所述第一身体姿势信息至少包括身体关键点位置和角度信息,所述姿势识别模型是通过对神经网络模型进行训练得到的;
49.发送模块,用于将所述第一身体姿势信息发送至第二增强现实设备,以使所述第二增强现实设备显示所述第一身体姿势信息中的关键点信息和角度信息。
50.本技术的一些实施例通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
51.在一些实施例,所述装置还包括模型建立模块,所述模型建立模块用于:
52.获取样本图像;
53.对所述样本图像进行预处理,得到处理后的图像,其中,所述预处理至少包括剪裁、缩放或归一化;
54.将所述处理后的图像输入到初始神经网络中,进行前向传播计算,得到前向检测结果;
55.根据所述前向检测结果,计算损失函数;
56.若所述损失函数的值小于预设值,则将与所述损失函数对应的初始神经网络确定为所述姿势识别模型;
57.基于所述姿势识别模型,根据所述前向检测结果和非极大值抑制算法,确定关键点位置信息;
58.根据所述关键点位置信息和关键点之间的连接关系,确定所述样本图像中的人体姿态图像;
59.根据所述人体姿态图像中的关键点和连接关系,计算关键点的方向和角度信息。
60.本技术的一些实施例通过预先训练的姿势识别模型,识别多媒体数据中的身体姿势信息,其中,该姿势识别模型是通过对神经网络模型进行训练得到的,在获取到教练的多媒体数据后,识别该多媒体数据中的第一身体姿势信息,提高识别的准确性。
61.在一些实施例,所述识别模块还用于:
62.采用视频编辑软件,将示范的多媒体数据中的示范动作,剪辑成一个或多个视频片段;
63.对所述视频片段进行分辨率调整,得到调整后的视频片段;
64.将所述调整后的视频片段输入到3d建模软件中,生成3d模型;
65.对所述3d模型进行优化,得到优化后的3d模型;
66.将所述优化后的3d模型渲染成示教数据,并将所述示教数据发送至所述第二增强现实设备。
67.本技术的一些实施例,通过将多媒体数据转换成3d模型,并对该3d模型进行优化和渲染处理后,得到示教数据,并发送至第二增强现实设备,这样,用户就可以通过第二增强现实设备查看示教数据,3d模型的显示更加清楚。
68.在一些实施例,所述装置还包括融合模块,所述融合模块用于:
69.接收第二增强现实设备采集的环境图像,所述环境图像至少包括水下景观和潜水器材;
70.采集计算机视觉技术,对所述环境图像中的水下景观进行识别和分析,得到识别结果;
71.采用机器学习算法对所述环境图像中的潜水器材进行判断和分类,得到分类结果;
72.根据所述识别结果和所述分类结果,生成场景模型;
73.将所述场景模型和所述示教数据进行融合,得到融合场景数据;
74.将所述融合场景数据发送至所述第二增强现实设备。
75.本技术的一些实施例,通过采用增强现实技术,将教练的示范动作与学员的实际潜水环境相融合,增强学员的沉浸感和参与度。
76.在一些实施例,所述装置还包括比较模块,所述比较模块用于:
77.接收第二增强现实设备的学员的第二身体姿势信息;
78.将所述第一身体姿势信息与所述第二身体姿势信息进行比较;
79.若所述第一身体姿势信息和所述第二身体姿势信息的误差大于预设值,则通过所述第二增强现实设备显示指导信息。
80.本技术的一些实施例通过通过比较学员的姿势和教练示范的姿势,可以分析出差
异和改进点,提供更准确、详细的示范和指导。
81.在一些实施例,所述比较模块还用于:
82.根据所述第一身体姿势信息和所述第二身体姿势信息的比较结果,采用评估指标和评分系统,对学员姿势进行打分和评价。
83.本技术的一些实施例通过将教练的第一身体姿势信息和学员的第二身体姿势信息进行比较,根据比较的而结果,对学员的姿势进行评估和反馈。可以评估指标和评分系统,对学员的姿势进行打分和评价,以便更好地指导学员进行改进。
84.在一些实施例,所述装置还包括控制模块,所述控制模块用于:
85.通过所述第一增强现实设备接收用户输入语音指令,所述语音指令用于指导学员调整身体姿势或呼吸方法;
86.将所述语音指令转换成文本控制指令,并将所述文本控制指令发送至所述第二增强现实设备。
87.本技术的一些实施例通过在增强现实设备上集成语音识别和语音合成技术,可以通过语音交互的方式为学员提供指导信息。
88.第三方面,本技术的一些实施例提供一种增强实现设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任一实施例所述的数据处理方法。
89.第四方面,本技术的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任一实施例所述的数据处理方法。
90.第五方面,本技术的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面任一实施例所述的数据处理方法。
附图说明
91.为了更清楚地说明本技术的一些实施例的技术方案,下面将对本技术的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
92.图1为本技术实施例提供的一种数据处理方法的流程示意图;
93.图2为本技术实施例提供的一种数据处理装置的结构示意图;
94.图3为本技术实施例提供的一种增强实现设备示意图。
具体实施方式
95.下面将结合本技术的一些实施例中的附图,对本技术的一些实施例中的技术方案进行描述。
96.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
97.游泳运动是男女老少都喜欢的体育项目之一,可以改善心血管系统、增强抵抗力、
健美形体,是一项非常方便健康的有氧运动。在开始学习游泳的时候,都是由教练亲自教学,然后学员根据教练的游泳动作进行学习,但是这种方式,学员无法准确掌握教练的关键动作的准确度,鉴于此,本技术的一些实施例提供了一种数据处理方法,通过第一增强现实设备采集多媒体数据;根据预先训练的姿势识别模型,对多媒体数据进行识别,得到多媒体数据中的第一身体姿势信息,其中,第一身体姿势信息至少包括身体关键点位置和角度信息,姿势识别模型是通过对神经网络模型进行训练得到的;将第一身体姿势信息发送至第二增强现实设备,以使第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息,本技术实施例中通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
98.如图1所示,本技术的实施例提供了一种数据处理方法,该方法包括:
99.s101、通过第一增强现实设备采集多媒体数据;
100.其中,增强现实设备可以是ar(augmented reality,增强现实)眼镜;ar眼镜至少包括高清摄像头、显示器和传感器等装置,其中高清摄像头用于采集多媒体数据,即对教练的示范动作进行视频或图片的采集,摄像头可以采用普通的cmos或者ccd传感器,拍摄的视频或图片可以达到高清晰度,以便更好地识别姿势;显示器用于投影虚拟图像,传感器用于实时监控身体姿态等信息。
101.第一增强现实设备可以是教练佩戴的ar眼镜,第二增强现实设备为学员佩戴的ar眼镜。
102.ar眼镜需要具备无线网络连接和蓝牙连接的功能,以便与其他设备进行连接,例如第一增强现实设备可以与第二增强现实设备进行数据传输。
103.s102、根据预先训练的姿势识别模型,对多媒体数据进行识别,得到多媒体数据中的第一身体姿势信息,其中,第一身体姿势信息至少包括身体关键点位置和角度信息,姿势识别模型是通过对神经网络模型进行训练得到的;
104.具体地,第一增强现实设备在获取到教练的多媒体数据后,采用预先训练的姿势识别模型对多媒体数据中的教练的第一身体姿势信息进行识别,得到教练的关键动作的关键点位置和角度信息,姿势识别模型是通过样本数据对神经网络模型进行训练得到的。
105.其中,多媒体数据可以是教练示范动作的视频或图片,在获取示范动作的视频或图片后,需要对教练的身体姿势进行识别,对于人体姿势识别,可采用下面两种方式进行识别:
106.作为一种可选地实施方式,基于2d图像进行姿势识别,通过对2d图像进行处理,检测出人体的关键点,然后通过分析关键点之间的位置关系,来识别出人体的姿势,可用于人体在平面内的姿势识别。
107.作为另一种可选地实施方式,对于人体在空间内的姿势识别,可以使用基于3d模型的姿势识别方法,该方法通过建立3d人体模型,然后将采集到的人体图像映射到3d模型上,从而识别人体的姿势,这种方法精度较高。
108.在本技术实施例中对基于深度学习算法的神经网络模型进行训练,得到姿势识别
模型,并通过姿势识别模型,识别出的身体关键点位置,提取出对应的关键点信息。
109.示例性地,对于潜水教学,可以提取出教练的头部、手臂、腿部等关键点信息,以便进行姿势分析和比较。
110.s103、将第一身体姿势信息发送至第二增强现实设备,以使第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息。
111.具体地,第一增强现实设备将获取的第一身体姿势信息发送至第二增强现实设备,第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息,这样,学员在佩戴第二增强现实设备时,就可以在第二增强现实设备的显示屏中看到关键点信息和角度信息。
112.本技术实施例中ar眼镜需要集成高清摄像头,可以通过深度学习等技术实现姿势的实时识别和分析,同时也需要具备实时传输视频的功能,可以利用wifi或lte等无线网络,第一增强现实设备将采集以及处理后的多媒体数据传输到第二增强现实设备上。
113.本技术的一些实施例通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
114.本技术又一实施例对上述实施例提供的数据处理方法做进一步补充说明。
115.在一些实施例,姿势识别模型通过如下方式获得:
116.获取样本图像;
117.对样本图像进行预处理,得到处理后的图像,其中,预处理至少包括剪裁、缩放或归一化;
118.将处理后的图像输入到初始神经网络中,进行前向传播计算,得到前向检测结果;
119.根据前向检测结果,计算损失函数;
120.若损失函数的值小于预设值,则将与损失函数对应的初始神经网络确定为姿势识别模型;
121.基于姿势识别模型,根据前向检测结果和非极大值抑制算法,确定关键点位置信息;
122.根据关键点位置信息和关键点之间的连接关系,确定样本图像中的人体姿态图像;
123.根据人体姿态图像中的关键点和连接关系,计算关键点的方向和角度信息。
124.具体地,第一增强现实设备在识别出人体的姿势后,需要对姿势进行分析,提取关键点、角度等信息,以便更好地向学员展示示范动作,为了能准确地识别出教练的姿势,需要预先训练姿势识别模型,具体的训练过程如下:
125.可以使用基于深度学习的姿态估计算法,例如openpose、alphapose等,这些算法可以通过图像或视频输入,输出对人体姿态的关键点位置、角度等信息。
126.其中,openpose是一种基于卷积神经网络(cnn)和递归神经网络(rnn)的多人关键点检测算法,可以同时检测多个人的身体、手、面部等关键点。alphapose则是一种基于卷积神经网络和卡尔曼滤波器的单人姿态估计算法,可以实现对人物姿态的准确估计和跟踪。
127.基于openpose的姿势识别模型的训练过程如下:
128.首先对输入的样本图像进行预处理,包括裁剪、缩放、归一化等操作,以便于神经网络的处理,得到处理后的图像。
129.将处理后的图像输入到神经网络中,进行前向传播计算。openpose算法使用了一种特殊的卷积神经网络,称为“part affinity fields”(pafs),用于检测人体关键点之间的关联关系,得到pafs的检测结果即前向检测结果。
130.根据前向传播的结果,计算损失函数,并使用反向传播算法进行参数更新,即进行反向传播计算。
131.根据pafs的检测结果,利用非极大值抑制算法,确定每个关键点的位置信息。
132.根据pafs的检测结果,确定关键点之间的连接关系,生成样本图像中的人体姿态图像。
133.根据关键点和连接信息,计算人体姿态的角度、方向等信息。
134.在本技术实施例中,根据姿势识别结果,提取出人体的关键点,如头、手、肘等,将关键点之间的连接关系建立起来,形成骨架结构,根据骨架结构,计算出关键点之间的角度,并进行分析,为学员提供更准确、详细的示范。
135.本技术的一些实施例通过预先训练的姿势识别模型,识别多媒体数据中的身体姿势信息,其中,该姿势识别模型是通过对神经网络模型进行训练得到的,在获取到教练的多媒体数据后,识别该多媒体数据中的第一身体姿势信息,提高识别的准确性。
136.在一些实施例,该方法还包括:
137.采用视频编辑软件,将示范的多媒体数据中的示范动作,剪辑成一个或多个视频片段;
138.对视频片段进行分辨率调整,得到调整后的视频片段;
139.将调整后的视频片段输入到3d建模软件中,生成3d模型;
140.对3d模型进行优化,得到优化后的3d模型;
141.将优化后的3d模型渲染成示教数据,并将示教数据发送至第二增强现实设备。
142.具体地,第一增强现实设备ar眼镜可以使用3d建模技术,将教练的示范动作转化为3d模型,以便学员更好地理解和模仿,具体为:
143.使用3d建模软件将教练的示范动作转化为3d模型,例如3d建模软件可以是blender、maya或3d max等。3d建模软件可以将录制的示范动作视频转换为一个3d模型,并且可以对3d模型进行编辑、优化和渲染等操作,以便学员更好地理解和模仿。
144.具体的转换流程一般包括以下几个步骤:
145.使用ar眼镜的摄像头或其他摄像设备,录制教练的示范动作视频,使用视频编辑软件,将录制的示范动作视频剪辑成一个或多个片段,以便后续处理,对剪辑后的视频片段进行视频解析度调整,通常将视频分辨率调整为适合3d建模软件处理的大小,使用3d建模软件导入剪辑好的示范动作视频,并将其转换为3d模型,对导入的3d模型进行优化,例如去除不必要的细节和增加必要的细节等,将优化好的3d模型渲染成视频或图片,以便学员更好地理解和模仿。
146.本技术的一些实施例,通过将多媒体数据转换成3d模型,并对该3d模型进行优化和渲染处理后,得到示教数据,并发送至第二增强现实设备,这样,用户就可以通过第二增
强现实设备查看示教数据,3d模型的显示更加清楚。
147.在一些实施例,该方法还包括:
148.接收第二增强现实设备采集的环境图像,环境图像至少包括水下景观和潜水器材;
149.采集计算机视觉技术,对环境图像中的水下景观进行识别和分析,得到识别结果;
150.采用机器学习算法对环境图像中的潜水器材进行判断和分类,得到分类结果;
151.根据识别结果和分类结果,生成场景模型;
152.将场景模型和示教数据进行融合,得到融合场景数据;
153.将融合场景数据发送至第二增强现实设备。
154.具体地,第一增强现实设备利用增强现实技术将教练的示范动作与学员的实际潜水环境相融合,增强学员的沉浸感和参与度。例如将教练的示范动作与水下景观、潜水器材等进行融合,使得学员可以更加直观地感受到教练的示范动作与实际潜水环境的关联性。
155.具体融合步骤如下所示:
156.第一增强现实设备ar眼镜可以通过使用摄像头和传感器来捕捉学员所处环境信息即环境图像,例如水下景观、潜水器材等;将摄像头和传感器捕捉到的信息进行处理,例如通过计算机视觉技术对景观进行识别和分析,通过机器学习算法对潜水器材进行判断和分类等;根据捕捉到的信息和处理后的数据,生成场景模型,例如,将水下景观和潜水器材等生成3d模型;将教练的示范动作和场景模型进行融合,例如将教练的示范动作与潜水器材、水下景观等进行结合,产生一种虚拟的场景视觉体验;将融合后的场景模型通过ar眼镜的无线网络实时传输到学员的ar眼镜上,使学员可以实时观看到教练的示范动作和融合后的场景模型;学员可以根据教练的示范动作和融合后的场景模型,进行模仿和练习。
157.ar眼镜需要利用增强现实技术,将教练的示范动作与学员的实际潜水环境相融合,以便学员更好地理解和模仿,同时,ar眼镜还需要具备3d建模和立体显示的功能,以便学员更好地观察和理解示范动作。
158.本技术的一些实施例,通过采用增强现实技术,将教练的示范动作与学员的实际潜水环境相融合,增强学员的沉浸感和参与度。
159.在一些实施例,该方法还包括:
160.接收第二增强现实设备的学员的第二身体姿势信息;
161.将第一身体姿势信息与第二身体姿势信息进行比较;
162.若第一身体姿势信息和第二身体姿势信息的误差大于预设值,则通过第二增强现实设备显示指导信息。
163.本技术实施例中,基于关键点信息,第一增强现实设备对学员姿势进行分析和比较,具体来说,分别计算学员的每个关键点的位置、角度、方向等信息,以及关键点之间的距离、角度等相对关系。以及教练的第一身体姿势信息,通过比较学员的姿势和教练示范的姿势,可以分析出差异和改进点,提供更准确、详细的示范和指导。
164.本技术的一些实施例通过通过比较学员的姿势和教练示范的姿势,可以分析出差异和改进点,提供更准确、详细的示范和指导。
165.在一些实施例,该方法还包括:
166.根据第一身体姿势信息和第二身体姿势信息的比较结果,采用评估指标和评分系
统,对学员姿势进行打分和评价。
167.具体地,第一增强现实设备根据姿势分析的结果,对学员的姿势进行评估和反馈,例如,可以设计评估指标和评分系统,对学员的姿势进行打分和评价,以便更好地指导学员进行改进。
168.本技术的一些实施例通过将教练的第一身体姿势信息和学员的第二身体姿势信息进行比较,根据比较的而结果,对学员的姿势进行评估和反馈。可以评估指标和评分系统,对学员的姿势进行打分和评价,以便更好地指导学员进行改进。
169.在一些实施例,该方法还包括:
170.通过第一增强现实设备接收用户输入语音指令,语音指令用于指导学员调整身体姿势或呼吸方法;
171.将语音指令转换成文本控制指令,并将文本控制指令发送至第二增强现实设备。
172.具体地,ar眼镜需要集成语音识别和语音合成技术,可以通过语音交互的方式为学员提供指导信息,ar眼镜需要具备语音识别和语音合成的功能,可以将教练的语音命令转化为文本信息,并通过语音合成的方式传递给学员,教练通过ar眼镜向学员发出指导信息,如调整姿势、呼吸方法等。
173.例如,当学员的姿势偏差较大时,ar眼镜可以自动发出调整姿势的指导信息。
174.ar眼镜还可以具备交互式指导的功能,即通过语音或文字交互的方式,让学员主动向教练提问或反馈问题,并得到及时的回答和指导。
175.学员可以通过ar眼镜向教练提问或反馈,教练也可以实时回答或指导。
176.ar眼镜需要具备双向语音交互和文字输入输出的功能,可以通过语音或文字交互的方式为学员提供答疑解惑的服务。同时,ar眼镜还可以利用增强现实技术,将问题和答案与学员的实际潜水环境相融合,以便学员更好地理解和应用,教练可以通过ar眼镜监控学员的潜水状况,及时发现并纠正问题。
177.本技术的一些实施例通过在增强现实设备上集成语音识别和语音合成技术,可以通过语音交互的方式为学员提供指导信息。
178.需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本技术不做限定。
179.本技术另一实施例提供一种数据处理方法装置,用于执行上述实施例提供的数据处理方法。
180.如图2所示,为本技术实施例提供的数据处理方法装置的结构示意图。该数据处理方法装置包括采集模块201、识别模块202和发送模块203,其中:
181.采集模块201用于通过第一增强现实设备采集多媒体数据;
182.识别模块202用于根据预先训练的姿势识别模型,对多媒体数据进行识别,得到多媒体数据中的第一身体姿势信息,其中,第一身体姿势信息至少包括身体关键点位置和角度信息,姿势识别模型是通过对神经网络模型进行训练得到的;
183.发送模块203用于将第一身体姿势信息发送至第二增强现实设备,以使第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息。
184.本技术的一些实施例通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势
信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
185.关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
186.本技术又一实施例对上述实施例提供的数据处理方法装置做进一步补充说明。
187.在一些实施例,装置还包括模型建立模块,模型建立模块用于:
188.获取样本图像;
189.对样本图像进行预处理,得到处理后的图像,其中,预处理至少包括剪裁、缩放或归一化;
190.将处理后的图像输入到初始神经网络中,进行前向传播计算,得到前向检测结果;
191.根据前向检测结果,计算损失函数;
192.若损失函数的值小于预设值,则将与损失函数对应的初始神经网络确定为姿势识别模型;
193.基于姿势识别模型,根据前向检测结果和非极大值抑制算法,确定关键点位置信息;
194.根据关键点位置信息和关键点之间的连接关系,确定样本图像中的人体姿态图像;
195.根据人体姿态图像中的关键点和连接关系,计算关键点的方向和角度信息。
196.本技术的一些实施例通过预先训练的姿势识别模型,识别多媒体数据中的身体姿势信息,其中,该姿势识别模型是通过对神经网络模型进行训练得到的,在获取到教练的多媒体数据后,识别该多媒体数据中的第一身体姿势信息,提高识别的准确性。
197.在一些实施例,识别模块还用于:
198.采用视频编辑软件,将示范的多媒体数据中的示范动作,剪辑成一个或多个视频片段;
199.对视频片段进行分辨率调整,得到调整后的视频片段;
200.将调整后的视频片段输入到3d建模软件中,生成3d模型;
201.对3d模型进行优化,得到优化后的3d模型;
202.将优化后的3d模型渲染成示教数据,并将示教数据发送至第二增强现实设备。
203.本技术的一些实施例,通过将多媒体数据转换成3d模型,并对该3d模型进行优化和渲染处理后,得到示教数据,并发送至第二增强现实设备,这样,用户就可以通过第二增强现实设备查看示教数据,3d模型的显示更加清楚。
204.在一些实施例,装置还包括融合模块,融合模块用于:
205.接收第二增强现实设备采集的环境图像,环境图像至少包括水下景观和潜水器材;
206.采集计算机视觉技术,对环境图像中的水下景观进行识别和分析,得到识别结果;
207.采用机器学习算法对环境图像中的潜水器材进行判断和分类,得到分类结果;
208.根据识别结果和分类结果,生成场景模型;
209.将场景模型和示教数据进行融合,得到融合场景数据;
210.将融合场景数据发送至第二增强现实设备。
211.本技术的一些实施例,通过采用增强现实技术,将教练的示范动作与学员的实际潜水环境相融合,增强学员的沉浸感和参与度。
212.在一些实施例,装置还包括比较模块,比较模块用于:
213.接收第二增强现实设备的学员的第二身体姿势信息;
214.将第一身体姿势信息与第二身体姿势信息进行比较;
215.若第一身体姿势信息和第二身体姿势信息的误差大于预设值,则通过第二增强现实设备显示指导信息。
216.本技术的一些实施例通过通过比较学员的姿势和教练示范的姿势,可以分析出差异和改进点,提供更准确、详细的示范和指导。
217.在一些实施例,比较模块还用于:
218.根据第一身体姿势信息和第二身体姿势信息的比较结果,采用评估指标和评分系统,对学员姿势进行打分和评价。
219.本技术的一些实施例通过将教练的第一身体姿势信息和学员的第二身体姿势信息进行比较,根据比较的而结果,对学员的姿势进行评估和反馈。可以评估指标和评分系统,对学员的姿势进行打分和评价,以便更好地指导学员进行改进。
220.在一些实施例,装置还包括控制模块,控制模块用于:
221.通过第一增强现实设备接收用户输入语音指令,语音指令用于指导学员调整身体姿势或呼吸方法;
222.将语音指令转换成文本控制指令,并将文本控制指令发送至第二增强现实设备。
223.本技术的一些实施例通过在增强现实设备上集成语音识别和语音合成技术,可以通过语音交互的方式为学员提供指导信息。
224.根据本实施例提供的数据处理方法装置,通过第一增强现实设备采集多媒体数据;根据预先训练的姿势识别模型,对多媒体数据进行识别,得到多媒体数据中的第一身体姿势信息,其中,第一身体姿势信息至少包括身体关键点位置和角度信息,姿势识别模型是通过对神经网络模型进行训练得到的;将第一身体姿势信息发送至第二增强现实设备,以使第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息,本技术实施例中通过教练的第一增强现实设备采集教练教学的多媒体数据,根据预先训练的姿势识别模型识别多媒体数据中的教练的身体姿势信息,并将该身体姿势信息发送至学员的第二增强现实设备,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。
225.关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
226.需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本技术不做限定。
227.本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时可实现如上述实施例提供的数据处理方法中的任意实施例所对应方法的操作。
228.本技术实施例还提供了一种计算机程序产品,的计算机程序产品包括计算机程序,其中,的计算机程序被处理器执行时可实现如上述实施例提供的数据处理方法中的任意实施例所对应方法的操作。
229.如图3所示,本技术的一些实施例提供一种增强实现设备300,该增强实现设备300包括:存储器310、处理器320以及存储在存储器310上并可在处理器320上运行的计算机程序,其中,处理器320通过总线330从存储器310读取程序并执行程序时可实现如上述数据处理方法包括的任意实施例的方法。
230.处理器320可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器320可以是微处理器。
231.存储器310可以用于存储由处理器320执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本技术实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器320可以用于执行存储器310中的指令以实现上述所示的方法。存储器310包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
232.以上仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
233.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
234.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:通过第一增强现实设备采集多媒体数据;根据预先训练的姿势识别模型,对所述多媒体数据进行识别,得到所述多媒体数据中的第一身体姿势信息,其中,所述第一身体姿势信息至少包括身体关键点位置和角度信息,所述姿势识别模型是通过对神经网络模型进行训练得到的;将所述第一身体姿势信息发送至第二增强现实设备,以使所述第二增强现实设备显示所述第一身体姿势信息中的关键点信息和角度信息。2.根据权利要求1所述的数据处理方法,其特征在于,所述姿势识别模型通过如下方式获得:获取样本图像;对所述样本图像进行预处理,得到处理后的图像,其中,所述预处理至少包括剪裁、缩放或归一化;将所述处理后的图像输入到初始神经网络中,进行前向传播计算,得到前向检测结果;根据所述前向检测结果,计算损失函数;若所述损失函数的值小于预设值,则将与所述损失函数对应的初始神经网络确定为所述姿势识别模型;基于所述姿势识别模型,根据所述前向检测结果和非极大值抑制算法,确定关键点位置信息;根据所述关键点位置信息和关键点之间的连接关系,确定所述样本图像中的人体姿态图像;根据所述人体姿态图像中的关键点和连接关系,计算关键点的方向和角度信息。3.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:采用视频编辑软件,将示范的多媒体数据中的示范动作,剪辑成一个或多个视频片段;对所述视频片段进行分辨率调整,得到调整后的视频片段;将所述调整后的视频片段输入到3d建模软件中,生成3d模型;对所述3d模型进行优化,得到优化后的3d模型;将所述优化后的3d模型渲染成示教数据,并将所述示教数据发送至所述第二增强现实设备。4.根据权利要求3所述的数据处理方法,其特征在于,所述方法还包括:接收第二增强现实设备采集的环境图像,所述环境图像至少包括水下景观和潜水器材;采集计算机视觉技术,对所述环境图像中的水下景观进行识别和分析,得到识别结果;采用机器学习算法对所述环境图像中的潜水器材进行判断和分类,得到分类结果;根据所述识别结果和所述分类结果,生成场景模型;将所述场景模型和所述示教数据进行融合,得到融合场景数据;将所述融合场景数据发送至所述第二增强现实设备。5.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:接收第二增强现实设备的学员的第二身体姿势信息;将所述第一身体姿势信息与所述第二身体姿势信息进行比较;
若所述第一身体姿势信息和所述第二身体姿势信息的误差大于预设值,则通过所述第二增强现实设备显示指导信息。6.根据权利要求5所述的数据处理方法,其特征在于,所述方法还包括:根据所述第一身体姿势信息和所述第二身体姿势信息的比较结果,采用评估指标和评分系统,对学员姿势进行打分和评价。7.根据权利要求5所述的数据处理方法,其特征在于,所述方法还包括:通过所述第一增强现实设备接收用户输入语音指令,所述语音指令用于指导学员调整身体姿势或呼吸方法;将所述语音指令转换成文本控制指令,并将所述文本控制指令发送至所述第二增强现实设备。8.一种数据处理方法装置,其特征在于,所述装置包括:采集模块,用于通过第一增强现实设备采集多媒体数据;识别模块,用于根据预先训练的姿势识别模型,对所述多媒体数据进行识别,得到所述多媒体数据中的第一身体姿势信息,其中,所述第一身体姿势信息至少包括身体关键点位置和角度信息,所述姿势识别模型是通过对神经网络模型进行训练得到的;发送模块,用于将所述第一身体姿势信息发送至第二增强现实设备,以使所述第二增强现实设备显示所述第一身体姿势信息中的关键点信息和角度信息。9.一种增强实现设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现权利要求1-7中任意一项权利要求所述的数据处理方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述程序被处理器执行时可实现权利要求1-7中任意一项权利要求所述的数据处理方法。
技术总结
本申请实施例提供一种数据处理方法、装置、增强实现设备及存储介质,该方法包括:通过第一增强现实设备采集多媒体数据;根据预先训练的姿势识别模型,对多媒体数据进行识别,得到多媒体数据中的第一身体姿势信息;将第一身体姿势信息发送至第二增强现实设备,以使第二增强现实设备显示第一身体姿势信息中的关键点信息和角度信息,学员就可以通过第二增强现实设备观看教练教学的多媒体数据,且可以查看身体姿势信息中的关键点信息和角度信息,从而可以在准确了解教练的关键动作,提供学习的准确性。确性。确性。
技术研发人员:刘威 李政 夏勇峰
受保护的技术使用者:北京蜂巢世纪科技有限公司
技术研发日:2023.06.12
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
