本发明实施例涉及数据处理技术领域,具体涉及一种语义识别方法、装置、智能设备及存储介质。
背景技术:
随着科学技术的不断发展,越来越多的公司将注意力移动到智能产品上。甚至在智能产品的对话智能设备中引入了语义动作(语义动作在对话系统中扮演着重要角色,用来帮助理解用户真实意图)的识别功能。
但是,基于现有的方式识别用户的语义动作,准确率比较低。语义动作不能够正确识别间接导致智能设备不能顺利执行用户语音指示的“任务”,或者用户需要经过多次重复说明,智能设备才可以正确识别,并执行相应任务。
而上述操作必然使得用户的体验度大大降低,那么如何才能保证智能设备可以顺利的精准识别用户的语义动作,并执行相应的任务,从而大大提升用户体验度成为本申请所要解决的技术问题。
技术实现要素:
为此,本发明实施例提供一种语义识别方法、装置、智能设备及存储介质,以解决现有技术中由于智能设备对用户的语义动作识别不准确或者不顺利,使得用户语音指示的“任务”不能顺利执行,而导致的用户体验度大大降低的问题。
为了实现上述目的,本发明的实施方式提供如下技术方案:
在本发明的实施方式的第一方面中,提供了一种语义识别方法,包括:采集用户当前提供的第一语音信息;
对第一语音信息进行预处理,获取与第一语音信息对应的词序列;
利用预建立的分析器联合模型对词序列进行预测,获取与第一语音信息对应的语义动作解析结果,预建立的分析器联合模型为利用用户提供的样本语音信息对分析器进行训练后获取的最优训练模型。
在本发明的一个实施例中,对第一语音信息进行预处理,获取与第一语音信息对应的词序列,具体包括:
对语音信息进行语音识别和语音分析转换后,生成文本数据;
对文本数据依次进行切词处理和信息槽标注处理,获取与文本数据对应的词序列。
在本发明的另一实施例中,当第一语音信息不是用户提供的第一条语音信息时,利用预建立的分析器联合模型对词序列进行预测,获取与第一语音信息对应的语义动作解析结果之前,方法还包括:
提取与用户提供的第二语音信息对应的语义动作,第二语音信息为用户在提供第一语音信息之前提供的前一条语音信息;
将第二语音信息对应的语义动作和词序列共同输入至预建立的分析器联合模型,以便利用预建立的分析器联合模型,对词序列和第二语音信息对应的语义动作结合进行预测,获取与第一语音信息对应的语义动作解析结果。
在本发明的又一个实施例中,语义动作解析结果包括:与第一语音信息中的信息槽对应的第一类语义动作;或者与第一语音信息整体句式对应的第二类语义动作;或者,第一类语义动作和第二类语义动作的整合。
在本发明的实施方式的第二方面中,提供了一种语义识别装置,包括:采集单元,用于采集用户当前提供的第一语音信息;
处理单元,用于对第一语音信息进行预处理,获取与第一语音信息对应的词序列;
预测单元,用于利用预建立的分析器联合模型对词序列进行预测,获取与第一语音信息对应的语义动作解析结果,预建立的分析器联合模型为利用用户提供的样本语音信息对分析器进行训练后获取的最优训练模型。
在本发明的一个实施例中,处理单元具体用于,对语音信息进行语音识别和语音分析转换后,生成文本数据;
对文本数据依次进行切词处理和信息槽标注处理,获取与文本数据对应的词序列。
在本发明的另一实施例中,当第一语音信息不是用户提供的第一条语音信息时,装置包括:
提取单元,提取与用户提供的第二语音信息对应的语义动作,第二语音信息为用户在提供第一语音信息之前提供的前一条语音信息;
将第二语音信息对应的语义动作和词序列共同输入至预建立的分析器联合模型,以便预测单元利用预建立的分析器联合模型,对词序列和第二语音信息对应的语义动作结合进行预测,获取与第一语音信息对应的语义动作解析结果。
在本发明的又一个实施例中,语义动作解析结果包括:与第一语音信息中的信息槽对应的第一类语义动作;或者与第一语音信息整体句式对应的第二类语义动作;或者,第一类语义动作和第二类语义动作的整合。
在本发明的实施方式的第三方面中,提供了一种智能设备,包括:
语音采集器、存储器以及处理器;
语音采集器,用于采集用户当前提供的第一语音信息;
存储器,用于存储一个或多个程序指令;一个或多个程序指令被处理器运行,用以执行如上所述的一种语义识别方法中任一方法步骤。。
在本发明的实施方式的第四方面中,提供了一种计算机存储介质,计算机存储介质中包含一个或多个程序指令,一个或多个程序指令用于被一种智能设备执行如上一种语义识别方法中的任一方法步骤。
根据本发明的实施方式,具有如下优点:采集第一语音信息后,对第一语音信息进行预处理,获取与第一语音信息对应的词序列。然后利用预建立的分析器联合模型对词序列进行预测,从而获取与第一语音信息对应的语义动作解析结果。经过训练过的分析器联合模型可以精确的识别出语义动作,便于智能设备顺利的精准识别用户的语义动作,并执行相应的任务,从而大大提升用户体验度。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明的一实施例提供的一种语义识别方法流程示意图;
图2示出了分析器联合模型对词序列进行分析的信号流向示意图。
图3为本发明的另一实施例提供的一种语义识别装置结构示意图;
图4为本发明的另一实施例提供的一种智能设备结构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1提供了一种语义识别方法,具体如图1所示,
步骤110,采集用户当前提供的第一语音信息。
步骤120,对第一语音信息进行预处理,获取与第一语音信息对应的词序列。
具体的,采集用户当前提供的第一语音信息后,首先需要将其进行预处理。
例如,对第一语音数据进行语音识别和语音分析转换处理,将其转换为对应的文本数据。
然后,对文本数据进行切词和信息槽标注等处理,从而得到处理后的数据。这个处理后的数据实际就是与第一语音数据对应的词序列。
步骤130,利用预建立的分析器联合模型对词序列进行预测,获取与第一语音信息对应的语义动作解析结果。
具体的,语义动作指的是预先定义好的语义动作。分析器联合模型则是通过用户输入的历史语音数据作为样本语音数据对分析器进行训练后获取的最优训练模型。
其训练过程是采用深度神经网络的方法对分析器进行训练。
可选的,语音动作解析结果可以包括:与第一语音信息中的信息槽对应的第一类语义动作;例如一句语音信息为“我想去天安门”,这里的想去是与天安门相关的语义动作,“天安门”是信息槽。第一类语义动作可以包括:肯定、否定、选择和证实等相关释义的词汇。而另一句语音信息为“该怎么走呢”,与语音信息整体句式对应的第二类语义动作就是“该怎么走呢”。即,第二类语义动作是与语音信息整体句式对应的语义动作,可以是请求、重复、否定、肯定、无所谓、谢谢、对不起或者问好等句式对应的语义动作。或者,语音动作解析结果还可以是第一类语义动作和第二类语义动作的整合。语义动作全面,从而使得该方法灵活性较高,保证了智能设备识别语义动作时能够更加准确,不具有局限性。
在一个具体的例子中,分析器是一个基于注意力(Attention)机制的联合训练第一类语义动作和第二类语义动作的循环神经网络(Recurrent Neural Network,简称RNN)模型。其分析器联合模型输入部分就是词序列,而输出部分则可以是第一类语义动作或者第二类语义动作,又或者是第一类语义动作和第二类语义动作共同输出。具体输出是什么,则需要根据用户实际输入的语音进行判定。
此外,输出的第一类语义动作可以是一个也可以是多个,即输出的是第一类语义动作序列。例如,用户输入的语音数据是“我想吃炒菜,不想吃披萨”。那么,第一类语义动作则可以包括:想吃,和不想吃。一个是肯定的语义动作,另一个是否定的语义动作。而系统识别时,根据语音动作所在的位置进行匹配,确定哪个位置是肯定的,哪个位置是否定的。在具体执行过程中,如图2所示,图2示出了分析器联合模型对词序列进行分析的信号流向示意图。分析器联合模型中包含了输入端、双向长短期记忆网络、第一类语义动作attention机制和第二类语义动作attention机制、第一类语义动作输出端和第二类语义动作输出端等部分。
其中,输入端x1、x2至xn输入的是词序列,具体n的数值与词序列的个数相同。输入的词序列经过双向长短期记忆网络处理后输出结果h1~hn。其中,hn表示经过长短期记忆网络处理后对应的第n个隐含层输出值。h1~hn经过第二类语义动作attention机制后输出结果和h1~hn相结合构成第二类语义动作。
而h1~hn进入第一类语义动作attention机制后,输出的结果将和h1~hn,以及第二类语义动作共同作为输入,得到第一类语义动作输出结果y1~yn。而第一类语义动作的输出结果将和字序列的个数对应,且xn的位置和yn的位置一一对应。通过该种方式,则可以确定第一类语义动作中每一个语义动作所在的位置。
上述具体的实现过程均是现有技术,因此这里仅概述其原理,具体的实现细节不做过多披露。
当然,一个语音信息中并非一定包含第一类语义动作和第二类语义动作,当不包含时,则输出为预定义字段,该预定义字段用于指示该位置没有语义动作输出。
通过上述方式,可以得到与第一语音信息对应的语义动作解析结果。
可选的,当第一语音信息不是用户提供的第一条语音信息时,则该方法还可以包括:提取与用户提供的第二语音信息对应的语义动作。其中,第二语音信息为用户在提供第一语音信息之前提供的前一条语音信息。
用户提供的语音信息如果不是智能设备采集到的第一条语音信息,那么当前所提供的语音信息很可能还上一条语音信息之间有着密不可分的关系,而这对于智能设备识别出当前语音信息中的语义动作至关重要。
例如,如果用户上一条语音信息是“我想去天安门”,而第二条语音信息是“该怎么走呢”。如果没有识别当前一条语音的语义动作,那么第二条语义动作将很难识别出来。那么,系统无法顺利执行用户的语音指示任务。因此,需要调取第二语音信息对应的语义动作,然后将其和上文中所介绍的词序列共同作为输入,加入到预建立的分析器联合模型中,便于分析器联合模型对词序列和第二语音信息对应的语义动作结合进行预测,获取与第一语音信息对应的语义动作解析结果。
具体执行过程和上文说的类似,这里不做过多赘述。通过上述方式,智能设备可以轻易的联系用户所提供的前后语音信息,进入准确识别语义动作,准确执行相应的语义动作。不会造成智能设备执行的语义动作和用户实际的语音指示相偏离的情况发生,大大提高准确度,保证用户的体验度。
本发明实施例提供的一种语义识别方法,采集第一语音信息后,对第一语音信息进行预处理,获取与第一语音信息对应的词序列。然后利用预建立的分析器联合模型对词序列进行预测,从而获取与第一语音信息对应的语义动作解析结果。经过训练过的分析器联合模型可以精确的识别出语义动作,便于智能设备顺利的精准识别用户的语义动作,并执行相应的任务,从而大大提升用户体验度。
与上述实施例对应的,本发明实施例还提供了一种语义识别装置,具体如图3所示,该装置包括:采集单元301和处理单元302。
具体的,采集单元301,用于采集用户当前提供的第一语音信息;
处理单元302,用于对第一语音信息进行预处理,获取与第一语音信息对应的词序列;
预测单元,用于利用预建立的分析器联合模型对词序列进行预测,获取与第一语音信息对应的语义动作解析结果,预建立的分析器联合模型为利用用户提供的样本语音信息对分析器进行训练后获取的最优训练模型。
可选的,处理单元302具体用于,对语音信息进行语音识别和语音分析转换后,生成文本数据;
对文本数据依次进行切词处理和信息槽标注处理,获取与文本数据对应的词序列。
可选的,当第一语音信息不是用户提供的第一条语音信息时,装置还包括:
提取单元303,提取与用户提供的第二语音信息对应的语义动作,第二语音信息为用户在提供第一语音信息之前提供的前一条语音信息;
将第二语音信息对应的语义动作和词序列共同输入至预建立的分析器联合模型,以便预测单元利用预建立的分析器联合模型,对词序列和第二语音信息对应的语义动作结合进行预测,获取与第一语音信息对应的语义动作解析结果。
可选的,语义动作解析结果包括:与第一语音信息中的信息槽对应的第一类语义动作;或者与第一语音信息整体句式对应的第二类语义动作;或者,第一类语义动作和第二类语义动作的整合。
本发明实施例提供的一种语义识别装置中各部件所执行的功能均已在上述实施例1中做了详细介绍,因此这里不做过多赘述。
本发明实施例提供的一种语义识别装置,采集第一语音信息后,对第一语音信息进行预处理,获取与第一语音信息对应的词序列。然后利用预建立的分析器联合模型对词序列进行预测,从而获取与第一语音信息对应的语义动作解析结果。经过训练过的分析器联合模型可以精确的识别出语义动作,便于智能设备顺利的精准识别用户的语义动作,并执行相应的任务,从而大大提升用户体验度。
与上述实施例相对应的,本发明实施例还提供了一种智能设备,具体如图4所示,该智能设备包括:语音采集器401、处理器402以及存储器403。
语音采集器401,用于采集用户当前提供的第一语音信息;
存储器403,用于存储一个或多个程序指令;一个或多个程序指令被处理器402运行,用以执行如前述实施例所述的一种语义识别方法中任一的方法步骤。
本发明实施例提供的一种智能设备中各部件所执行的功能均已在上述实施例1中做了详细介绍,因此这里不做过多赘述。
本发明实施例提供的一种智能设备,采集第一语音信息后,对第一语音信息进行预处理,获取与第一语音信息对应的词序列。然后利用预建立的分析器联合模型对词序列进行预测,从而获取与第一语音信息对应的语义动作解析结果。经过训练过的分析器联合模型可以精确的识别出语义动作,便于智能设备顺利的精准识别用户的语义动作,并执行相应的任务,从而大大提升用户体验度。
与上述实施例相对应的,本发明实施例还提供了一种计算机存储介质,该计算机存储介质中包含一个或多个程序指令。其中,一个或多个程序指令用于被一种智能设备执行如上所介绍的一种语义识别方法。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。