全文摘要
本实用新型公开了一种智能语音识别回采电路,该回采电路包括语音控制模块、音频处理模块和输出模块,其中:语音控制模块向音频处理模块发送语音数据,并接收该语音数据;音频处理模块接收语音控制模块发送的语音数据并进一步处理;输出模块接收音频处理模块进一步处理的语音数据并输出。优选的,该回采电路还包括一音效算法处理模块,接收语音控制模块发送的语音数据进行音效处理,并回传至该语音控制模块。本实用新型提供的该智能语音识别回采电路,可通过节省采样电路和ADC转换电路实现非智能语音识别产品和智能语音识别产品的语音识别功能。
主设计要求
1.一种智能语音识别回采电路,其特征在于,包括语音控制模块、音频处理模块和输出模块,其中:所述语音控制模块向所述音频处理模块发送语音数据,并接收所述发送的该语音数据;音频处理模块接收所述语音控制模块发送的语音数据并进一步处理;输出模块接收所述音频处理模块进一步处理的语音数据并输出。
设计方案
1.一种智能语音识别回采电路,其特征在于,包括语音控制模块、音频处理模块和输出模块,其中:
所述语音控制模块向所述音频处理模块发送语音数据,并接收所述发送的该语音数据;
音频处理模块接收所述语音控制模块发送的语音数据并进一步处理;
输出模块接收所述音频处理模块进一步处理的语音数据并输出。
2.根据权利要求1所述的智能语音识别回采电路,其特征在于,还包括:
音效算法处理模块,接收所述语音控制模块发送的语音数据进行音效处理,并回传至所述语音控制模块。
3.根据权利要求2所述的智能语音识别回采电路,其特征在于,所述音效算法处理模块与所述音频处理模块的处理方法一致。
4.根据权利要求1所述的智能语音识别回采电路,其特征在于,所述语音控制模块通过总线输出链路传送语音数据至所述音频处理模块。
5.根据权利要求1所述的智能语音识别回采电路,其特征在于,所述语音控制模块通过总线输入链路传送语音数据至其自身。
6.根据权利要求2所述的智能语音识别回采电路,其特征在于,所述语音控制模块与所述音效算法处理模块间通过总线输入链路实现环路连接。
7.根据权利要求1所述的智能语音识别回采电路,其特征在于,所述语音控制模块为CPU或主控芯片。
8.根据权利要求1所述的智能语音识别回采电路,其特征在于,所述音频处理模块包括:
数模转换器,接收所述语音控制模块发出的语音数据进行数模转换;
功率放大器,对所述数模转换后的语音数据信号进行增益处理;以及
EQ和DRC,对所述增益处理后的语音数据信号进行音效处理。
9.根据权利要求1所述的智能语音识别回采电路,其特征在于,所述输出模块为扬声器。
10.根据权利要求2所述的智能语音识别回采电路,其特征在于,所述音效算法处理模块包括:
数模转换器,接收所述语音控制模块发出的语音数据进行数模转换;
功率放大器,对所述数模转换后的语音数据信号进行增益处理;以及
EQ和DRC,对所述增益处理后的语音数据信号进行音效处理。
设计说明书
技术领域
本实用新型涉及智能语音识别技术领域,尤其涉及一种智能语音识别回采电路。
背景技术
智能语音识别产品如智能音箱的语音识别算法,需要进行回声消除处理。在此过程中,需要对智能音箱播放的音频数据进行数据回采,该回采数据作为参考信号再进行回声消除处理。
现有技术中,智能音箱的音频回采方法多为通过采样电路及ADC转换为数字信号再通过I2S输入给主芯片,因此,在现有技术中需要一路采样电路和ADC转换模块。然而,在现在非智能语音识别产品中,需要加入智能语音识别功能时,由于该非智能语音识别产品其自身没有采样电路和ADC转换模块,导致无法在一些非智能语音产品上实现智能语音的功能。
实用新型内容
针对以上技术问题,本实用新型提供了一种智能语音识别回采电路,以至少部分解决上述问题。
有鉴于此,本实用新型提供了一种智能语音识别回采电路,其中,该回采电路包括语音控制模块、音频处理模块和输出模块,进一步的:
语音控制模块向音频处理模块发送语音数据,并接收所述发送的该语音数据;
音频处理模块接收语音控制模块发送的语音数据并进一步处理;
输出模块接收音频处理模块进一步处理的语音数据并输出。
优选的,还包括一音效算法处理模块,接收语音控制模块发送的语音数据进行音效处理,并回传至该语音控制模块。
进一步的,音效算法处理模块与音频处理模块的处理方法一致。
更进一步的,语音控制模块通过总线输出链路传送语音数据至音频处理模块;
语音控制模块通过总线输入链路传送语音数据至其自身;
语音控制模块与音效算法处理模块间通过总线输入链路实现环路连接。
一些实施例中,该语音控制模块为CPU或主控芯片;
音频处理模块包括:
数模转换器,接收语音控制模块发出的语音数据进行数模转换,
功率放大器,对数模转换后的语音数据信号进行增益处理,以及
EQ和DRC,对增益处理后的语音数据信号进行音效处理;
输出模块为扬声器;
音效算法处理模块与音频处理模块具有相同的结构。
本实用新型提供的该智能语音识别回采电路,具有以下有益效果:
(1)通过简化电路结构,在不使用采样电路及ADC转换模块的情况下实现非智能语音识别产品的语音识别功能;
(2)通过增加一音效算法处理模块,实现非智能语音识别产品中得到的采样信号与输出信号的处理效果一致,或实现智能语音产品中在不使用采样电路及ADC转换模块的情况下得到的采样信号与输出信号的处理效果一致。
附图说明
图1是现有技术中智能语音识别回采电路内部连接图;
图2是另一现有技术中智能语音识别回采电路内部模块连接图;
图3是本实用新型第一实施例的回采电路结构图;
图4是本实用新型第二实施例的回采电路结构图;
图5是本实用新型实施例中语音控制模块的电路图。
具体实施方式
下面将详细描述本公开的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本公开实施例。在以下描述中,为了提供对本公开实施例的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本公开实施例。在其他实例中,为了避免混淆本公开实施例,未具体描述公知的结构或材料。
在整个说明书中,对“一些实施例”、“一实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本公开至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和\/或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,这里使用的术语“和\/或”包括一个或多个相关列出的项目的任何和所有组合。
为使本实用新型的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本实用新型作进一步的详细说明。
现有技术中,请参见图1和图2,表示两种智能语音识别产品音频回采电路。一般来说,现有的智能语音识别产品(以智能音箱为例)的数据回采通常通过采样电路和ADC实现,此种设计方式仅针对于具有语音识别功能的产品,对于非智能语音识别产品并不友好,尤其是,电路中的回采电路部分在更多产品中并不具有通用性。
为此,本实用新型设计了一种智能语音识别回采电路,简化了电路结构,删除了采样电路和ADC转换模块的设计。
针对该种设计方法,本实用新型第一实施例提供了该智能语音识别回采电路的一种实现方式,具体包括语音控制模块、音频处理模块和输出模块。
语音控制模块向音频处理模块发送语音数据,同时接收该语音数据;音频处理模块接收语音控制模块发送的语音数据并进一步处理;输出模块接收音频处理模块进一步处理的语音数据并输出。各模块间的具体连接方式可以为:语音控制模块通过总线输出链路传送语音数据至音频处理模块;语音控制模块通过总线输入链路传送语音数据至其自身。
一些实施例中,音频处理模块包括数模转换器、功率放大器以及EQ和DRC。其中,数模转换器接收语音控制模块发出的语音数据进行数模转换;功率放大器对数模转换后的语音数据信号进行增益处理;EQ和DRC对增益处理后的语音数据信号进行音效处理。
一些实施例中,语音控制模块用于唤醒和识别语音,语音控制模块得到唤醒信号开启语音识别功能。一实施例中,请参照图3,语音控制模块为主控芯片,主控芯片得到唤醒信号,发送语音数据进行音频识别,音频处理模块包括了数模转换器(DAC)和功率放大器(PA),以及EQ、DRC(图中未示)等实现对语音控制模块发送的语音数据的音效处理,最终通过输出模块实现语音输出,本实施例中,该输出模块为扬声器。
需要说明的是,在电路结构中,如图3所示,主控芯片和DAC之间的连接通过I2S总线实现,I2S总线工作包括总线输出链路(I2S OUT)和总线输入链路(I2S IN),I2S具体连接方式请参照图5,详细的工作原理为本领域技术人员所熟知,在此不做赘述,其中的I2S IN链路实现数据回采功能。因此,该基于该电路结构进行数据回采具体表现为:主控芯片在发送语音数据至音频处理模块(图3中具体显示为DAC)的过程中,该语音数据通过I2S IN链路回传至主控芯片作为参考信号进行回声消除,进而可利用在智能音箱中设计相应语音识别算法实现整个产品的智能语音识别功能。
本实用新型第二实施例提供了该智能语音识别回采电路的又一种实现方式,具体包括语音控制模块、音频处理模块和输出模块,以及一音效算法处理模块,其中:
语音控制模块发送语音数据至音频处理模块进一步处理后传送至输出模块实现音频输出,该部分的实现方式同第一实施例所述;不同的是,增加一音效算法处理模块接收语音控制模块发送的语音数据进行音效处理,并回传至该语音控制模块。
其具体连接方式为:语音控制模块、音频处理模块和输出模块的数据传输方式参照第一实施例所述,在此不予赘述;此外,增加一音效算法处理模块与语音控制模块间通过总线输入链路实现环路连接。
一些实施例中,音效算法处理模块具有与第一实施例中相同的电路结构,实现相同的对语音数据的音效处理模式,包括数模转换器、功率放大器,以及EQ和DRC。数模转换器接收语音控制模块发出的语音数据进行数模转换;功率放大器对数模转换后的语音数据信号进行增益处理;以及EQ和DRC对增益处理后的语音数据信号进行音效处理。
本实施例中,请参照图4,语音控制模块为CPU,CPU得到唤醒信号后,发送语音数据进行音频识别,音频处理模块在此未详细示出,同样包括了DAC、PA等基本的数据处理模块,或还包括一些其他的音效处理模块,输出模块为扬声器,最终该音频处理模块处理后的语音数据传送至扬声器中进行语音输出。
需要特别说明的是,在本实施例设计的电路结构中,如图4所示,CPU和音频处理模块间同样包括了I2S OUT和I2S IN,同样通过I2S IN实现数据回采功能。不同的是,在类似于第一实施例电路结构中的I2S IN链路中插入了一个音效算法处理模块,基于此,该实施例实现的电路结构进行数据回采具体表现为:CPU发送出的语音数据,一方面传输至音频处理模块进行语音输出,此过程通过I2S OUT链路实现,另一方面传输至音效算法处理模块进一步处理后回传至CPU,此过程通过I2S IN链路实现,该回传到CPU的语音数据作为参考信号进行回声消除。
其中,音效算法处理模块内置设定的语音识别算法,该语音识别算法设置与音频处理模块的数据处理模式相一致,即内置于音效算法处理模块中的语音识别算法根据音频处理模块的处理方法自适应调整,以便最终实现整个产品的智能语音识别功能。
进一步说明的是,该第二实施例作为本实用新型的一个优选实施方案,通过增加一与音频处理模块的数据处理方法一致的音效算法处理模块,可进一步提高语音识别的准确性。
需要了解,本实用新型中提到的语音控制模块可以但不限于是CPU和主控芯片,音频处理模块包括DAC、PA、以及EQ和DRC实现音效处理,但不限于此,还可是PCM(脉冲编码调制)等,输出模块也不限于扬声器,具体地可以是诸如耳麦、耳机、小音箱或扩音器等音频输出设备,由此,电路间的连接可以是有线连接或者无线连接,有线连接如I2S链路连接、SAI(串行音频接口)连接、SPI(串行外设接口)连接以及PCI(外设部件互连标准)总线连接等,无线连接如WiFi、蓝牙、Zigbee等,均可配合相应的设置实现智能语音识别产品的数据传输及语音识别功能。
本公开所提供的实施例中,应理解到,所揭露的相关电路和回采方法,可以通过其它的方式实现。例如,以上所描述的回采电路,其实施例仅仅是示意性的,例如所述部分或模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个部分或模块可以结合或者可以集成到一个系统,或一些特征可以忽略或者不执行。已描述了各种操作和方法,但这些操作可选择地被添加至这些方法和\/或从这些方法中移去。另外,尽管回采方法中示出根据各示例实施例的操作的特定顺序,但可以理解,该特定顺序是示例性的。替换实施例可以可任选地以不同方式执行这些操作、组合某些操作、交错某些操作等。设备的此处所描述的组件、特征,以及特定可选细节还可以可任选地应用于此处所描述的方法,在各实施例中,这些方法可以由这样的设备执行和\/或在这样的设备内执行。
本公开中各功能模块都可以是硬件,比如该硬件可以是电路,包括数字电路,模拟电路等等。硬件结构的物理实现包括但不局限于物理器件,物理器件包括但不局限于晶体管,忆阻器等等。
以上的详细描述通过使用示意图、流程图和\/或示例,已经阐述了该智能语音识别产品音频回采电路的众多实施例。在这种示意图、流程图和\/或示例包含一个或多个功能和\/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和\/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和\/或共同实现。在一个实施例中,本公开实施例所述回采电路的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机系统上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为固件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和\/或写入软件和\/或固件代码的能力。
虽然已参照几个典型实施例描述了本公开实施例,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本公开实施例能够以多种形式具体实施而不脱离公开实施例的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。
设计图
相关信息详情
申请码:申请号:CN201920724718.3
申请日:2019-05-20
公开号:公开日:国家:CN
国家/省市:11(北京)
授权编号:CN209731554U
授权时间:20191203
主分类号:H04R3/00
专利分类号:H04R3/00;G10L21/0208;G10L15/20
范畴分类:申请人:北京声智科技有限公司
第一申请人:北京声智科技有限公司
申请人地址:100086 北京市海淀区北四环西路67号3层306室
发明人:陈孝良;高均波;常乐
第一发明人:陈孝良
当前权利人:北京声智科技有限公司
代理人:张宇园
代理机构:11021
代理机构编号:中科专利商标代理有限责任公司 11021
优先权:关键词:当前状态:审核中
类型名称:外观设计