安三美半导体音频解决方案可实现超低功耗语音交互应用。

音频/语音用户接口(VUI)是未来人机交互的一个重要的新兴趋势,将越来越多地用于智能家居控制、楼宇自动化、智能零售、联接的汽车、医疗等物联网垂直领域,这涉及语音触发、识别、处理技术,同时设计人员还面临如何提高能效的挑战。针对本地和云端,安森

音频/语音用户界面(VUI)是未来人机交互的一个重要发展趋势。在智能家居控制、楼宇自动化、智能零售、联网汽车、医疗等物联网垂直领域会得到越来越多的应用。这涉及到语音触发、识别和处理技术。同时,设计师也面临着如何提高能效的挑战。无论是本地还是云端,安森半导体都有相应的VUI解决方案,提供先进的语音触发、识别、处理、控制等功能,并拥有出色的计算能力和能效,保证用户体验极佳。

VUI建筑和分类

图1是基于麦克风阵列的高级语音接口架构。本地处理需要说话人跟踪和语音增强,包括波束形成、唤醒词检测、声源定位、降噪、语音检测等技术。云解决方案涉及自然语言处理。之后需要通过音频播放功能播放指令,需要回声消除。

图1:基于麦克风阵列的高级语音接口架构

本地VUI以预存的单词或句子为识别单元,说话人可以是特定用户,也可以是非特定用户,而云端VUI基于人工智能进行语义理解和语音合成,说话人是非特定用户。本地VUI通过蓝牙连接到网络,而云VUI通常通过WiFi连接。本地VUI的功耗和信息泄露的风险相对较低,而云VUI具有更高的识别率和可扩展性。相对而言,本地VUI比云VUI消耗更少的电力。设计者可以根据具体的应用需求决定是使用本地VUI方案还是云VUI方案。

本地VUI计划

根据本地VUI方案的特点,它必须能够进行双向语音通信,识别非特定用户语音,支持足够的指令和多种语言,并具有灵活性和可扩展性。最好将波束形成和降噪技术集成到单个芯片中,以降低成本和空间占用。比如安森半导体的单芯片方案LC823450,包括双皮质-M3内核,集成数字信号处理(DSP)用于语音前端处理,SRAM提供1656k字节的内存,不需要辅助存储芯片。它包括两个数字麦克风I/F接口和两个数模转换器,包括回声消除和降噪等高级功能。它具有极高的可扩展性、小尺寸和超低功耗。如果结合生态系统合作伙伴的语音控制技术,如Sensory的truly免提,可以支持唤醒词和语音命令的定制,适用于家庭自动化和音乐播放的语音交互。

图2显示了本地VUI方案的示例应用框图和评估板。安森半导体采用超低功耗音频处理单片机LC82345X、麦克风前置放大器FAN3852、LDO)NCP170、同步PWM开关降压稳压器NCP3170和单声道音频功率放大器NCP2823。凭借其在电源管理方面的经验和专业知识,安森半导体使该方案实现了超低功耗,这是该方案相比其他竞争对手的优势。虽然现有方案没有集成WiFi和蓝牙双模模块,但安森半导体已经收购了WiFi龙头Quantenna,已经拥有相关技术,未来会考虑集成WiFi模块。

010-350000

010-350000

图2:语音控制应用框图和评估板

云VUI解决方案

从应用场景来看,除了语义理解和语音合成,云VUI还可以推送各种服务。比如,除了播放音乐和讲故事,智能语音助手还支持智能零售,比如打车和点外卖。目前云VUI的一个痛点是工作频率高、外存和闪存多、功耗高、BoM成本高。安森美半导体的音频DSP系统单芯片(SoC)LC823455方案很好地解决了这些痛点。它集成了4M RAM,没有外部存储。除了CPU核之外,它还具有波束形成、降噪和回声消除的功能。它集成了预先实现的音频硬件(模数转换器、数模转换器和功率放大器),降低了BoM成本,并提供了更好的性能

图3显示了基于LC823455的智能扬声器的参考设计框图。该参考设计有四个ONA101V和一个ONA40功率放大器,包括USB-C PD源极/漏极接口,支持Strata平台。设计师可以自动识别并开始下载所有相关文档和支持材料,包括原理图、布局、测试报告、用户指南等。只需将此评估板插入配备Strata的计算机,同时会出现一个图形用户界面。这个参考设计目前支持亚马逊Alexa语音服务,安森半导体也在和国内的一些语音服务商接触,未来会支持国内的语音助手。该方案最显著的优点之一是其超低功耗。用竞争对手方案的功耗测试后,安森半导体的方案功耗大约是竞争对手方案的一半。

010-350000

图3:智能扬声器参考设计框图

安森半导体移动和智能扬声器的音频技术/知识产权

安森美半导体拥有丰富的知识产权,支持移动和智能扬声器的设计和开发,包括音频处理系统、D类功率放大器、麦克风前置放大和高性能音频开关,提供竞争优势,帮助设计师设计出具有竞争优势的产品。

音频处理系统的竞争优势包括小PCB尺寸、高度集成的SoC(CPU DSP音频)、集成的ARM Cortex-M3双核和专有32位DSP。

至于D类功放,支持小于10 W,10 W到30 W,大于30 W的应用只提供样片,其中小于10W的功放体积较小,采用模拟输入。10W至30W的功率放大器支持数字接口,提供最佳动态范围和增益误差漂移。

对于麦克风前置放大,安森半导体的方案使用最小标准音高的WLCSP封装,将模拟音频转换为数字音频,支持不同的传感器接口。

对于音频开关,Anson Semiconductor提供了阻抗/面积最小的耗尽型开关。

外围技术:USB类和D类功率放大器

USB Type-C使每个端口都可以是电源、数据、视频或音频端口,极大地方便了用户,并将越来越多地用于语音交互等各种电子应用中。安森美半导体提供完整的USB Type-C解决方案阵容,支持音频应用的开发,包括电源、多路音频信号、信号切换、接口保护等。具有最小的尺寸、超低的静态功耗,并集成了丰富的保护功能。

新兴的音频应用,如智能音箱,对功率放大器的要求越来越高。安森半导体开发了一系列额定功率超过10 W的D类功率放大器产品线,结合可针对不同应用定制的陶瓷封装技术、CMOS电路技术和功率MOSFET技术,提供低热阻、高频互连、高功率密度、低噪声(70 uV)和低总谐波失真(THD0.03%)等优势。以ONA101V为例,它是一款单通道数字输入D类功率放大器,动态范围为105 dB。具有喇叭采样数字输出功能。该功能对驱动喇叭的电压和电流进行实时采样,微控制器上运行的算法可用于计算喇叭特性。这些参数可用于计算喇叭电阻、混响、温度等。根据这些值,可以创建算法来执行一系列任务,从而实现喇叭保护、范围扩展等功能。

摘要

语音交互越来越普及,语音识别和自然语言处理技术是VUI的基础。安森半导体提供本地VUI解决方案和云VUI解决方案,集成了先进的语音处理技术,如波束形成、回声消除、降噪、超低功耗管理和外围设备,如USB Type-C和D类功率放大器。与生态链合作伙伴一起,大幅降低BoM成本,同时拥有出色的计算能力和超低功耗,提供出色的用户体验。

剪辑教程

拍视频要了解一些基本常识,新手如何拍摄视频

2022-7-8 14:13:20

剪辑教程

短视频运营技巧诉与成功案例,短视频运营技巧思维导图

2022-7-8 14:17:19

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索