随着时代的发展和科技的进步,相机产品的功能和性能都有了很大的提高。从应用范围来看,除了配合PC使用,摄像机还广泛应用于视频会议、直播、送货等商业领域。为了改善相机体验,很多厂商在产品中加入了很多新技术,比如让相机对焦更快更准,让相机拥有更好的音频体验。这一期,我们来聊聊相机上那些音视频黑科技。
Rocware RC08左侧有扬声器,右侧有摄像头,其TOF激光对焦系统位于摄像头边缘。
市场痛点:全功能相机很少。以“相机”为关键词搜索电商网站,会发现大部分产品只集成了麦克风功能,带扬声器的相机并不多见。那么为什么很多相机没有集成扬声器呢?首先,扬声器集成后,成本会增加;其次,扬声器和麦克风都集成在一个摄像头上,麦克风采集音频时会遇到扬声器发出的声音,导致扬声器发出的声音再次被采集,然后通过扬声器播放出来,形成一遍又一遍的回声。如果调整不好,会影响用户体验;最后,如果麦克风不支持噪声抑制,当环境中有其他噪声时,会影响音质的获取,对方和自己的音质都会大打折扣。如果加上噪声抑制和回声消除,这将进一步增加成本,这也是为什么很多相机没有扬声器的原因。
目前市场上集成麦克风和扬声器的相机不在少数,但大多数都是鲜为人知的品牌。这类产品通常采用100元以内监控摄像头的方案,麦克风拾音效果差,音箱谈不上音质,只能满足用户“听一个声音”。由于成本限制,不支持专业噪音抑制、回声消除等功能。
另外,在画质方面,虽然目前很多相机已经把分辨率提升到了4K,但是对焦还是有很大的问题。比如一台用于MC评测室直播的中高端摄像机,往往存在对焦慢、对焦不准、重复对焦的问题。也就是说,目前大部分相机只注重拍摄的分辨率,而在音响和对焦方面存在不足。
那么市面上有没有音质优秀,功能多样的相机呢?有,但是产品很少。我们在市面上找到了一款各方面性能均衡的相机:Rocware RC08,号称是集全高清摄像头、全向麦克风、全频扬声器于一体的相机。同时内置3A算法(AEC/AGC/ANS)、TOF激光聚焦等黑科技,支持全双工对话。由国内著名影音通讯设备品牌威海德推出。那么,这款产品真的能解决用户痛点或者说“老太太卖瓜”吗?接下来我们就拆解一下,分析一下它的内部材质,分析一下它的3A算法黑科技。
010-350000
Rocware RC08的拆卸图
010-350000
Rocware RC08框架结构图
SSC333主控芯片SC2239图像传感器HT8693功放芯片拆解可以看出,Rocware RC08采用的是一款SigmaStar(厦门陈星科技有限公司)SSC333主控芯片,广泛应用于家庭监控和摄像头领域。公开资料显示,SSC333采用单核设计,主频800MHz,基于ARM Cortex-A7架构。SSC333虽然内核数量少,但是集成度非常高。比如内置ISP图像信号处理器,H.264和H.265以及MJPEG视频编码器。
此外,它还支持音频输出,并具有音频模数转换器(ADC)和数模转换器(DAC)等外设接口,实现扩展的灵活性。SSC333兼容G.711、G.726和ADPCM音频编码格式,还可以支持3A(AEC、ANS和AGC)音频算法,这也为Rocware RC08的音频性能奠定了基础。此外,SSC333内置512MB DDR2内存,支持WDR、多级降噪、多种图像增强和校正算法,能够提供更好的画质。
010-350000
Rocware RC08中使用的SigmaStar SSC333主控芯片结构图
配合SigmaStar SSC333主控芯片,还有SmartSens(上海四维)的SC2239图像传感器。这种CMOS主要用于监控系统、网络摄像机、行车记录仪、运动摄像机和视频会议摄像机等领域。SC2239像素为200W,像素尺寸为2.9m2.9m,尺寸为1/2.8英寸。最高可支持19201080@30fps分辨率的图像。SC2239光敏度高,38dB的高信噪比,还支持850nm/940nm波长的红外灯。
为了让相机有更好的声音表现,Rocware RC08加入了一颗嘉兴何润电子科技有限公司生产的HT8693单声道功放芯片,这是一款音频功放,具有AB类和D类工作模式。在D类模式4 负载下,可连续输出11W功率。芯片具有防断音输出控制功能,可以自动监测输入声音信号幅度过大导致的断音问题,改善音质。此外,它还集成了无滤波器数字调制技术,可以直接驱动扬声器,最大限度地降低输出信号的失真和噪声。
010-350000
Rocware RC08使用的HT8693单声道功放芯片支持AB和D两种工作模式。
可见RC08在机身最重要的核心芯片都是中国企业的自主产品,这也说明在视频监控和摄像头领域的芯片已经自主可控。当然,为了保证产品质量,RC08采用的芯片都是国内头部企业,真正实现了自主替代。
3A算法黑科技大幅提升音频性能。如果说硬件是产品的躯体,软件是灵魂,那么算法就是中枢神经。优秀的算法可以充分发挥硬件的性能。为了让Rocware RC08在音频效果上有更好的体验,在用算法技术匹配麦克风和扬声器的同时,可以消除噪音和回声干扰。相信很多读者都很好奇这是怎么实现的。接下来我们就来分析一下它的算法技术。
Rocware工程师为RC08提供了出色的3A算法——AEC(声学回声消除)、AGC(自动增益控制)和ANS(主动噪声抑制)。那么这个3A算法是如何工作的呢?
010-350000
AEC回声消除算法技术的原理本质是比较声音,然后消除噪音。
如果RC08的音箱在播放声音,声音经过空间传播和反射后会再次被它的麦克风采集,而当它再次遇到声音时,如果没有AEC算法,会导致你在通话过程中反复听到自己的回声。AEC算法的功能是从语音流中筛选出不需要的回声。通常,最常见的算法是取消。AEC通过扬声器信号和扬声器产生的回声信号建立语音模型,然后通过它估计回声,然后不断修改滤波器系数,使建立的语音模型的估计值接近真实回声值。最后,从麦克风的输入信号中消除估计的回声值,从而消除回声。如果算法中的估计值更准确,滤波后的回声效果会更好。此外,AEC可以将麦克风的输入值与扬声器的输出值进行比较,然后过滤掉多次反射的延迟回声。
010-350000
AGC的作用是自动放大或缩小语音信号,使输出的语音不会忽大忽小,始终保持在人的听觉范围内。
那么问题来了,当输入语音信号较弱时,AEC算法是否不起作用?这时,AGC算法开始工作。日常生活中我们面对面交谈时,声音水平通常在40~60dB左右。如果两个人的距离稍微长一点,声音低于30dB,听起来会比较吃力。如果声音太大,比如超过100dB,会让人不舒服。AGC的作用是将声音调整到合适的范围。分为模拟调节和数字调节两种方式。模拟调节是通过麦克风采集,而数字调节是通过声音数据流的数字电平调节。当输入信号较弱时,AGC会自动放大语音信号,当输入语音信号过大时,会进行抑制,使输出语音不会大也不会小。
回声的问题解决了,其实还有外界环境的噪音,比如公共场所嘈杂的人声,播放音乐的声音等等。如果设备采集到这些噪音,会严重影响通话质量。此时,需要ANS噪声抑制算法。ANS算法的作用是抑制和消除干扰声音信号,同时提高语音信号的信噪比和语音清晰度,使人和机器都能听清楚。噪声有两种:平稳噪声和瞬时噪声,其中前者的噪声频谱相对稳定,而瞬时噪声的频谱具有持续时间短、无谐波的特点。利用噪声的特性,我们将反向波形加到声音数据中,最终消除噪声。
Rocware RC08使用全向麦克风采集语音和噪音信号,然后将麦克风采集的输入信号与数字信号进行比较,从而滤除环境中的噪音。这种单麦克风采集过滤噪声信号使用的算法更复杂,对算法技术的要求更高。
010-350000
根据噪声的特点和类型,在声音数据中加入反波形,最终消除噪声。
TOF激光聚焦:快速而精确。我们知道,自动对焦是手机、相机甚至投影仪的关键性能之一。Rocware RC08为了获得更好的成像效果,增加了TOF激光对焦模块。对焦的方式有很多种,如相位检测自动对焦(PDAF)、对比度检测自动对焦(CDAF)、激光检测自动对焦(LDAF)等等。因为相位对焦和对比对焦都是靠外界光感对焦,所以需要更高的环境光。如果环境光线暗,对焦速度会变慢。而激光聚焦法则没有这个问题。它发射红外线,借助反射的红外线计算被摄物体之间的距离,然后对焦电机开始移动进行对焦。即使在黑暗的环境下,也能实现快速对焦,但红外光发射的距离有限,更适合室内使用。像Rocware RC08这样的相机,采用激光TOF的组合,不仅可以实现快速对焦,而且更加精准。它可以计算从光源到被摄物体或人体的时间,从而计算出被摄物体或人体的深度信息。
010-350000
TOF激光原理。
相对而言,TOF激光对焦成本相对较高,非常适合视频会议、直播等专业应用场景。那么如何辨别相机是否使用激光对焦呢?以Rocware RC08为例。相机开机后,将手机的相机对准它的激光对焦发射器,手机屏幕上会出现红色的反光,证明是真的激光对焦相机。
写到最后,我们可以看到,其实一个小小的摄像头也可以有出色的影音效果。但是,产品的背后,需要扎实的材料,优秀的设计,优秀的工艺,才能在众多产品中独树一帜。Rocware RC08就是这样一款产品,有主控、COMS、功放芯片可供选择。通过3A算法(AEC/AGC/ANS)、TOF激光聚焦等黑科技,结合国际一线品牌音频调音,清晰呈现画质和语音。当然,这只是从硬件和技术方面的分析。实际表现如何?下一期我们会全面体验RC08,敬请期待。