1. 首页
  2. 生活常识
  3. AirPods语音唤醒好用吗(AirPods语音唤醒介绍)

AirPods语音唤醒好用吗(AirPods语音唤醒介绍)

简介:关于AirPods语音唤醒好用吗(AirPods语音唤醒介绍)的相关疑问,相信很多朋友对此并不是非常清楚,为了帮助大家了解相关知识要点,小编为大家整理出如下讲解内容,希望下面的内容对大家有帮助!
如果有更好的建议或者想看更多关于生活常识技术大全及相关资讯,可以多多关注茶馆百科网。

行业分析师预测,2019年苹果AirPods的出货量将超过5000亿,2021年将超过1亿。这款产品因其推出而受到嘲笑,但后来却成功地引领了市场,长期以来一直是追赶的对象。近几十年来,耳机行业并没有发生太大变化,TWS给这个市场带来了数百亿美元的增长潜力。

AirPods已成为苹果增长最快的配件之一,因此在销量下滑之际,每个手机制造商都必须重新夺回市场的主导地位。

AirPods不仅重振了音频市场,也成为了苹果等手机厂商的生命线。TWS耳机的下一个战场是语音交互、骨印支付识别和eSIM独立使用。

TWS耳机被称为2019年消费电子市场的最大亮点。智能语音识别的加入,将继续扩大TWS耳机的市场蛋糕,并吸引五家玩家入局:

运营商入口:联通、移动,可以独立使用耳机产品;

互联网巨头抢占市场:亚马逊,百度,微软,百度;

电子商务与支付:b微信、支付宝、骨纹识别、安全支付,从手机支付到骨纹支付。

手机厂商继续增加他们的存在:苹果、华为、bb0、三星、索尼、OPPO、荣耀、一加和魅族都推出了自己的耳机产品。

内容平台紧随其后:QQ音乐、网易音乐、喜马拉雅FM,为TWS耳机提供源源不断的活力。

市场很久没有这么热闹了,仿佛回到了智能手机大爆发的早期繁荣阶段,再到八面三面四,各自取长补短,各取所需。

在上一轮智能音箱的争夺战中,我们看到了以苹果、谷歌、亚马逊、百度、阿里、腾讯、小米等为代表的先锋。在这些巨头的参与下,中小企业只能选择站队,躲在自己的阵营里,获取赖以生存的内容、流量、补贴等资源。

通过我爱音频网的分析,智能耳机的风口会比音箱更凶猛,更触手可及,今天我们就来探讨一下如何抓住智能耳机的风口。

1. TWS正在蓬勃发展,苹果凭借Airpods引领市场

近日,IDC发布了2019年第一季度全球智能手机市场报告。数据显示,全球智能手机出货量总计3.108亿部,同比下降6.6%。在全球出货量排名前六的制造商中,大多数也出现了同比下降,苹果甚至下降了30%以上。

与手机市场的冷淡形成鲜明对比的是,TWS蓝牙耳机正以令人难以置信的速度增长。Counterpoint的数据显示,2018年第四季度,AirPods占据了60%的市场份额,出货量为1250万台。

根据Above Avalon的数据,在过去的三年里,假日耳机在b谷歌上的搜索兴趣达到了顶峰,指数为100(代表最高的搜索兴趣)。该指数在2016年达到峰值,为10,2017年为20,2018年为100,比前一年增长了500%。

由此可见TWS耳机的巨大市场容量,音频和手机厂商也纷纷加入这一领域,势必要从这块巨大的蛋糕中分一杯羹。

2019年3月20日,苹果公司推出了全新TWS真无线蓝牙耳机——Airpods2。这次升级用新的H1取代了主控芯片。除了支持无线充电,还有一个很重要的一点就是语音唤醒。

其次,详细实现TWS耳机语音唤醒方案

Airpods的成功在于他们的体验质量,Airpods 2已经更新了唤醒语音,这是智能语音的重要组成部分,已经有很多支持iPhone的Hey Siri, bbbb9的小爱同学,三星galaxy S10的Hi Bixby等等。

0

苹果是第一个支持语音唤醒的,所以其他制造商是否可以效仿,以及如何实现它。需要考虑哪些技术细节?

首先,局部唤醒词在TWS耳机中的应用包括语音识别和假唤醒处理两部分:

1. 唤醒词语音识别(与本地语音命令相同)

唤醒词识别需要对前端信号进行处理,提高用户语音与背景语音的信噪比,从而在不同的应用场景下实现最高的唤醒词识别率。我们列出了从唤醒词识别开始到结束麦克风从用户那里收集到的声音信息数据。

完成唤醒词识别所需的算法依次为:

MIC(LPSD或VAD)(BF)(NS或NR)(KWD)

算法名称和参考供应商

LPSD或VAD,低功率声音检测(LPSD),语音主动检测(VAD),参见dsc和senory。

BF, BF(梁成形)指供应商dsc;

NS或NR, Noise Suppression, Noise Reduction (NS)指dsc。

KWD, KWD(关键词检测)是指供应商感官,人工智能语音,细微差别,Cyberon。

市场上唯一能够真正提供足够的计算能力,将这些算法与低功耗本地唤醒词功能集成在一起的蓝牙芯片是高通:QCC512x和QCC302x。

对于Loda、Resulus、Hengxuan等芯片产品,建议匹配QuickLogic S3、Ambiq Apollo2、Apollo3或Lou的IA-610、IA-611智能麦克风芯片,以满足高计算能力、低功耗要求下的本地唤醒功能。

所有算法或芯片必须经过合法授权使用并获得所有必要的技术支持。这些厂商的Quicklogic EOS S3是第一个将宇恒交互OVVP算法应用于实际客户产品的完整系统集成。S3芯片内部还有891个可编程逻辑单元,这些单元经过独特设计,可满足特定硬件接口的需要。

2. 使用唤醒字或语音命令唤醒不正确

误唤醒或误触发的定义:

TWS耳机用户和非TWS耳机用户在发出唤醒词或语音命令后,不响应唤醒词或语音命令,但在发出唤醒词后,可以唤醒或运行耳机用户的语音助手或语音命令。

市面上几种不同计划的说明:

2 - 1。基本处理

一般来说,在唤醒词算法组中,BF能在一定程度上起到降低误唤醒率的作用,但这与声源的方向有关。在两个传声器之间距离足够远,并适当调整产品声学结构的条件下,dsc的BF算法可以达到3db~6db。

详情请咨询dsc代理商Leaf Intelligent Technology。他们拥有非常专业的声学专家和实验室,可以为TWS耳机制造商提供充分的声学设计服务。

2 - 2。使用vpu骨传导传感器

具体操作请参见HUAWEI HUAWEI FreeBuds2 Pro vpu (Voice Peak Up)。

vpu是严格意义上的单轴加速度传感器(Voice Pick Up Sensor是一种高性能加速度计),采用压电材料技术(因为相关信息无法从数据表中获得,只能从类似产品中推断),主要用于检测声带运动,是Sonion的产品。

从-25dbv/g的输出强度线来看,最大带宽可以从100hz到8khz完全覆盖人类声音频谱的范围。整个频谱的响应并不平坦(尤其是3khz~5khz刚好处于人声的高频段),这就需要高频负反馈的放大器来平滑后一段。

该传感器还具有低功耗的优点(当VDD=1.8V时电流为55ua)。由于输出是模拟信号,电平不足,如果作为VAD使用时A/D采样的分辨率足够,则有机会在没有运放的情况下做一个VAD,使传感器在打开麦克风前先检测到声音,从而达到降低功耗的效果,但由于vpu是模拟输出,需要匹配芯片中的A/D转换器和算法。它还取决于芯片的功率,对于麦克风的功率是没有划分的。

这种单轴骨传导加速度计在产品结构中的放置点需要考虑vpu在用户使用过程中松动后输出声音信息强度会发生滑动的补偿问题。

华为FreeBuds2 pro需要支持骨语音支付,所以需要更好的保证语音可以用于语音识别。在vpu不能保证足够动态范围的情况下,声学带宽范围的放大是不可避免的,这将显著增加功耗、器件数量和装配工艺以及测试难度。

加入高频负反馈放大器增加低频以增加动态范围,同时也拉起人体运动的低频信号,vpu的自然高通滤波效果较差,再加入高通滤波算法滤除人体运动引起的传感器机械瞬态变化所引起的多重谐波干扰,除了调用;音乐应用场景中喇叭振动的串扰问题仍有待解决。

因此,从iAiaudio拆解的华为华为FreeBuds2 pro板上,确认确实有运算放大器,并且增加了一个DA14195来处理各种算法和A/D接口。本产品使用wakeword的灵敏度约为76db(在OVVP灵敏度规格范围内)。

而唤醒字错误的唤醒处理可以达到19db~22db(在OVVP语音强隔离掩模规格范围内)也相当不错,使用加速骨传导传感器检测声带振动而只使用麦克风检测用户的语音语音差异是,在唤醒字或语音命令时,声音音量肯定更大(约7db差异),这个大厂设计的产品还是很有代表性的。

此外,该产品还具有多个本地语音命令,既充分发挥了vpu的优势,又充分发挥了vpu的优势。与苹果不同的是,用户说话需要稍微“大声一点”,但假唤醒处理比苹果好很多,并且对声源方向没有限制,可以在任何方向使用。

vpu主要用于检测用户的语音,辅助完成对安全性要求较高的支付功能。没有“静音”的语音频谱结构缺陷是否会严重影响用户体验,目前尚不清楚。

Recode采用骨传导传感器,无需声音补偿,将“code”、“Strange”译为“change”、“AWEI”译为“HUAWEI”、“river”译为“goose”、“Fu”译为“no”、“money”译为“speech”。

声音结构的改变会导致人工智能语音识别出现严重的错误,知虎看到很多关于这方面的抱怨,用户很刻意地大声说无法完成支付或者声纹学习,似乎是觉得这个问题没有解决好,当然也可能是Freebuds2 pro在单词识别引擎处理上不好或者有些不好。

从行业来看,华为开了个好头,领先苹果几个月以上。它将TWS耳机的智能化步伐加快了几步。几十年来,在专注耳机音质和噪声水平的同时,注入了智能语音应用的亮点和活水,教育了大众,激发了行业活力,使行业有可能再次扩张,引领新浪潮。

2 - 3。MEMS加速计骨传导传感器(升压降噪)

苹果Airpods,其中使用了多种工具(LPSD、BF、骨导和降噪),唤醒词误差唤醒效果约7db~9db(用户身后0.5米环境噪声45db相比只有BF和NS开发板唤醒词)。

AirPods支持唤醒词(本地,云,或本地+移动),所有语音命令都在云端。云的优点是词语的无限灵活性,只要语义相似,识别精度更高,抗噪声能力更强,占用本地芯片资源更少。缺点是无法连接互联网或互联网质量不好。响应时间较慢。

除了压电材料的vpu(模拟量输出)外,采用MEMS技术的ST意法半导体LIS25BA (TDM接口)是目前市场上唯一可以用于向上降噪的加速度传感器。LIS25BA是一款全数字产品,包括A/D和TDM接口。信息可从ST意法半导体获取。

虽然市场上已有传感器可用,但仅限于保护覆盖范围强而严谨的苹果专利和承担改变上行音频数据结构风险的技术难点,目前市场上还没有流通专用的降噪算法,dsc、Sensory、Qualcomm这些知名算法都没有明显的动作;但国内一些MEMS麦克风厂商和一些国内算法公司已经在窃窃私语。

下面就骨传导向上降噪算法的难点提出一些看法。由于我的技术能力和知识范围有限,请对这些谬论提出建议。在这里,我们简要讨论下行骨传导和传声器融合的上游降噪技术。

0

《国防科学技术大学研究生院工程硕士学位论文:面向骨传导语音消噪算法及硬件实现技术研究》

本文以非负稀疏编码(Non-Negative Sparse Coding, NNSC)作为消噪的核心主体,提出了一种利用AMDF (Average Magnitude Difference Function)技术消除风噪声的VAD算法。枪声,摩擦声。

这不是苹果使用的降噪技术,但它可以让你对骨传导降噪或VAD有一个初步的了解。本文对人类理解的对象进行测量,采用骨传导传感器检测到的声带振动作为主要声源,采用传统的麦克风作为噪声源,通过算法完成降噪。

但现在可理解性不仅由人来衡量,也由机器(语音识别算法)来衡量,而且机器对可理解性的要求比人类高得多,因为机器在语音识别方面的整体智能远不如人类。

在这里,我们以苹果公司的TWS耳机为参考标准,编制了一个对比表,对比在处理降噪问题后,如果两个完全不同的声传感器感知到的声音信息数据与一个声传感器感知到的声音信息数据相等,可能会面临多少问题和挑战。

下面是根据上表做的文字列题说明:

1)双麦上游降噪算法技术的最终目标是只留下用户的声音,最大程度地消除或抑制非用户的声音

风拾到的用户原始语音信息数据完全相同。

2)算法采用加速骨传导传感,改变过去空气介质传导的声能来推动一定的材料

将膜转化为电,将软骨肌皮肤介质转化为传导声音,但算法仍然使用两种利用空气传导声音的介质

加速度骨传导传感器的传声器无法检测到静音的缺陷,空气传导稳定性高,变化少,经度大

对应用有更透彻的认识,并通过软骨肌皮肤介质进行声音传导,除不稳定变量外

应用程序仍在不断增加,苹果拥有的应用程序比世界上任何一家公司都多。

3)下面我们列出了算法需要完成的几个方程:

1。加速骨传导传感器+双麦克风=双麦克风

-2、(软骨肌皮肤汗液、油渍、灰尘介质传递变量)+空气温湿度介质传递变量=空气温湿度

介质转移度变量

3所示。单浊音+(浊音+不浊音)=浊音+不浊音

4所示。产品结构和耳廓结构影响严重+产品结构影响=产品结构影响

5。严重受人体运动影响+不受人体运动影响=不受人体运动影响

6。人工算法融合拼接补偿两种不同材料,不同传导介质结构,不同响应相位严格延时,低频调制

完美地融合在一起

4)对于麦克风上行信息数据,这些信息数据用于监听、存储和传输信息。它们是可靠的信息数据,具有广泛的可扩展性和可重复应用性,需要满足市场上现有的数百种可靠的应用软件和硬件的要求。

项目决策者必须谨慎行事,缓慢地计划项目的两个步骤,然后系统地观察谨慎的测试。

苹果公司在2012年之前开始研发,并于2012年9月28日提交了第13/631,716号专利,于2014年4月3日提交了第WO 2014/051969a1号专利。Airpods于2016年9月8日推出。Airpods 2于2019年3月20日上市。

这么大的龙头企业花了8年时间积累,所以不要小看这项技术。此外,国内市场上这些可能的算法供应商不太可能有苹果这样的长期积累,因此能否实现弯道超车还有待观察。

由此可以合理推断,W1或H1芯片中的向上降噪技术可能是使用计算能力最多的程序。估计H1芯片在下行环境下仍保留了一些计算能力资源,用于未来降噪。

目前市场上的TWS耳机蓝牙芯片产品需要在低功耗的要求下满足该算法的计算能力要求。高通的最高DSP QCC512x在低功耗的限制下也需要不断努力才能实现。

5)在加速度骨传导传感器中加入各种力学瞬态变化和环境应力老化的物理特性。许多声学应用的信息技术和算法模型需要更系统地探索和探索。其中,声音的补偿和两种不同传感器检测到的声音信息数据的融合导致了声学谐波组成的结构性变化。它会对云中现有语音语义识别算法的可理解性产生多大影响?人耳很难听到但对语音识别算法可能致命的变化需要仔细的测试和评估。

6)在Airpods 1的最后几年里,感官算法供应商没有任何下一步行动。这是一个报酬丰厚的市场,有很多算法需求,值得探索这些供应商保持沉默背后的原因。

7)算法需要解决相位失真,总谐波失真压制,信噪比保证,非用户语音的噪声判断转换压制比(纯浊音,纯清音),算法延迟,骨导声与麦克风声在不同情绪,音量条件下融合自适应或权重变化曲线,人体运动信息低频调制及多次谐波抑制,清浊音互换响应状态,降噪处理后的声谐波结构变化,耳机松脱后音量频响包络补偿。

8)算法要解决加速度骨传导传感器感测到的浊音声带运动与双麦克风在不同情绪,音量条件下所感测到的浊音+清音2 个不同声音间的实时同步,重叠,拼接,融合处里所产生的谐波失真修补,平滑,滤波或压制。

9)上行降噪最重要的应用场景就是在通话场景,使用骨传导与麦克风融合降噪技术在大音量通话场景下就像把扩音器的麦克风贴在喇叭上,相移量足不足够可能引起严重的串扰,所以不能只盯在降噪上。

对于器件密度极高的TWS 耳机来说,使用骨传导传感器来感测完整人声的应用,被自身加噪才是最大问题,同时还需要用麦克风声信息数据来补偿清音的声音缺陷信息数据。

在通话场景时关掉降噪算法或降低融合权重,做个伪骨传导降噪或者用户能拿到厂家给的有苹果50%降噪效果功能的算法产品,却需承担100%的侵权风险可能!

喇叭造成的串扰图

10)为稳定的取得最完整的用户声带运动信息数据,如何最佳化设计耳机结构,找寻加速度骨传导传感器所在的位置及适当使用导声材料,单轴的vpu在位置,导声材料,产品结构,运动松脱,耳廓结构,生产工艺问题上影响远大于3 轴的LIS25BA,这是所以苹果用了3 轴加速度计的可能原因。

11)利用不同人发出不同音量大小的/s /,/sh /,/f /,/he /……等纯清音,单由双麦克风检拾出来的声音,对比融合骨传导声音信息及麦克风声音信息降噪算法后的声音,验证融合算法自适应权重调整的处理效果,这里是一个两难的选择,因为清音处理的越好降噪效果就要打折,降噪效果越好清音就越听不清楚。

若因而导致唤醒词,语音命令或云端语音辩识服务器,手机语音输入法,翻译,语音转文字APP 的辩识效果打了大折扣,在解决这个问题前,去使用到Amazon,Google, Microsoft,百度,阿里,腾讯,科大讯飞语音助手云端语音辩识的产品就要面临比较大的风险。

骨传导上行降噪在形成实际产品前有很多细微的研发生产测试支节参数需要仔细琢磨调试,耗时极长,大家可以从iFixit 拆解Airpods 从其内大量使用黏着剂固定,就能看出为了满足测试和维持性能指标,其组装工艺的巨大难度,一个带骨传导上行降噪的产品,在相关技术确定成熟了的条件下,从外观规划开始到出货花个1 年估计算快的了,或许远远不够。

2-4、使用ST LIS2DW12(SPI 接口)加速度计传感器+OVVP 算法(骨声纹用户说话识别)

传感器选型:OVVP 算法因为对噪声密度,分辨率,带宽,ODR 及传感器内部高低通滤波器有一定的限制及要求,眼下需指定搭配性价比最高的ST LIS2DW12 传感器。

OVVP 算法与手机声纹识别比较说明:

这是我们客户曾经提过的一个代表性的问题,使用贵司的OVVP 算法看起来跟使用手机上的声纹识别效果类似,为何还要多此一举呢,下面我们做个对比:

1)声纹识别需要针对特定字词做学习训练OVVP 不用;

2)声纹识别只能对用户训练过的字词做局部保护,OVVP 则是对每个字词做全局性保护,

3)声纹识别的安全级别远高于OVVP;

4)声纹识别易受用户环境,情绪,声哑病痛影响,OVVP 不会;

5)声纹识别只能对用户训练过的字词产生语音强隔离效果,OVVP 则对每个字词都能强隔离;

6)OVVP 算法是使用用户既有的加速度传感器与声纹识别一样不需外加硬件成本;

7)OVVP 算法可同时并存双击,计步,心率……等算法,声纹识别则无关;

8)声纹识别没有伴声记号,OVVP 的伴声记号可以用来做2 次研发延展应用;

利用伴声记号与手机语音应用APP,强联结提升用户体验:

伴声记号是经由加速度传感器感测到用户说话时的声带运动,通过OVVP 算法处理后,随着用户说话的字词产生的信息数据,最大的特征是只有戴耳机的用户“说话的时候”才会产生这个信息,戴耳机用户旁边的人说话声音小于语音强隔离护罩时,是无法产生这个信息数据的,我们客户产品语音强隔离护罩,能做到50cm 100db 的程度。

伴声记号用法:

伴声记号(下图),是与麦克风声音数据一同通过蓝牙传送到手机端,通过2 者同步后相互参照,可以知道用户何时说话及说了什么话。

翻译软件很多人用过,特别是谷歌翻译,相当好用, 翻译软件选择好翻译的语种后,说话前要先按下屏幕上的麦克风按键,然后说一句话,说完后停下等待翻成另一个语言,然后从手机喇叭播出,这个按下屏幕上的麦克风按键可以用伴声记号取代。

只要用户说话就自动压下屏幕上的麦克风按键,停止说话就翻译成另一个语言,通过喇叭播放出来,不用去按麦克风按键的翻译软件是不是更自然方便。

而带着伴声记号的用户说话声可以让语音辩识算法,除了肯定是近场拾取到用户自己说话的声音之外,快速得到声音的起点,停点这3 个重要信息可以有效优化语音识别算法的应用体验。

这类语音应用软件除了翻译软件外还有很多,如,微信语音短信息,录音机,语音输入法,语音助手,语言学习,手机驾驶模式,语音转文字……等。

而与伴声记号同时存在的声音强隔离护罩,更是让用户在多人高密度及较吵杂环境,语音识别算法不用兼顾远场拾音问题,可以得到相互最低影响的效果。当然若能再有骨传导上行降噪能力,肯定是美事一桩,完美的不要不要的了。

伴声记号可以通过蓝牙送到手机端,搭配麦克风信息数据,用在语音助手,自动录音,自动翻译,自动发送微信语音信息,语音输入法,驾驶模式,游戏……等各类语音相关应用。

OVVP 应用到的相关技术:

OVVP(Own Voice Vibration Peak-up)技术在应用上尊循一个最大的原则,就是不改变任何原有的声音处理路径上的信息数据参数结构,因为这些是多年积累下来的经验与技术结晶,任何的改动都有机会引发不可收拾的风险,碰触到众多人的利益,所以我们另辟一个新路径以辅助性角色为客户的TWS 耳机在人工智能语音应用区块,以最完整专利配套零风险的为客户创造价值。

下方是在TWS 耳机内OVVP 的运作框架图:

OVVP 算法技术细节简述

1)算法涉及卡尔曼滤波,FFT 极窄带声谱面积分割计算,曲线拟合,为了不惊动蓝牙芯片原厂能让算法直接用于蓝牙芯片应用层。通过泛化,降维,查表,不断优化简省整体延迟时间,使用内存资源,功耗及算力,从算法做出功能到给客户做测试, 1年多的时间才逐渐成熟,更别说骨传导上行降噪了。

2)加速度传感器感测到感测到的X,Y,Z三轴声带运动信息数据,亦涉及X,Y,Z 三轴信息亦涉及互相关及归一化。

3)在最少影响极窄带区间频响的条件下,如何有效的将加速度传感器感测到的声带运动信息数据与用户自体运动所带起的多次谐波及喇叭串扰间进行分辨与压制。

三、语音算法各家公司专利保护重点分析

苹果专利的完整程度及保护范围级为完美, WO2014051969A1,201380046944.6 这2个专利把使用加速度传感器本地唤醒词与上行降噪应用保护的滴水不漏,从带算法芯片,方案,模块,产品到销售整个链条都被包含进去。

知名上市公司需要非常慎重的对待,对提供使用传感器做骨传导降噪或VAD 应用的一定需要查询清楚是否有足够保护的专利或请对方提出具备闪躲苹果专利的具体对策,签署不侵权保证书,同时给出承担被诉后损失的承诺,项目负责人简单的问方案商有没有专利问题。

另外对于使用vpu 做VAD 当然就需要查看确认华为的201811199154.2 专利,要特别提醒的是苹果的2个专利一样覆盖到了vpu 基本上耳机用任何加速度骨传导传感器的上行降噪或VAD 都被包含在内。

当然,用MEMS 加速度传感器做VAD 宇恒公司的200910190129.2,201810437831.3 也是特别需要去关注的。

专利侵权的判断中许多人员(特别是工程师或技术人员)会容易遇到认知误区,认为使用的技术比权利要求上的技术特征多,方法不完全相同,就不侵权。

其实侵权的判定是只要专利证书有效合法,满足权力要求内所有技术特征或技术框架,不管再往上叠加多少技术,不管你知道这个技术或应用技巧再久,专利没有被无效之前,侵权都是成立的。

另外技术特征或技术框架的判定有相同(完全一样)及等同(相似),“等同”这里允许一定的模糊空间,若有争议则可以再从专利说明书内去补充或其他行业信息内去举证。

之所以以前行业内专利侵权诉讼不多或经常不了了之,是因为举证成本,审理时间相对于产业变化速度及回报效益不成比例。

但现在整体智识产权维权大环境有了结构性的改变,就算不能短时间内在法院取得胜诉判决,在电商渠道却可以很快的斩断侵权者的利益,商誉及市占率的大量丢失。

特别是TWS 耳机AirPods目前已经成为苹果公司营收最重要的上升机会,该公司应对侵权会实施更加严苛的方式。

上市公司或知名企业的项目负责人需要慎重,以免对任职企业造成巨大伤害,而解决专利侵权的办法只有自己提早佈局创新,或合法取得授权及购买拥权产品,别无他法。

下方列出近一年国内专利保护较重大的变化:

1、2019 年1 月1 日开始实施的电商法(关联法条41 条~45 条)

2、38 个部门和单位联合印发《关于对知识产权(专利)领域严重失信主体开展联合惩戒的

合作备忘录》

3、深圳经济特区知识产权保护条例(经市第六届人民代表大会常务委员会第二十九次会议于

2018 年12 月27 日通过,并将于2019 年3 月1 日实施其中关联法条19~27,43~46)

新的仲裁单位与诉讼法院有:

3-1、2018 年12 月25 日成立的中国(深圳)知识产权保护中心

3-2、2018 年7 月28 日在琶洲环球贸易中心成立的广州互联网法院

3-3、2018 年9 月09 日北京互联网法院挂牌成立

四、专利侵权分析

1、苹果公司专利201380046944.6

使用专利摘要,专利说明书及个人音频设备唯一独权内的技术特征做分析,专利内用了一个模糊的字眼,骨传导拾取换能器,在说明书[0005]条尾端也提到了加速计,这个专利适用的对象是TWS 耳机成品制造商,只要用到骨传导拾取换能器(包含了MEMS 加速度计及vpu),并用到专利中的20 条权利要求中的某条权利,基本上就会导致侵权。

其中很关键的地方是,使用“软材料”在壳内填充改善传感器取得声带振动所产生声波的效果,这点要请声学研发人员特别关注,这是搞声学的人最常用的手段,而下图表示TWS 耳机厂家可能拿骨传导拾取换能器来做的6 种功能,都在苹果专利的保护范围内。

苹果公司专利WO2014051969A1

使用专利摘要及2 个独权及权利要求2.5 内的技术特征做分析,这个专利用了37 个权利要求主要保护VAD,噪声抑制及清浊音互融的应用,基本上只要用了加速度计(MEMS,vpu 都算)及麦克风就满足权利要求的技术特征,其中权利要求5 把麦克风阵列给补充了进去。

所以看到这几个权利要可以很明确的说,不管骨传导上行降噪算法的提供者用的是MEMS 或vpu 加速度传感器加上麦克风(不管是1 个或多个)都是侵权。

当然,若是不用麦克风或加速度传感器其中任何一种传感器,就有机会闪躲掉这个专利,更好的办法是拥有比苹果更早的专利做保护,这个专利强的地方是判断侵权非常简单,不用找专业鉴定单位就可以做出清楚的侵权判断。

目前推测苹果公司有2 个方法可以选择:

方法1:

拉出电商法,通过各电商平台的维权渠道投诉,就可以很快的让侵权产品下架,判断方法是,先看产品规格或功能介绍有没有VAD,噪声抑制功能若有,则再看产品内有没有加速度计(MEMS 或vpu),若有,就是侵权了。

上电商平台投诉渠道买个侵权产品拆解拍照写好侵权对比书,上传,15 天内被诉商家提不出反投诉或相应不侵权证据,侵权产品就等着下架吧,省钱有效。

方法2:

直接从市场取证,鉴定,上法院起诉,交压金,封所仓库。

知名品牌厂商如:HUAWEI华为,VIVO,OPPO,联想,小米客户群体与苹果重叠面积较大,苹果的更为重视。

关于华强北的市场,因为客群与苹果不重叠,被投诉主体太小,可以起到帮苹果培养未来潜力客户。

这项专利很严格,需要市场上的同行谨慎规避。

2、华为公司专利201811199154.2

使用专利摘要及1 个方法独权14 及权利要求15 内的技术特征做分析,华为这个专利可以用图穷匕见来形容,前面系统独权1 及权利要求2~13 基本上好闪好躲又多属芯片内的处理或算法软件,不易取证鉴定,但是方法独权14 及权利要求15 同样的非常严格,容易涉及侵权。

把重点突显在使用骨振动传感器来控制拾音设备开始拾音,这个权利要求满足TWS 耳机行业内极为关键的低功耗要求,华为在专利说明书[0047]条里提到Sonion 公司的骨传导传感器,就是vpu 了。

所以华为这个专利侵不侵权很好判,首先确定是否有vpu,然后用实体耳机通过量电流的方式确认,说话前后的电流差别及比对麦克风的拾音时机即可。

所以想利用vpu 做VAD 来降低功耗的方案,估计不好实现,另外这个专利的权利要求2~13 条其内每条都是算法或功能性软件,华为将这些算法或功能软件逐条拆解成权利要求,也方便他日后使用专利维权打击对手。

3、宇恒公司专利200910190129.2

使用专利摘要及2 个独权内的技术特征做分析,使用加速度传感器,感测声带,双击或计步运动,通过算法处里计算后,查找(判断,对比)是否落在预设阀值区间,得出用户“何时说话”判断结果,协助决定语音助手键码或何时说话判断结果(命令字)是否要通过蓝牙传送到手机。

只要依据加速度传感器获取用户声带运动的VAD,做为“是否传送出语音助手键码的参考或何时说话判断结果”,不管是否还带有上行降噪功能都算是侵权,这个专利的申请时间落在2009 年,是个能够攻防一体的专利。

宇恒公司专利201010224769.3,201010224780.X,201010224803.7,201010230464.3,

201010243048.7,201120374763.4,包含进去了加速度,陀螺仪,地磁仪,气压计多种惯性传感器感测声音的应用,申请时间都落在2010 年~2011 年,能在传感器VAD 应用上,起到绝佳的防御作用。

有兴趣做骨传导上行降噪算法的团队或公司,宇恒互动有兴趣将专利提供出来,一起研究如何用这些专利组合找出方法,至少先在中国突破苹果专利封锁,增加谈判筹码,降低自己及未来客户的风险。

宇恒公司专利201810437831.3使用专利摘要及2 个独权与权利要求16 内的技术特征做分析,使用1 个或2 个,单轴或多轴,模拟或数字加速度传感器来感测声带振动和/或人体面部皮肤肌肉及肢体运动,产生传感器VAD 的控制信号,不管用的是MEMS 或vpu 加速度传感器及是否还带有上行降噪功能都算是侵权。

使用MEMS 或vpu 加速度计做VAD 或上行降噪应用,先把专利风险考虑完,再看这些应用是否满足功能指标要求,系统性充分全面的测试过再用声结构的改变是非常难实现的。

海内外知名人工智能语音应用巨头,在对OVVP算法了解过程中,非常着重要求专利说明,显然这个问题对这类企业来说影响很大。

总结

随着旗舰手机逐渐取消3.5mm接口以便实现轻薄化的趋势,续航、传输、音质、价格等痛点得到了改善,对整个TWS耳机市场的放量带来了巨大的成长空间。

根据GFK数据,2016年无线耳机出货量仅918万台,市场规模不足20亿元。到2018年无线耳机出货量同比增加41%,市场规模将达54亿美金。到了2020年TWS无线耳机的市场规模将达到110亿美金。

智研咨询预计2018-2020年全球TWS耳机将实现高速增长,出货量分别达到6500万台,1亿台和1.5亿台,年复合增速达51.9%。预计随着无线耳机音质,功能性持续改善及与人工智能语音APP应用深度扩展联结,未来无线耳机的渗透率有望继续提升。

这样巨大的销量增长空间,让每一个想要入局有实力的厂商都有可能抓住商机,风口起飞。

本文主要介绍了关于AirPods语音唤醒好用吗(AirPods语音唤醒介绍)的相关养殖或种植技术,生活常识栏目还介绍了该行业生产经营方式及经营管理,关注生活常识发展动向,注重系统性、科学性、实用性和先进性,内容全面新颖、重点突出、通俗易懂,全面给您讲解生活常识技术怎么管理的要点,是您生活常识致富的点金石。
以上文章来自互联网,不代表本人立场,如需删除,请注明该网址:http://23.234.50.4:8411/article/1491607.html