图片来源:视觉中国
钛媒体注:本文来自微信微信官方账号硅谷密探(guigudiyixian),钛媒体授权转载。
一个自认为英语还可以的侦探,最怕和别人说话的时候,用英语说一些自己听不懂的话。
一般来说,如果第一遍听不懂,可以放心地请别人再说一遍。
如果第二遍还是听不懂,小侦探觉得有必要补充两句类似“不好意思,刚才没听清”的客套话。请别人再重复一遍。
如果第三次听不懂(而且对方的不耐烦通常很难掩饰),侦探只好礼貌地笑笑说:“是啊,对吧?”然后默默祈祷刚才人家说的不是问题。
相信很多人都遇到过这种略显尴尬的情况。这时,侦探不禁想:要是每个人的话都可以像电影里那样加上字幕就好了!
更不用说,很快,微软就会让这个想法成为现实。
Skype和PowerPoint幻灯片将有实时字幕
相信大家对视频聊天软件Skype并不陌生。微软本周宣布,当我们再次使用Skype时,我们将能够拥有实时字幕!
也就是说,不管是视频还是语音,当你和对方聊天的时候,无论对方说了什么或者你说了什么,Skype都可以同时把它变成字幕,3354显示在屏幕底部,就像电影和戏剧底部的台词一样,只不过不是预先写好的台词,而是你那一刻说的话。
图片来自微软,版权归原作者所有。
使用Skype时,点击“更多()”按钮,然后选择“打开字幕”即可使用此功能!
图片来自微软,版权归原作者所有。
如果太麻烦,也可以直接设置为默认字幕设置:点击你的头像,进入“设置”栏,然后输入“通话”,再点击“通话字幕”的“显示字幕”,以后每次通话都会默认显示字幕。
图片来自微软,版权归原作者所有。
开启“即时翻译”功能后,对方的文字字幕会像电影字幕一样自动滚动3354,但字幕过了就过了。目前用户无法向前滚动查看之前的对话。
不过,微软表示,未来将开发其他方式供人们观看字幕,比如在侧窗滚动字幕,这样如果听不清楚对方刚刚说了什么,可以将字幕向上滑动并取回。
微软还表示,这项新功能不仅可以快速、连续地为对话添加字幕,还可以通过学习上下文来帮助AI“阅读和理解”自己,使自己在字幕制作方面更加智能和准确。
虽然这项新功能目前只支持英语,但Skype很快将支持20多种语言和方言的翻译。届时,Skype不仅会有即时字幕,还能进行机器同声传译。
看到这个新闻,侦探的第一反应是:爽!再也不怕对方说话不清,口音重等问题,简直是居家旅行,学外语,交全国各地朋友的必备产品。
不过,微软发布这项新功能的初衷,其实是为了帮助聋人或听障人士,让他们在使用Skype时,可以通过实时读取对方所说的话来参与对话。
这也是微软特意选择在周一发布这项新功能的原因:12月3日是联合国国际残疾人日。微软选择在这一天为Skype添加实时字幕,就是希望通过这个小功能,让听障人士的生活简单一点。
除了Skype,微软还计划在我们最熟悉的“PPT”PowerPoint中加入实时字幕。不仅如此,PowerPoint还将具备即时翻译功能,甚至可以向听众手机发送字幕。
想象一下:假设一个有口音的人在用英语演讲,但是你听不懂,因为他的口音太严重了(比如俄语、新加坡或巴西口音)。这时候你可以在大屏幕上看英文字幕,也可以让PowerPoint直接把英文翻译成中文发送到手机或者电脑上。
p>
哪里听不懂点哪里,妈妈再也不怕我视频开会时听不懂印度老板的话了。
听着不错吧?不过微软说,这个功能正式发布,还需要等到明年年初。PowerPoint 将提供 12 种语言的实时字幕,还能把原语言翻译成 60 多种语言。
小探认为,PowerPoint 背后 AI 的语音识别技术,有个其他语音识别技术没有的优势:它不仅需要分辨出你说的话,还需要把你说的话,与幻灯片上的词汇联系起来,这样可以更准确地识别演讲中提到的专有名称和特定术语。
和 PowerPoint 颇为相似的 Google Slides 也推出了同样的功能,但相比之下,PowerPoint 的功能更全面些:
Google slides 的实时字幕功能 / 版权属于 Google
不论 PowerPoint 还是 Skype,微软给这两个产品新添加的功能,都是用 AI 把正在发生的谈话实时以文本的形式呈现出来,让 AI 变成我们的速记员和同声传译。
除了方便不同语言的人之间的交流,微软此举更是意在帮助听障人士。而微软对残疾人群体的关注,早已不是一两天。
微软:用 AI 改善残疾人的生活
全球残疾人人数超过 10 亿,很多时候,这个群体并不能像其他人一样享受科技带来的便利 —— 在这 10 亿人中,只有约 10% 的残疾人用得上辅助工具(比如助听设备、义肢等)。
残疾会让找工作变得格外艰难。根据美国人口普查局的统计,在失聪及听障人群里,只有 52% 的人有工作。无法保证工作,自然会导致生活水平下降,对残疾人来说,无疑雪上加霜。
一直以来,微软就想通过 AI 让残疾人能更好地参与到工作环境里,而 PowerPoint 和 Skype 的实时字幕只是微软诸多动作中的一两种。要知道,在过去三年里,微软给 Office 365 的各个产品陆陆续续加了 30 多个方便残疾人用户的功能。
而帮助残疾人更适应工作场所,其实只是微软 “用 AI 改善残疾人生活质量” 这个宏大计划下的一小部分。
今年 5 月 7 号,微软在其名为 “Build” 的年度开发者大会上宣布,将开展一个名为 “AI for Accessibility”(“用人工智能,让生活无障碍”)的人工智能项目。
微软计划在未来五年里,专门拿出 2500 万美元,帮助那些能改善残疾人生活、工作、和与人交流相关的 AI 产品的开发。微软认为,语言不通、或者有某种身体残疾,都不应该成为交流的障碍。微软之所以如此关注这一领域,不知道和微软 CEO 的儿子身患残疾是否有关。
这个计划将通过三种方式来实现这一点。
首先,微软将大学、科研机构、开发者,任何提出帮助残疾人生活更便利的 AI 解决方案的团队提供种子技术授权,优先使用 AI 方法,帮助更多残疾人士找到工作、降低生活里的不便(比如我们上文提到的无法用 Skype、无法听别人的演讲)。
然后,微软从这些项目里选出最有可能成功的项目,进行更大规模的技术投资,同时微软也会带着自己的资源,比如让微软的 AI 专家、合作伙伴参与进来。
接下来,在服务中注入人工智能和包容性设计时,微软也会将这些 AI 创新融入到平台级的服务中,让尽可能多的人能够从中获益。
其实,微软在残疾人工具研发这件事情上,一直就没少花心思。微软在这方面比较有名的一个产品叫 Seeing AI —— 这也是微软十多年计算机视觉的研究成果。
Seeing AI 是微软 2017 年推出的一款 “利用电脑视觉,给盲人描述、解释世界长什么样” 的应用,微软自己管这个应用叫 “为盲人群体服务的有声相机”(Talking camera for the Blind)。这款应用已经在苹果商店获得了超过四星的评分,颇受好评。可惜的是,Seeing AI 目前还只支持英文版。
比如说,视障人士打开这款应用,对着信封,Seeing AI 就能把信封上的信息读出来:
再比如说,Seeing AI 可以告诉用户它都看到了什么。 如下图所示,它看到了 “一把黑色的吉他”,和 “一只手拿着一块表”。
哦对了,小探在写这篇文章查资料时看到,有视障用户在用了 Seeing AI 的产品后,可以帮年幼的孩子检查作业了。
微软高级产品营销经理 Malavika Rewari 接受外媒采访时表示,微软的 “无障碍小组” 里,约 90% 的员工都有某种残疾。
Ann 是微软 Seeing AI 应用研发小组的一名成员,同时也是一名盲人。
而他们为残疾人开发出来的像 Seeing AI 之类的产品,无疑使残疾人离独立、便利、更有尊严的生活又近了一步。
用科技改善残疾人的生活
在提高残疾人的生活质量这件事上,微软不是唯一一家。
民宿巨头 Airbnb 就是其中之一。以前,用户在 Airbnb 平台搜索房屋时,除了 “价格”、“位置” 等搜索条件,在 “无障碍” 这块,只有 “方便轮椅进出” 这一个相对比较粗糙的选项。
今年三月,Airbnb 新添加了 21 个更细致的 “无障碍” 筛选条件,比如 “是否有无障碍停车位”、“无障碍淋浴” 等条件,让轮椅使用者出行更方便。
谷歌地图相信大家也不陌生。今年,谷歌给用户在选择路线的时候,新添加了 “轮椅可行” 的选项。这样,轮椅使用者就可以避开没有轮椅配套设施的地方。目前只有纽约、伦敦、东京、波士顿、墨西哥城和悉尼的谷歌地图配备了这个新功能,不过谷歌计划把它推广到更多城市。
当然,不论是 Seeing AI 还是谷歌的地图,在用户体验上还有很多需要改善的地方,但这种趋势让人感到非常欣慰。
小探以前有种 “发达国家的残疾人更多” 的错觉,因为在街上总能看到残疾人。相比之下,国内街上残疾人出现的比率似乎低了不少。其实,这不是因为中国的残疾人人口比例更低 —— 据统计,2017年中国各类残疾人总数为8500万人,也有统计认为人数接近一亿,是世界上残疾人口最多的国家。之所以大街小巷上不怎么看得到残疾人,是因为我们的无障碍设施还做得很不到位。
不论出于温情,还是庞大的残疾人群体背后的巨大市场,硅谷的巨头们纷纷开始关注无障碍领域里的机会。希望不远的将来,这类新技术能帮助残疾人们获得更便利的生活。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App