同文译馆
翻译硕士
当前位置:主页> MTI> 解放双手,微软让Office套件能听你语音指令,还可充当60多种语言的翻译官
解放双手,微软让Office套件能听你语音指令,还可充当60多种语言的翻译官
时间:2017/6/22 来源:36氪 浏览次数:6068
 

  当语音从扮演人与人间承接流转的角色跳脱,转而成为人与物间沟通交流的桥梁时,想象空间变也跟着拓宽了。
  
  如过去仅播放音乐的音箱,结合语音识别等技术,摇身转变为家庭小助手。微软就这样做了,他们与本就做音箱的哈曼卡顿合作,推出搭载微软人工智能语音助手Cortana的智能音箱Invoke。
  
  现在微软想用语音为其主要营收的Office套件赋能,延展“边界”。
  
  微软实验研发小组Microsoft Garage今日推出新项目Dictate,能与Outlook,Word和PowerPoint等Office程序结合使用。安装Dictate后,过去打字输入法即可告一段落,语音听写将成为替代,通过讲话便能随即转为文字。
  
  这背后用到与语音助手Cortana相同的语音识别技术及人工智能,包括Bing Speech API和Microsoft Translator。
  
  不过语音操作对微软而言非稀奇事,此前Office 365或Office 365 Online就支持听写,微软内置的Windows系统也支持语音,这背后都是Nuance Dragon语音识别解决方案作支撑。
  
  相对而言,Dictate相对应用范围窄,仅能用于Office。但它支持些命令,如“换行”、“停止听写”、“输入”及其他标点符号和行动指令。想手动增添标点符号,或当你滔滔不绝叙述时,让软件自行加标点也可以。还能移动光标、通过语音对文本进行修改。
  
  Dictata还能让Office套件,摇身一变,成为“翻译官”。它支持20多种口语语言,可实时翻译为60种语言。意味着当你需要英文文件时,操着口普通话就能搞定得差不多。
  
  目前该加载项还仅适用于Office 32位和64位,并要求用户在Windows 8.1或更高版本,Office 2013或更高版本及.Net Framework 4.5.0或更高版本。
  
  同样集成听写处理技术的科技巨头还有谷歌。
  
  2015年Google Docs增添语音输入功能,用户能在Chrome浏览器端,通过语音输入文字。只是当时精准度就成问题,有错误出现时还得用键盘修改,反复物理按键与语音输入的交替,实际体验并不见得较之前畅快。去年,谷歌语音功能到提升,开始支持文字编辑。
  
  国内WPS软件有内置语音功能,但还停留在设置朗读方式,用来核对数据,达到的效果是边输入边用语音听是否输入有误。不过借助百度拼音输入等输入法,还是可用语音输入WPS文档。目前国内市面主流的三大支持语音的输入法,科大讯飞、搜狗、百度,官方称其语音识别精准度分别为97%、97%、94%。
  
  说回Dictata项目,目前已能免费下载在这里该应用,但由于这是微软Garage的项目,一般更多处在实验阶段,很可能不会有进一步发展。

(编辑:xueqi
微信