搜狗推出速记工具“搜狗听写”

发布时间: 2017-08-09 15:08:33 |来源:北京晨报 | 佚名 |责任编辑: 沈晔

 

用人工智能为文字工作者“减负”

语音记录,是记者、编辑、作家等文字工作者们常用的记录方式。但对于记录者来说,语音并不方便后期的整理、分享和追溯,这也导致听语音记录的过程耗时耗力,影响信息的沟通。近日,搜狗推出语音实时变文字的速记工具“搜狗听写”,解决会议、采访、写作等场景下长语音内容转写难题。

支持长时录音、免费转写

为了保证在各种复杂场景下都能精准转写,搜狗听写采用了大量前沿技术。在转写方面,搜狗听写使用了搜狗知音独家研发的长时语音转写技术,并与业内领先的端到端深度神经网络技术深度整合,使得语音识别准确率保持在较高水平。据了解,搜狗听写的功能相当强大,可以支持写文章、采访录音、会议记录、笔记整理、日常记事等场景,帮助用户实现高效记录和信息输入。针对不同场景和需求,搜狗听写可以支持“听写”和“转写”两种模式。

在“听写”模式下,录音的同时即可实时给出识别结果,话音落文字出,几乎没有时间差。“转写”模式下则可以离线录音,录音完成后一次性获取文字结果。为了提高文字整理效率,搜狗听写还贴心的加入了边听边改、无线标重点、多端同步、信息分享等人性化功能,大幅度提升记录效率,让文字编辑更轻松。针对图书馆、咖啡厅等不便大声说话的场景,搜狗听写提供耳语识别技术,在人的说话音量低至30分贝时,依然可以准确识别。

“一位记者刚刚完成了一个采访,想利用路上的碎片时间整理下采访内容。通过搜狗听写就可以实现。“搜狗听写产品经理牛露云表示,通过人工智能技术,搜狗听写目前已经可以实现记者、作家等文字工作者梦寐以求的“动动嘴巴,就出现文字”的效果。

为了达到这样的目标,搜狗听写通过大数据和深度学习进行训练。搜狗语音交互中心技术总监陈伟表示,为了让搜狗听写识别准确率更高,延时更小,搜狗听尝试了CN+LSTM+DN的端到端的算法,让使用者可以在讲话的过程中快速生成文字。

陈伟介绍,搜狗已经建立了强大的语音自研团队,拥有互联网规模最大的语音数据。每天超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断学习,识别准确率越来越高,可应用的场景也越来越广泛。

深入布局人工智能

搜狗公司语音交互技术中心总经理王砚峰表示,此次推出搜狗听写产品,是搜狗语音深入用户垂直场景下的又一个全新探索,通过更加专注于特定的场景和人群,去理解用户需求、解决实际问题,从而让语音技术为更多人所用。

王砚峰表示,搜狗从去年开始进行AI的技术研发,从去年开始到今年,已经有多项产品使用搜狗的AI能力。未来,还会有更多的产品获得,会有更多的AI技术跟产业结合起来。例如在可穿戴、车载、客厅场景下,自主研发更多的硬件。在儿童领域,以及现在炒得非常火的智能冰箱、可穿戴设备、后装领域的车载产品推出更多的自主研发的硬件产品。同时,搜狗还将会积极推广AI云平台、AI云服务,服务更多的行业伙伴。在更多的垂直产品场景下,做更多好的产品,服务垂直行业的用户群体。


新闻热图 >>更多