来源:钛媒体
"AI 价值落地 " 已经成为了科大讯飞的重要使命,在推动 AI 技术提高生产力的道路上,科大讯飞消费类硬件的分支之一智能录音笔迎来了一款新品。
12 月 1 日,科大讯飞线上发布新一代讯飞智能录音笔 SR502,售价 2299 元,作为讯飞智能录音笔的热卖机型之一,SR502 基于上一代畅销产品 SR501 进行了软硬件全面升级。
讯飞智能录音笔 SR502 搭载高性能 4 核处理器,正面采用一块 3.5 英寸高清触摸屏,带来了顺滑流畅的系统操作体验,内置 2500mAh 大容量电池,结合软硬件双重优化,能够实现最长持续录音 10 小时以上。
作为高性能录音笔产品,SR502 配备两颗直径 10mm 的定向麦克风以及 6 颗矩阵麦克风,结合讯飞深度定制的 Voice Cube 声立方技术,实现最远 15 米拾音距离,以应对各类大型会议、阶梯教室等远距离场景,并能够根据不同场景匹配相应的场景算法,实现最佳拾音效果。
嘈杂环境下,SR502 内置的讯飞 Focus++ 智能降噪技术能够有效降低环境音干扰,根据场景主动识别人声,让拾音更加清晰。
不过相比硬件所带来的提升,讯飞智能录音笔 SR502 在软件方面的升级似乎更吸引人,它希望的是通过前沿人工智能技术的推动智能录音笔产品迭代。
全新升级的讯飞智能录音笔 SR502 搭载科大讯飞行业首发的离线转写功能,支持用户在无网环境下使用转写并保障隐私内容安全,同时新增 OCR 文字提取功能。
讯飞智能录音笔 SR502 使用全新升级的科大讯飞转写引擎—— ED 新引擎,该引擎搭配全流程的数据资源体系、配套语言学专家以及贯通式的 Cloud+ 的闭环迭代模式,采用语种自动路由的多语种端到端的统一建模技术,转写性能大幅提升。
基于端到端的全新语音识别框架,ED 新引擎支持自动切换纯中文、纯英文识别模式,同时智能识别中英文混读场景,以及普通话与多地方言的混合场景。配合高性能 4 核处理器,讯飞智能录音笔 SR502 将为用户带来更为无缝、高效、准确的多语言记录体验,并且准确率高达 98%。
效率提升之外,全新转写 ED 新引擎为 SR502 带来了创新的离线转写功能,支持用户在无网环境下正常使用语音实时转写功能,准确率仍旧高达 95%。离线转写不仅能够保证消费者在无网环境下使用录音笔功能,更满足了部分用户对敏感机密信息的防泄露需求。
相比上一代产品,SR502 新增配备了 800 万像素高清摄像头,随时利用 OCR 文字识别功能提取拍摄图片内的文字信息,用户在会议、演讲、活动现场时只需拍摄图片即可获得精准转写的文本内容。同时,SR502 拍摄的视频内容支持字幕实时生成,并支持后续编辑,大大降低了视频创作者制作字幕的时间成本。后续的软件版本更新中,SR502 还将支持识别 Excel 表格,并直接导出表格文件。
基于科大讯飞在语音识别领域的深厚积累,讯飞智能录音笔的转写功能支持粤语、河南话、四川话、重庆话、云南话、贵州话、天津话、河北话、东北话、甘肃话、山东话、太原话 12 种方言转写,并支持藏语、维吾尔语 2 种少数民族语,同时支持中、英、日、韩、俄、法、越南、西班牙 8 种语言转写,更支持中英同步互译,翻译结果实时精准播报。
值得一提的是,讯飞智能录音笔还支持财经贸易、医疗、IT 科技、政法、文化体育、教育和运营商 7 大专业领域转写优化,保证相关领域从业者在特定语境下的转写正确率。
在转写内容的预处理上,科大讯飞大力投入语音识别后处理技术。为让用户更高效地利用转写内容,针对多人交谈会议场景,讯飞智能录音笔 SR502 上线了分离与 ASR 联合建模的说话人分离方案,说话人分离的准确率达到 95%,让用户能够快速检索到各个目标说话人数据。智能语义分段可以根据语义的上下文进行分段,提升了用户针对转写文档的浏览体验;口语规整则可将语气词、重复词、无意义词过滤掉,展示更纯净的转写内容;书签标记支持关键信息的一键标记,有效提升编辑和出稿效率。
作为智能录音笔,SR502 内置 Wi-Fi、蓝牙、4G 网络多种连接方式,在转写内容编辑结束后,支持快速分享至邮件,用户可自定义多种导出格式或模板。此外,独立的讯飞语记应用支持录音笔和 PC 端随时同步,并支持实时编辑,文件可分享至微信和 QQ 等常用通讯软件。