Whisper-Medusa是aiOla的新开源语音识别AI模型,声称比OpenAI的Whisper快50%

aiOla 是一家总部位于以色列的公司,成立于 2019 年,专门提供用于数字化纸质工作流程的人工智能驱动解决方案。该公司最近推出了 Whisper-Medusa,这是一种开源 AI 模型,结合了 OpenAI 的 Whisper 和 aiOla 的技术。它声称在保持高精度的同时,运行速度提高了 50% 以上。这种速度是通过一种独特的代币预测方法实现的,一次预测十个代币,而不是像 OpenAI 的 Whisper 那样预测一个。

Whisper-Medusa 是在弱监督下开发的。此过程涉及使用 Whisper 转录音频数据集,然后这些数据集充当标签来训练 Medusa 的令牌预测模块。

对于在日常运营中仍然依赖基于纸张的工作流程的企业来说,Whisper-Medusa 可能成为一项巨大的资产。aiOla 的技术通过其后端系统“aiOla Jargonic”可以帮助各行各业的一线工人。例如,在食品制造行业,aiOla 通过将手动清单转换为数字工作流程来简化质量控制。该公司表示,整个过程“就像上传现有流程的照片或文件一样简单”。

Whisper-Medusa 支持 100 多种语言和各种口音,在航空、食品制造、物流和医疗保健等行业也很有用。通过将非结构化语音数据转换为可操作的见解,企业可以降低成本并改善资源分配。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
Whisper-Medusa是aiOla的新开源语音识别AI模型,声称比OpenAI的Whisper快50%

精彩评论