Microsoft发布Seeing AI移动应用,通过使用Azure AI描述世界来帮助低视力用户

Microsoft 在 3 月 7 日的能力峰会期间推出了 Seeing AI 应用程序,该活动旨在为残疾人探索数字解决方案。这个创新的应用利用 Azure AI 技术来帮助视力低下的人更轻松地驾驭生活。

人工智能技术通常需要强大的计算机来分析和响应用户提示,很少有移动设备拥有人工智能芯片,例如 2024 年顶级智能手机中的骁龙 8 Gen 3。因此,大多数提示被传递给OpenAI(ChatGPT)或Microsoft(Azure AI,CoPilot)等在线服务,其中更强大的云计算机处理请求。

Microsoft Seeing AI 利用带有视觉 AI 的 Azure GPT-4 Turbo 在任何具有以下功能的智能手机上实现响应迅速、准确的响应:

文本转语音 – 应用读取它看到的文本。较短的文本可以在实时摄像机模式下朗读,而较长的文本则被拍照、转换为文本,最后大声朗读。

条形码阅读器 – 该应用程序根据 UPC 代码查找产品。

场景 – 应用描述它看到的场景,聚焦在最近的对象上。

人 – 该应用程序描述它看到的人,识别面部情绪。

货币 – 该应用程序可识别它在 17 个国家/地区看到的账单。

颜色 – 应用可识别实时照片中心的颜色。

手写 – 该应用程序将手写笔记转换为文本。

亮度 – 该应用程序发出的音调会根据亮度而变化。

应用程序的结果通常是准确的,但在识别和描述所看到的内容方面,没有人工智能能像人类一样好。例如,Seeing AI 可以正确识别罐头中的剃须刀,但尽管身体上有美分标记,但它根本无法识别硬币分拣机。文本也是如此——该应用程序通常可以准确地转换收据和包装上的文本,但数学和化学文本却失败了。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
Microsoft发布Seeing AI移动应用,通过使用Azure AI描述世界来帮助低视力用户

精彩评论