为什么语音计算总是失败?
By TechAltar · 2024-02-23
语音计算近年来一直处于困难时期,科技巨头们投 入巨资努力打造终极语音平台,但普通消费者仍然只是用它来设定定时器和控制智能家居设备。新一代语音助手虽然智能灵活,但在通用计算方面仍面临诸多挑战。
语音计算的失败与未来
- 语音计算最近经历了几年非常艰难的时期,微软的Cortana彻底失败,亚马逊的Alexa业务也遭受了巨大损失,谷歌的平台失去了很大的发展势头,而苹果的Siri也鲜有实质性更新。
- 科技巨头们花费了数百亿美元和整整10年时间来努力打造终极语音平台,但普通消费者仍然只是用它来设定定时器和控制智能家居设备。
- 新一代语音助手采用了真正的生成式人工智能,变得更加智能和灵活;同时配备了摄像头和先进的计算机视觉,可以进行更多复杂的交互,如快速估算水果的糖分含量,查询杏仁中蛋白质含量,甚至监测食物的烧烤时间。
语音计算的失败与未来
声控计算的未来
- 新的声控计算设备可能具有 令人印象深刻的潜力,尤其对于视力不佳或年长者来说,这些技术进步可能会带来巨大改变。
- 然而,公司将声控技术作为下一代通用计算的主要界面,这一观点实际上是站不住脚的。比如,声音输入在设置设备、输入密码、管理双重认证等方面将极其不便利,同时也存在隐私安全问题。
- 此外,该声控设备的投影屏幕分辨率低、手掌表面不规则,操控起来也不便准确,主要还是依靠语音操作,这在通用计算领域并不实际。
- 因此,声控技术在快速互动方面有其优势,但作为通用计算的主要界面,这样的设想目前看来还很遥远。
声控计算的未来
语音控制设备的局限性
- 语音控制设备的局限性在于很多应用程序需要视觉来进行操作,例如远程控制相机、社交媒体应用、视频播放应用等。
- 金融类应用也存在局限性,因为除了隐私问题外,金融操作需要精确的输入和视觉来查看信息。
- 生产力工具类应用也不适合用语音控制,例如编辑电子表格、扫描PDF文件、更新共享文档等。
- 基于地图的应用同样存在局限性,语音控制难以提供高分辨率地图浏览和地点搜索等功能。
- 购物体验也受到影响,因为用户通常需要在线浏览商品、查看价格历史、阅读评价等,这些都无法通过语音操作完成。
- 另外,通信类应用也面临挑战,例如处理复杂的邮件、管理多个消息应用、进行视频通话等。
- 然而,语音控制在播放音乐、播客和智能家居设备控制方面表现良好。
语音控制设备的局限性
语音助手的局限性
- 语音助手并不适合处理复杂任务,比如管理Spotify播放列表或者排除智能手机无法连接Wi-Fi的问题,这些都需要屏幕来更有效地完成
- 语音和音频对于计算机来说是极其缓慢的单向通道,而现有的计算机则像是一条多车道、多向的高速公路,可以随意切换和跳跃
- 大多数人的语音表达其实并不够准确,对于需要精确输入方法的计算机来说,语音并不是一个理想的选择
语音助手的局限性
Hol Lens控制与Humane AI技术
- Hol Lens可以几乎完全通过语音控制,并利用其辅助AI来分析周围的物体,例如在维护场景中,当工人需要双手操作时。
- 它并不是智能手机的替代品,而是一项新的、额外的功能。
- 另一个解决方案是增加一个优秀的屏幕和精准的输入方法,这样就相当于重新发明了智能手机。
- 声音AI在手机上也是有意义的,因为可以自然地与生成式AI进行交互。
- Humane AI pin不应该出现在您的假日购物清单上,而是推荐iFixit工具套装,可以让你修复已有设备,而不是购买不必要的新产品。
Hol Lens控制与Humane AI技术
Conclusion:
尽管语音计算在快速互动方面有优势,在处理复杂任务和通用计算方面仍面临挑战。新一代语音助手的智能灵活,但并不适合作为通用计算的主要界面。Hol Lens等新技术在特定场景下具有潜力,但并不是智能手机的替代品。Humane AI技术推荐修复旧设备,而不是购买新产品。