未来的通用翻译器可能会运行本地语言模型,以实现更快、更高效的翻译.
人工智能支持的数字助理通过语音命令控制智能手机,这可能是下一个大事件.
每个聊天应用程序默认启用的端到端加密和录音的视觉提示等隐私功能应该成为智能手机的标准功能.
Humane AI Pin最酷的功能之一是实时翻译,特别是当它与形状因素和设备位于您的胸部时,它可以无缝地拾取你和你正在交谈的人正在说的话.
话虽如此,我可以想象未来我们会使用负担得起的通用翻译器.
但这个通用翻译器不会运行基于云的大型语言模型,而是运行专门从事语言翻译的本地LLM,而不是其他.
你所要做的就是设置输出语言--或者翻译者可以自动识别你的对话者所说的语言.
这样,翻译就可以运行得更快,翻译器也不会配备尖端的硬件.
只需要一个功能强大的芯片上系统(SoC),就可以运行专门从事翻译的本地模型,以及简单的固件.
不需要任何成熟的操作系统.
随着GPT-40的到来,这听起来不再是一个遥不可及的梦想.
此外,我们正在看到NPU(神经处理单元)的兴起,它将在未来更有效地运行人工智能模型.
这样的设备可以用于大型国际会议,在外国国事访问期间,在联合国,以及类似的组织,成员不说相同的语言,如欧洲理事会,并不是每个参与者都能说一口流利的英语.
这绝对比使用人工翻译或你的手机要好.
在旅游观光旅游中,万能翻译可以让游客和当地人即时交流,而不必依赖其他工具,如智能手机、词典,或者祈祷你的团队中有会说当地语言的人--这在讲英语的国家很常见,在没有英语作为官方语言的国家就不常见了.
我很乐意看到Humane AI Pin的隐私功能在智能手机上落空,Humane承诺的基于人工智能的数字助理失败了.
但人工智能支持的数字助理的总体想法听起来确实相当诱人.
想象一下,拥有一个数字助理,它不仅能够与手机操作系统进行有限的交互,回复收到的消息,执行谷歌查询,还可以与手机上的每一个应用程序进行互动.
然后,你可以使用那个助手只通过语音命令来控制你的手机.
撇开隐私问题和谷歌和黑帮目前在LLMS方面的问题不谈,这可能是LLM的杀手级功能.
这款数码助手随时随地都可以帮你写电子邮件和短信,在Spotify上播放音乐,记下随意的笔记,告诉你当前的天气,从你最喜欢的应用程序上点餐等等.
我在我的智能眼镜文章中详细讨论了这一点,我还提到了你的常规、万能的LLM不会在这里完成.
一个多模式基金会模型,专门使用智能手机应用程序,与主要的人工智能助手--双子座或人工智能驱动的Siri--协同工作,并驻留在你的手机上,可能是一个更好的选择,而不是一个成熟的LLM,它需要一系列GPU来在持续的互联网连接上工作,就像Humane AI Pin中的“助手”一样.
谷歌正试图对其Astra项目做类似的事情,进一步证实Humane的AI数字助手的想法是正确的.
不幸的是,在谷歌和苹果推出人工智能数字助理之前匆忙推出该项目可能是错误的策略.
此外,智能手机与智能手表或智能眼镜相结合,听起来像是使用多功能人工智能助手并向其发出命令的更好的组合,而不是没有显示器的小工具需要ConstAnt互联网连接,据报道电池续航时间很短.
最后但同样重要的是,让我们谈谈AI Pin的隐私相关功能,这可能是我真正喜欢的设备的唯一方面.
首先,每个聊天应用程序都应该默认启用端到端加密.
这是一项基本的隐私功能,遗憾的是,许多聊天应用程序都不提供这一功能.
即使他们这样做了,在大多数情况下,默认情况下也不会启用端到端加密.
接下来,每次你开始拍摄或使用AI Pin拍照时,都会有一个视觉提示亮起,这是我希望在智能手机上看到的一项出色功能.
只需在相机镜头周围或设备背面的任何地方添加RGB灯条,因为相机镜头周围的光线会扰乱图像和视频质量-每次你开始拍摄或拍照时,RGB光环就会亮起,通知其他人你正在录制它们.
我不相信Humane AI Pin、Rabbit R1或任何其他AI Pin设备会成为主流.
尽管如此,我认为我在这篇文章中谈到的AI Pin倡导的三个想法可以找到进入市场的途径,获得相当多的关注,并成为主流,特别是全能的AI数字助理.
Humane的AI Pin最终成为2024年最糟糕的科技产品之一.
尽管对这款设备进行了理所当然的关键平移,但AI Pin蕴含着一些相当酷的想法.
我可以看到其中三个想法要么进入智能手机,要么作为独立设备成为现实.
Humane的AI Pin最终成为2024年最糟糕的科技产品之一.
尽管对这款设备进行了理所当然的关键平移,但AI Pin蕴含着一些相当酷的想法.
我可以看到其中三个想法正在进入智能手机,或者成为现实,成为独立的设备.
这里的问题是,除了任何一个理智的人都不应该花700美元购买实时硬件翻译之外,这项功能就像AI Pin上的几乎所有功能一样,并不总是像预期的那样工作,而且当它工作时,它相当慢.