HuggingFace推出iOS应用 无需联网即可使用本地视觉模型描述用户周围的内容

人工智能初创公司 HuggingFace 日前在 Apple App Store 推出名为 HuggingSnap 的新应用,该应用的主要功能是调用 iPhone 摄像头查看周围的事物,用户可以进行任意提问例如识别物体、解释场景、阅读文本等。
该应用最大的特点就是不需要将数据发送到云端,HuggingSnap 应用使用 HuggingFace 内部的视觉模型 smolvlm2 来实时分析手机看到的内容。
用人工智能配合摄像头进行实时物理识别并不是新鲜事,ChatGPT 等应用已经提供类似功能,但 HuggingSnap 的特点在于完全基于本地 AI 模型进行计算。
HuggingFace 表示:HuggingSnap 可以离线工作、节省电量并在手机上处理所有数据,该应用在购物、旅行、学习或只是探索周围环境时非常有用,HuggingSnap 为您的 iPhone 带来智能视觉 AI。
实际上该应用的用途非常广泛,例如帮助儿童了解周围的物体、帮助爱好者了解花草树木、帮助视觉障碍者播报和描述周围的物体等等。
只是 smolvlm2 模型在本地运行那么必然对算力有要求,HuggingFace 并未提到机型限制,或许是这个模型经过优化已经可以在 iPhone 上运行。
另外该应用不仅支持在 iOS 18 + 系统上运行,还支持在 macOS 15.0 + 系统上运行,但仅限于搭载 Apple M 芯片的 Mac,不支持搭载英特尔 CPU 的 Mac,最后还支持 visionOS 2.0+。
-
文件传输平台WeTransfer修改使用协议撤回使用用户文件训练AI的条款
在遭到大量用户尤其是企业用户抨击后,知名文件传输与共享平台 WeTransfer 宣布修改使用协议,撤回此前版本中有关使用用户文件训练人工智能模型的条款。WeTransfer 在 2025 年 7 月
-
微软在Windows 11右键菜单中新增询问Copilot按钮可以调用AI查内容
微软日前通过发布新版 Copilot AI 应用在 Windows 11 右键菜单 (上下文菜单) 中增加新选项:询问 Copilot。这个新选项让本来就已经比较臃肿的右键菜单更加臃肿,或许还会增加右
-
Visual Studio Code市场出现10个恶意扩展 冒充AI帮助开发者编写代码实则挖矿
Visual Studio Code 是微软推出的开源免费代码编辑器,该代码编辑器还包含市场用来提供各种各样的扩展程序,这些扩展程序大部分是第三方开发者提供的因此也难免存在恶意扩展。Extension
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- CRMChat 开源CRM客服系统
- 因持续违规且未进行改进 谷歌Chrome将在8月1日封杀中华电信和Netlock根证书
- 曝黑客新型钓鱼攻击手法:利用虚假弹窗登录页 苹果浏览器风险最高
- uuWAF 南墙 WEB 应用防火墙
- EndeavourOS 基于Arch的个性化轻量级Linux桌面系统
- 小米互联服务上架苹果App Store:同账号设备可互传文件
- 123云盘付费分享链接有效期是多久?
- 历史上的今天:微软黑屏事件;Ubuntu Linux 操作系统发布;Apple Pay 正式上线
- 自动写代码神器?竟然还有这东西!
- 征文|陈欣炜:终端安全的一点思考——从机场的终端管控说起
- 征文|杨文斌:终端安全之线段理论
- 程序员的传奇“破圈”之路