
周三,facebook所有者meta发布了一个人工智能模型,可以从图像中挑选出单个对象,同时还发布了一个图像注释数据集,据称这是同类数据集中最大的。
该公司的研究部门在一篇博客文章中表示,它的分段任意模型(SAM)可以识别图像和视频中的物体,即使在训练中没有遇到这些物体的情况下。
使用SAM,可以通过单击对象或编写文本提示来选择对象。在一次演示中,输入单词“猫”,该工具就会在照片中的几只猫周围画出方框。
自微软(microsoft)支持的OpenAI聊天机器人ChatGPT去年秋季引起轰动,引发了一波投资浪潮和主导这一领域的竞赛以来,大型科技公司一直在大肆宣扬他们的人工智能突破。
虽然meta还没有发布产品,但它已经发布了几个功能,可以部署由ChatGPT流行的生成式人工智能类型,它可以创建全新的内容,而不是像其他人工智能那样简单地识别或分类数据。
例如,有一款工具可以根据文本提示旋转超现实主义视频,还有一款工具可以根据散文生成儿童读物插图。
该公司首席执行官马克·扎克伯格(Mark Zuckerberg)曾表示,将这种生成式人工智能“创造性辅助”整合到meta的应用程序中是今年的首要任务。
meta已经在内部使用了类似SAM的技术,比如给照片加标签、审核违禁内容,以及决定向Facebook和Instagram用户推荐哪些帖子。
该公司表示,SAM的发布将扩大对这类技术的获取。
SAM模型和数据集将在非商业许可下提供下载。用户上传自己的图像到附带的原型,同样必须同意仅用于研究目的。
凯蒂·保罗报道;康纳·汉弗莱斯编辑
点击分享到









