体育
谷歌I/O:从AI概述到Gemini,宣布了什么?

  

  alphabet旗下的谷歌(Google)周二宣布了几项新的生成式人工智能(generative artificial intelligence)功能,该公司表示,这项新技术不会蚕食其数十亿美元的搜索业务,而是会增强它,提高搜索结果的相关性。

  谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示,谷歌的生成式人工智能工具Gemini(以前称为Bard)不太可能危及其高利润的现有产品。

  皮查伊在一次媒体活动中表示:“从第一天起,我们处理所有事情的方式,以及我们现在所做的同样一件事,就是始终专注于用户,满足他们不断变化的需求……我们看到,人们对我们的产品做出了更多回应,并更多地参与其中。”

  “通过搜索和双子座,我们很兴奋,因为我们可以扩展用例,帮助用户解决更复杂的问题。我认为这一切都是积极的,我觉得现在是增长和机遇的时刻,而不是相反。”

  今年第一季度,谷歌搜索及相关业务占该公司总销售额的57%以上。它使总收入增加了近462亿美元,同比增长14%。

  但Gemini尚未对公司的销售额做出任何重大贡献。

  周二,谷歌在加州山景城总部举行的年度谷歌I/O大会上公布了各种新的人工智能功能和产品。

  在宣布这些消息后,Alphabet的股价小幅上涨,周二晚11点50分在阿联酋交易价格为171.84美元,使该公司的市值达到2.11万亿美元。

  谷歌推出了Gemini 1.5 Flash,这是其最新的生成式人工智能模型,比以前的版本更流畅,设计得更快、更高效。

  

  meta rel="preload" href="https://i.ytimg.com/vi/_fuimO6ErKI/hqdefault.jpg" as="image"/>

  谷歌DeepMind首席执行官杰米斯?哈萨比斯(Demis Hassabis)表示,新版本针对“大规模的高容量、高频任务进行了优化,更具成本效益”。

  更轻的重量允许1.5 Flash对大量信息进行多模态推理,执行快速摘要,聊天应用程序以及从长文档和表格中提取数据。

  哈萨比斯表示,它由其前身1.5 Pro通过一种称为蒸馏的过程进行培训,在这个过程中,“大型模型中最重要的知识和技能被转移到更小、更高效的模型中”。

  去年12月,谷歌推出了第一款多模式模型Gemini 1.0,有三种尺寸——ultra、pro和nano。

  随后是增强版1.5 Pro,拥有100万个令牌上下文窗口。最新的1.5 Flash在多达200万个令牌上下文窗口上进行了训练。

  在自然语言处理中,符号指的是单个单词或字符。

  皮查伊表示:“我们在这方面确实在开拓前沿,我们正在朝着无限上下文窗口的最终目标迈进。”

  谷歌还公布了下一代开源模型Gemma 2,全球开发者可以通过各种平台访问它。该公司表示,其目标是更“负责任”地构建人工智能创新。

  今年2月首次宣布,Gemma是通过与创建Gemini相同的研究和技术构建的,Gemini是一个封闭的人工智能模型。

  谷歌(Google)和微软(microsoft)支持的OpenAI是生成式人工智能领域的两大领跑者,它们主要维持封闭的基础模型,担心大型语言模型可能被操纵来传播错误信息或其他潜在危险的内容。

  但开源软件的支持者表示,不公平地关闭这些系统会限制创新,阻碍它们改善世界的潜力。

  谷歌还宣布了其最新的视频生成模型Veo和Imagen 3,这是“迄今为止质量最高的文本到图像模型”。

  Veo具有对自然语言和视觉语义的高级理解。该公司表示,它可以生成密切代表用户创意愿景的视频。谷歌预计很快将把Veo的功能添加到YouTube短片中。

  谷歌表示,Imagen 3能够产生近距离细节,产生逼真的图像,与该公司之前的型号相比,视觉干扰较少。

  负责产品管理的副总裁Eli Collins说:“Imagen 3可以更好地理解自然语言、提示背后的意图,并结合较长提示中的小细节……它也是我们迄今为止渲染文本的最佳模型,这对图像生成模型来说是一个挑战。”

  从周二开始,Veo和Imagen 3都可供选定的创作者使用。

  谷歌过去曾因使用人工智能而遭到强烈反对。

  今年2月,在对种族问题的处理受到批评后,该公司暂停了双子座的个人形象制作。谷歌当时为“没有抓住要点”而道歉。

  “这是完全不可接受的,我们弄错了,”皮查伊在《国家报》(The National)看到的一份员工备忘录中写道。

  2015年,该公司因其照片应用将一对黑人夫妇归类为“大猩猩”而不得不道歉。

  周二,该公司表示正在采取措施应对生成技术带来的挑战。

  柯林斯表示:“我们一直在与创意界和其他外部利益相关者合作,收集见解并听取反馈,以帮助我们以安全和负责任的方式改进和部署我们的技术。”

  “我们一直在进行安全测试,使用过滤器,设置护栏,并将我们的安全团队置于开发的中心。”

  从周二开始,谷歌将向美国所有用户提供人工智能概述。该公司预计“很快”会在更多国家推广,并在今年年底前将这项技术普及到10亿人以上。

  

  meta rel="preload" href="https://i.ytimg.com/vi/_TVnM9dmUSk/hqdefault.jpg" as="image"/>

  AI概览增加了搜索结果,旨在帮助用户解决复杂的问题。

  谷歌搜索副总裁兼主管利兹·里德(Liz Reid)说:“与其把你的问题分解成多个搜索,你可以提出最复杂的问题,同时考虑到所有的细微差别和注意事项,一口气解决所有问题。”

  例如,如果用户正在迪拜寻找一家当地人评价很高、提供户外座位、宠物友好的时尚咖啡馆或早午餐地点,那么他们可以问:“在迪拜找到一家受欢迎的咖啡馆或早午餐地点,并显示户外座位和宠物政策的详细信息。”

  谷歌表示,它正在测试一项新功能,如果Gemini nano检测到通话模式通常与潜在骗局有关,它就会在通话过程中提供实时警报。

  例如,如果银行代表要求用户紧急转账、通过礼品卡付款或要求用户提供个人信息(如卡个人识别码或密码),用户将收到警报,这些都是不常见的银行要求。

  安卓生态系统总裁萨米尔·萨马特(Sameer Samat)说:“这种保护都发生在设备上,所以你的对话对你来说是私密的。”

  谷歌表示,它将在今年晚些时候分享更多关于这一可选功能的信息。

  2003年,谷歌创始人谢尔盖·布林(左)和拉里·佩奇在位于加州山景城的谷歌总部。盖蒂图片社

  

   点击分享到

热门推荐