b谷歌发布了Gemini 2.0,增强了人工智能产品的功能。
Gemini 2.0专注于人工智能,改进多步骤解决问题。
b谷歌的项目Astra和Mariner展示了先进的人工智能与流行服务的集成。
现在是12月,这显然意味着所有的人工智能公司都是时候展示他们过去一年的成果了。谷歌也不甘落后,推出了下一代人工智能模型Gemini 2.0,并承诺将在智能和能力方面迈出一大步。
如果说Gemini 1.0的主题是多模态——能够组合和理解不同类型的信息,如文本和图像——那么Gemini 2.0则是关于代理的,即可以更自主地行动并在有限的人工输入下解决多步骤问题的人工智能。
“在过去的一年里,我们一直在投资开发更多的代理模型,这意味着它们可以更多地了解你周围的世界,提前考虑多个步骤,并在你的监督下代表你采取行动,”谷歌首席执行官桑达尔·皮查伊在周三发布Gemini 2.0的博客文章中说。
本周,用户可以测试Gemini 2.0的一些新功能,包括一个新的“深度研究”功能,它可以让Gemini在网上搜索某个主题的信息,并准备一份易于阅读的报告。b谷歌表示,将向Gemini Advanced订户开放的Deep Research将像人类一样搜索和定位网络上的相关信息,然后根据它所学到的内容开始新的搜索。
谷歌计划将Gemini 2.0引入其搜索中的AI概述功能。这项功能极大地改变了谷歌从网络上检索答案的方式,但一开始却不顺利(有人想用披萨胶吗?)谷歌随后缩减了overview的规模,并进行了各种技术调整以提高性能。
b谷歌表示,在Gemini 2.0中,Overviews可以处理更复杂的搜索,包括使用文本和图像的多步骤问题和多模式查询。b谷歌表示,本周已经开始测试改进后的概述,并将在明年年初更广泛地推出。
本周,谷歌还推出了Gemini 2.0 Flash的实验版本,这是一个为高速处理大量任务而设计的模型,开发者可以试用。任何通过浏览器或Gemini应用程序访问Gemini聊天机器人的人都可以尝试使用新模型。
谷歌表示,Flash 2.0将使双子座更快、更聪明、更有推理能力。现在,它还能够自动生成图像(之前,谷歌已经在Gemini内部缝合了一个单独的人工智能模型来生成图像)。谷歌表示,这应该会改善图像生成,因为它正在从双子座2.0对世界的广泛了解中汲取灵感。
b谷歌戏弄的其他有趣的新公告在一段时间内不会为更广泛的公众消费提供。
其中之一是Project Astra, b谷歌在5月份的I/O大会上首次对其进行了预览。b谷歌展示了一款实时人工智能助手,它可以看到周围的世界,并回答问题。现在,谷歌展示了基于Gemini 2.0的更好版本的Astra,该公司表示,该版本可以利用谷歌最受欢迎的一些服务,如搜索、镜头和地图。
在一个新的虚拟演示中,谷歌展示了一个人拿着他们的手机摄像头对着一辆伦敦公交车,阿斯特拉回答了一个问题,那辆公交车是否能把他们送到唐人街。b谷歌表示,全新改进的Astra还可以用多种(和混合)语言进行对话。
谷歌将向有限数量的早期测试者推出Astra,并没有透露更多的人何时可以使用它。谷歌DeepMind的Astra产品经理Bibo Xu在电话会议上告诉记者,谷歌预计这些功能将随着时间的推移在其应用程序中推出,这表明Astra可能会逐步推出,而不是作为一个大产品。
谷歌还取笑了Astra在一副增强现实眼镜上运行。
此外,谷歌还取笑了Project Mariner,这是一个让人工智能控制浏览器并在网络上搜索信息的工具。它可以识别网页上的像素、图像、文本和代码,并使用它们来导航和寻找答案。
谷歌将Mariner称为早期研究原型,并表示它只允许一组经过挑选的早期测试者通过Chrome扩展来试用。
谷歌Labs产品经理Jaclyn Konzelmann表示:“我们对人工智能代理在计算机使用方面的全部能力还处于了解的早期阶段,我们也了解与人工智能模型相关的风险,这些模型可以代表用户采取行动。
例如,b谷歌表示,它将限制某些行为,比如让Mariner在进行在线购买之前要求最终确认。
有小费分成吗?有什么见解要分享吗?你可以通过加密通讯应用Signal(+1-628-228-1836)或电子邮件(hlangley@businessinsider.com)联系到记者休·兰利。