分享好友 最新动态首页 最新动态分类 切换频道
全力狙击OpenAI,谷歌最强大模型Gemini 2.0登场,AI Agent成主打!
2024-12-27 12:51

OpenAI的12天“圣诞大礼包”还没熄火,谷歌便用一次发布,干了比OpenAI 五天都多的事儿。

全力狙击OpenAI,谷歌最强大模型Gemini 2.0登场,AI Agent成主打!

12月12日凌晨,就在OpenAI轰轰烈烈的“12天连续发布”进行到第五天时,谷歌发布了他们的重磅更新——Gemini 2.0 Flash。

同时,谷歌今天官宣了三个通用助手Project Astra,浏览器助手Project Mariner,以及代码助手Jules,旨在引领AI模型进入“Agentic 时代”。

Gemini 2.0

Gemini 2.0 Flash是该系列的首款模型,它在性能上实现了显著提升。与前代1.5 Flash相比,2.0 Flash在保持快速响应的同时,性能进一步增强。

谷歌表示,2.0 Flash在关键基准测试中超越了1.5 Pro,速度是1.5 Pro的两倍。新模型不仅支持图像、视频和音频等多模态输入,还支持多模态输出,包括原生生成的图像与文本混合内容,以及可控的多语言文本转语音(TTS)音频。

此外,2.0 Flash能够原生调用Google Search、代码执行以及第三方用户定义的函数等工具。

在这个榜单中我们可以看到,它超越了ChatGPT-4o和o1 Preview,登上了第一。这足见其模型的实力。

从命名来看,Gemini 2.0 Flash很可能是新系列的最小杯,最小赢过了竞争对手最大、最先进的模型,这让人甚至都很难想象 Gemini 2.0 Ultra 会强到什么地步。

正如谷歌DeepMind的CTO科雷·卡武克奥卢所说:

“如果把我们一年前的位置和现在相比,今天发布的Flash模型比我们一年前的任何模型都要强大得多,而且成本只是其一小部分。”

Gemini 2.0 Flash的多模态能力使其在信息理解和表达上更加接近人类,为用户提供了更加丰富和直观的交互方式。这种能力的提升,不仅增强了模型的实用性,也为AI智能体的应用提供了更多可能性。

谷歌还推出了新的多模态实时API,支持实时音频、视频流输入,并能够集成调用多种工具组合。这一API的推出,为开发者构建动态交互式应用提供了更多支持,这在教育、娱乐和辅助阅读等领域具有广泛的应用前景。

谷歌计划在明年初将Gemini 2.0扩展到更多产品中,这将进一步推动AI技术在各个领域的应用。

在AI智能体的应用方面,谷歌展示了多个研究原型,包括Project Astra、Project Mariner和Jules。

Project Astra是一个通用AI助手,它利用Gemini 2.0的多模态功能,通过手机或谷歌眼镜进行跨文本、音频、视频的多模态实时推理。

Astra的新功能包括支持多语言混合对话、直接调用Google Lens和地图功能、记忆能力提升至10分钟会话内记忆,以及接近人类对话的延迟来理解语言。谷歌正在将Project Astra移植到眼镜等更多移动终端中,以拓展其应用范围。

Project Mariner是一个基于Gemini 2.0构建的早期研究原型,它能够理解和推理浏览器页面中的信息,包括像素和网页元素,然后通过Chrome扩展程序使用这些信息为用户完成任务。在WebVoyager基准测试中,Project Mariner作为单个智能体设置实现了83.5%的工作效率。

Jules是谷歌专为开发者打造的AI编程智能体,它支持直接集成到GitHub工作流中,使用自然语言描述问题,就能直接生成可以合并到GitHub项目中的代码。

游戏智能体的新突破

谷歌还在游戏领域进行了有趣的尝试,使用Gemini 2.0构建了能够实时解读屏幕画面的游戏智能体,通过用户游戏屏幕上的动作给出下一步操作建议,或直接在打游戏时通过语音交流。

谷歌称,这些游戏智能体可以根据屏幕上的实时画面,分析游戏情况,并为用户提供下一步的行动建议。

目前,研究人员在与Supercell等游戏开发商合作,探索这些Agent从《部落冲突》等策略游戏到《Hay Day》等农业模拟器,在各种游戏中解释规则和挑战的能力。

未来,谷歌还在试验可以通过将Gemini 2.0的空间推理功能应用于机器人技术来在物理世界中提供帮助的Agent。

此外,谷歌正在探索将Gemini 2.0的空间推理能力应用到机器人领域,虽然还处于早期阶段,但这预示着AI代理在物理环境中提供帮助的潜力。

最新文章
谷歌两步验证:保护你的账户安全
随着网络安全威胁的不断增加,Google(谷歌)推出了一种强大的安全功能,即谷歌两步验证。这是一种为用户提供额外安全防护的措施,能够有效防止未经授权的人访问你的谷歌账户。谷歌两步验证是一种加强用户账户安全的方法。除了输入正确的用
进攻即是最好的防御!练习黑客技术的在线网站
1、bWAPP 免费和开源的web应用程序安全项目。它有助于安全爱好者及研究人员发现和防止web漏洞。 地址:http://www.itsecgames.com/ 2、Damn Vulnerable iOS App (DVIA) DVIA是一个iOS安全的应用。它的主要目标给移动安全爱好者学习iO
Windows优化大师PC版 V4.2023 官方版 / Windows优化大师电脑版下载
 Windows优化大师是一款专门为windows操作系统量身定制的系统优化软件,这款软件能够为用户提供强大的系统优化服务,这款软件界面简洁,使用方便易上手,能够帮助用户轻松解决电脑中遇到的各种问题,让用户的电脑时刻处于最佳状态,喜欢这
高效算力调度体系建设推动跨区域资源平衡与智能化发展
在当今数字化快速发展的背景下,高效算力调度体系的建设显得尤为重要。这一体系不仅能够助力跨区域资源的均衡配置,还能推动智能化发展。随着数据量的激增和计算需求的多样化,各地区在算力资源的获取与使用上面临着不同
公司vdi远程办公
而且增加GPU的成本非常高;如果使用IDV模式对于普通办公用户来讲,又会造成性能上的浪费。其实,只要把VDI与IDV结合应用,就可以很好的解决上述难题。二、方案概要假设一个企业共有60个坐席的办公电脑,其中40个用于普通的办公(OFFICE、IE
空间SEO秘籍,解锁流量增长与空间布局优化之道
空间SEO是优化网站在搜索引擎排名,提升流量的重要手段。关键策略包括:优化网站结构、关键词研究、高质量内容创作、外部链接建设、社交媒体互动等。掌握这些策略,将有效提升网站在空间搜索中的可见度,吸引更多用户访问。随着互联网的不
怎么使用Kinsta克隆WordPress网站功能?
Kinsta克隆WordPress网站功能需要是专业版或更高版本的计划,并且您需要在新网站的计划中至少有一个未使用的空间。如果您没有未使用的空间将站点克隆到,也可以将站点克隆至高级暂存环境。接下来是Kinsta克隆WordPress网站详细操作步骤。1
移动实时天气:随时随地掌握气候变化的利器
标题:移动实时天气:随时随地掌握气候变化的利器文章:随着科技的飞速发展,智能手机已经成为我们生活中不可或缺的一部分。而在智能手机的众多应用中,实时天气信息成为了人们日常生活中不可或缺的一部分。移动实时天气应用不仅能够提供准
班级优化大师免费
班级优化大师免费是一款特别好用的手机工具类软件,这款软件专为从事教育行业的用户打造,用户可以使用这款软件来更好管理自己的班级,查看班级里的每一位学生的出勤情况,从而制定合理的教育计划。1.用户可以使用软件来点评班级内的学生,
阜新卫生间漏水维修电话〈免费上门〉阜新专业房屋漏水维修
不砸砖、不砸墙;免砸砖防水补漏技术,2小时快速解决漏水问题,超长保修期。漏水维修服务项目:楼顶防水、阳台漏水、厂房车间渗水、飘窗防水、地板下暗管漏水、外墙飘窗渗水、洗浴间漏水、卫生间墙面起皮、厨房漏水、女儿墙渗水、彩钢瓦防水、
相关文章
推荐文章
发表评论
0评