大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”
AI Weekly回来了!
“AI Weekly”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。
省流版摘要
-
月之暗面发布k0-math数学模型:月之暗面发布数学推理模型,在多项数学基准测试中表现超越OpenAI的和。模型将在几周内上线Kimi网页版和App端。
-
腾讯上线AI工作台ima:腾讯推出AI智能工作台ima,打通微信公众号生态,支持问答、创作、图片生成、内容总结、思维导图和多语言翻译,现已上线Mac和Windows版本。
-
阿里开源Qwen2.5-Coder模型:阿里巴巴开源系列模型,包括六种尺寸,旗舰模型在代码测试中表现媲美GPT-4o。
-
X平台免费开放Grok聊天机器人:X平台测试免费开放AI机器人Grok,用户每天有查询次数限制,此举旨在扩大用户基础,与其他AI模型竞争。
-
谷歌发布教育AI工具Learn About:谷歌推出专注教育的AI工具“Learn About”,采用教科书式呈现,帮助用户深入理解问题,提供词汇构建和学习上下文功能。
-
谷歌推出iOS版Gemini应用:谷歌为iPhone用户发布独立Gemini AI应用,支持灵动岛和语音聊天功能,并新增实时显示的Gemini Live。
-
OpenAI推出ChatGPT桌面版:OpenAI面向Windows 10/11用户发布桌面版ChatGPT应用,支持快捷键和高级语音功能,用户可通过微软应用商店免费下载。
-
OpenAI模型Orion进展放缓:OpenAI下一代模型进步有限,尤其在编码任务上表现不及前代模型,公司正在探索合成数据训练和性能优化策略。
2024年11月16日,月之暗面旗下的Kimi团队正式发布数学推理模型。基准测试显示,的数学能力可与OpenAI的系列模型(包括和)相媲美(备注:真实体验有待确认)。
月之暗面创始人杨植麟表示,数学是最适合锻炼AI思考能力的场景。在中考、高考、考研以及入门竞赛题等四个数学基准测试中,初代模型的成绩均超过了和。在更高难度的竞赛级别数学题库OMNI-MATH和AIME的基准测试中,初代模型的表现分别达到了最高成绩的90%和83%。
模型将在未来几周分批上线Kimi网页版和Kimi智能助手App端,供用户体验。
2024年11月15日,腾讯官方公众号宣布,旗下AI智能工作台ima正式上线。除了具备大模型AI问答、文字创作、图片生成等功能外,ima还打通了微信公众号文章生态,用户可利用公众号内的知识资源。
用户可通过ima获取从入门到精通的行业问题优质答案。ima的模型会根据用户查询,综合检索包括公众号在内的全网信源,结合匹配度、时效性等因素筛选最佳内容,提供高质量回答。
此外,ima支持边问边看、边搜边记,本地资料也可总结内容、提炼要点、生成思维导图,并支持多国语言翻译。目前,ima已上线Mac和Windows版本。
2024年11月12日,阿里旗下的通义千问团队正式开源了全系列模型。其中,旗舰模型在多个代码生成基准测试(如EvalPlus、LiveCodeBench、BigCodeBench)中表现出色,官方声称其代码能力可与相媲美。
此次开源的模型涵盖0.5B、1.5B、3B、7B、14B和32B六个尺寸,满足不同开发者的需求。除3B模型采用Research Only许可外,其余模型均采用Apache 2.0许可证,进一步促进了开源社区的发展。
马斯克旗下的社交媒体平台X(原Twitter)正在测试将此前仅限付费用户使用的AI聊天机器人Grok免费开放给更多用户。 目前,新西兰的部分用户已可免费使用Grok,但免费版存在一定限制:模型每天限查询10次,模型每天限查询20次,图像分析每天限查询3次。此外,用户账户需注册至少7天并绑定手机号才能使用免费版Grok。xAI于今年8月推出了具备图像生成能力的模型,并于上月为其添加了图像理解功能。通过免费开放Grok,xAI可能旨在扩大用户基础,加快产品反馈循环,以更好地与市场上的其他AI模型如ChatGPT、Claude和Gemini竞争。
但各大媒体报道中没有提到的是,其实xAI已默默开通网页端,地址及使用方法可以看我这篇文章。
2024年11月11日,谷歌发布了一款名为“Learn About”的实验性AI工具,专注于教育领域。该工具基于谷歌今年春季发布的LearnLM模型,旨在根据用户的学习方式量身定制内容。
与传统聊天机器人如Gemini和ChatGPT不同,Learn About提供的答案更具视觉性和交互性,采用教科书式的格式呈现。例如,在回答“宇宙有多大?”这一问题时,Learn About不仅提供了文字解释,还引用了教育网站Physics Forums的图片,并添加了相关学习内容,帮助用户深入理解。
此外,Learn About会为用户提供额外的上下文信息,如“为什么它很重要”以及词汇定义,帮助用户构建词汇量。侧边栏中还提供了额外的主题,供用户进一步探索。
2024年11月14日,谷歌为iPhone用户发布了独立的Gemini AI应用,而此前Gemini在iOS端仅存在于谷歌主应用中。该独立应用不仅增强了功能,还特别针对iOS系统集成了灵动岛功能。
新引入的Gemini Live功能是一大亮点,用户在对话时可以在灵动岛和锁屏上看到Gemini Live,无需切换回主应用即可轻松管理AI互动。需要注意的是,目前还没有上线国区App Store,所以需要切换至其他地区的账户下载该应用。
2024年11月15日,OpenAI宣布正式推出适用于Windows 10和Windows 11的ChatGPT桌面应用。此前,该应用仅对付费用户开放,现已向所有用户免费开放。
该应用支持自定义快捷键,允许用户快速调用ChatGPT的辅助窗口,提供更便捷的使用体验。此外,Windows版ChatGPT还具备高级语音模式功能,进一步提升了用户交互的多样性。 用户可通过微软应用商店免费下载并安装该应用。
据《The Information》报道,OpenAI的下一代旗舰模型在内部测试中显示,尽管其性能有所提升,但与到的巨大飞跃相比,提升幅度相对较小。 尤其是在编码任务中,的表现甚至可能不及前代模型。
为应对这一挑战,OpenAI组建了一个基础团队,专门研究在训练数据逐渐减少的情况下如何持续提升模型性能。新策略包括利用AI模型生成合成数据来训练,以及在模型训练后进行更多优化。OpenAI官方并未对此报道作出回应。