AI Weekly『11月11-17日』：Kimi发布新一代数学推理模型，腾讯推出AI工作台ima！

AI Weekly『11月11-17日』：Kimi发布新一代数学推理模型，腾讯推出AI工作台ima！

2024-12-23 13:11

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效率提升，AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

马化腾谈及AI时说：“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇，所以我们觉得非常重要。”

AI Weekly回来了！

“AI Weekly”是AI领域的前沿资讯周报，每周与你相约，精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒，帮助你高效掌握最新动态，增强对AI技术及应用趋势的洞察力。

省流版摘要

月之暗面发布k0-math数学模型：月之暗面发布数学推理模型，在多项数学基准测试中表现超越OpenAI的和。模型将在几周内上线Kimi网页版和App端。
腾讯上线AI工作台ima：腾讯推出AI智能工作台ima，打通微信公众号生态，支持问答、创作、图片生成、内容总结、思维导图和多语言翻译，现已上线Mac和Windows版本。
阿里开源Qwen2.5-Coder模型：阿里巴巴开源系列模型，包括六种尺寸，旗舰模型在代码测试中表现媲美GPT-4o。
X平台免费开放Grok聊天机器人：X平台测试免费开放AI机器人Grok，用户每天有查询次数限制，此举旨在扩大用户基础，与其他AI模型竞争。
谷歌发布教育AI工具Learn About：谷歌推出专注教育的AI工具“Learn About”，采用教科书式呈现，帮助用户深入理解问题，提供词汇构建和学习上下文功能。
谷歌推出iOS版Gemini应用：谷歌为iPhone用户发布独立Gemini AI应用，支持灵动岛和语音聊天功能，并新增实时显示的Gemini Live。
OpenAI推出ChatGPT桌面版：OpenAI面向Windows 10/11用户发布桌面版ChatGPT应用，支持快捷键和高级语音功能，用户可通过微软应用商店免费下载。
OpenAI模型Orion进展放缓：OpenAI下一代模型进步有限，尤其在编码任务上表现不及前代模型，公司正在探索合成数据训练和性能优化策略。

2024年11月16日，月之暗面旗下的Kimi团队正式发布数学推理模型。基准测试显示，的数学能力可与OpenAI的系列模型（包括和）相媲美（备注：真实体验有待确认）。

月之暗面创始人杨植麟表示，数学是最适合锻炼AI思考能力的场景。在中考、高考、考研以及入门竞赛题等四个数学基准测试中，初代模型的成绩均超过了和。在更高难度的竞赛级别数学题库OMNI-MATH和AIME的基准测试中，初代模型的表现分别达到了最高成绩的90%和83%。

模型将在未来几周分批上线Kimi网页版和Kimi智能助手App端，供用户体验。

2024年11月15日，腾讯官方公众号宣布，旗下AI智能工作台ima正式上线。除了具备大模型AI问答、文字创作、图片生成等功能外，ima还打通了微信公众号文章生态，用户可利用公众号内的知识资源。

用户可通过ima获取从入门到精通的行业问题优质答案。ima的模型会根据用户查询，综合检索包括公众号在内的全网信源，结合匹配度、时效性等因素筛选最佳内容，提供高质量回答。

此外，ima支持边问边看、边搜边记，本地资料也可总结内容、提炼要点、生成思维导图，并支持多国语言翻译。目前，ima已上线Mac和Windows版本。

2024年11月12日，阿里旗下的通义千问团队正式开源了全系列模型。其中，旗舰模型在多个代码生成基准测试（如EvalPlus、LiveCodeBench、BigCodeBench）中表现出色，官方声称其代码能力可与相媲美。

此次开源的模型涵盖0.5B、1.5B、3B、7B、14B和32B六个尺寸，满足不同开发者的需求。除3B模型采用Research Only许可外，其余模型均采用Apache 2.0许可证，进一步促进了开源社区的发展。

马斯克旗下的社交媒体平台X（原Twitter）正在测试将此前仅限付费用户使用的AI聊天机器人Grok免费开放给更多用户。目前，新西兰的部分用户已可免费使用Grok，但免费版存在一定限制：模型每天限查询10次，模型每天限查询20次，图像分析每天限查询3次。此外，用户账户需注册至少7天并绑定手机号才能使用免费版Grok。xAI于今年8月推出了具备图像生成能力的模型，并于上月为其添加了图像理解功能。通过免费开放Grok，xAI可能旨在扩大用户基础，加快产品反馈循环，以更好地与市场上的其他AI模型如ChatGPT、Claude和Gemini竞争。

但各大媒体报道中没有提到的是，其实xAI已默默开通网页端，地址及使用方法可以看我这篇文章。

2024年11月11日，谷歌发布了一款名为“Learn About”的实验性AI工具，专注于教育领域。该工具基于谷歌今年春季发布的LearnLM模型，旨在根据用户的学习方式量身定制内容。

与传统聊天机器人如Gemini和ChatGPT不同，Learn About提供的答案更具视觉性和交互性，采用教科书式的格式呈现。例如，在回答“宇宙有多大？”这一问题时，Learn About不仅提供了文字解释，还引用了教育网站Physics Forums的图片，并添加了相关学习内容，帮助用户深入理解。

此外，Learn About会为用户提供额外的上下文信息，如“为什么它很重要”以及词汇定义，帮助用户构建词汇量。侧边栏中还提供了额外的主题，供用户进一步探索。

2024年11月14日，谷歌为iPhone用户发布了独立的Gemini AI应用，而此前Gemini在iOS端仅存在于谷歌主应用中。该独立应用不仅增强了功能，还特别针对iOS系统集成了灵动岛功能。

新引入的Gemini Live功能是一大亮点，用户在对话时可以在灵动岛和锁屏上看到Gemini Live，无需切换回主应用即可轻松管理AI互动。需要注意的是，目前还没有上线国区App Store，所以需要切换至其他地区的账户下载该应用。

2024年11月15日，OpenAI宣布正式推出适用于Windows 10和Windows 11的ChatGPT桌面应用。此前，该应用仅对付费用户开放，现已向所有用户免费开放。

该应用支持自定义快捷键，允许用户快速调用ChatGPT的辅助窗口，提供更便捷的使用体验。此外，Windows版ChatGPT还具备高级语音模式功能，进一步提升了用户交互的多样性。用户可通过微软应用商店免费下载并安装该应用。

据《The Information》报道，OpenAI的下一代旗舰模型在内部测试中显示，尽管其性能有所提升，但与到的巨大飞跃相比，提升幅度相对较小。尤其是在编码任务中，的表现甚至可能不及前代模型。

为应对这一挑战，OpenAI组建了一个基础团队，专门研究在训练数据逐渐减少的情况下如何持续提升模型性能。新策略包括利用AI模型生成合成数据来训练，以及在模型训练后进行更多优化。OpenAI官方并未对此报道作出回应。