分享好友 最新动态首页 最新动态分类 切换频道
AIGC周报 | 腾讯大模型上线文生视频;李飞飞空间智能首秀
2024-12-27 00:25

  近年来,随着大数据、云计算、深度学习等技术的飞速发展,AIGC作为人工智能领域的重要分支,正深刻改变着内容创作、信息检索、人机交互等多个领域。接下来让我们一起来看看过去的一周AIGC领域发生的新鲜事!

  腾讯大模型上线文生视频,并宣布开源

  12月3日,腾讯宣布,混元大模型上线并开源文生视频能力,参数量达130亿,支持中英文双语输入。“用户只需要输入一段描述,即可生成视频。”腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝App,用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。

图片来源:腾讯混元微博截图

  可灵AI导演共创计划9部AIGC电影短片正式上线

  12月6日,由快手可灵AI联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位导演打造的9部AIGC电影短片正式亮相,涵盖奇幻、志怪、亲情、动画等多元类型。首映礼现场,快手将可灵AI导演共创计划的9部AIGC电影短片捐赠给中国电影博物馆。作为中国首个AIGC导演共创计划的成果,9部AIGC电影短片被中国电影博物馆永久收藏、放映展示。

图片来源:可灵AI微博截图

  艾媒分析师点评:AI生成视频技术的迅猛发展正引领着影视创作与传播的深刻变革。2024年年初OpenAI发布的sora让世界看到了AI生成视频令人惊叹的质量,而时至今日仍未对外开放的sora似乎正在被一大批中国的视频生成模型迎头赶上。腾讯混元大模型的文生视频能力上线并开源,标志着国内在视频大模型领域的又一重要突破,其130亿参数量与双语支持展现国产视频生成模型技术的强大实力。与此同时,快手可灵AI通过导演共创计划,将AIGC电影短片推向实际应用,不仅拓宽了艺术创作的边界,也为中国电影博物馆增添了未来艺术的瑰宝。

  除了电影短片,2024年9月,《聊斋志异》系列AI短剧上线各大平台,从短剧到电影短片,是AI生成视频在质感、逻辑、连贯性上的全面提升。目前,AI生成视频正逐步渗透影视、广告、游戏等行业,这一趋势不仅重塑了内容生产的模式,也为文化产业注入了前所未有的活力与创造力,未来,AI生成视频技术将持续拓展应用场景,推动影视行业的全面革新与发展。

  阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源

  11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。QwQ(Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的AI推理模型。阿里云通义千问团队研究发现,当模型有足够的时间思考、质疑和反思时,其对数学和编程的理解就会深化。

  OpenAI推出“满血版”推理模型o1和ChatGPT Pro

  12月6日,OpenAI为期12天的活动开幕。在第一天的活动上,OpenAI创始人Sam Altman表示,今天发布的是“满血版”推理模型o1和ChatGPT Pro(每月订阅费200美元)。据介绍,o1是世界上最智能的模型。比o1-preview更智能、更快速、功能更多(例如多模态)。现已在ChatGPT中上线,即将在API中推出。新推出的ChatGPT Pro将能够充分利用模型和工具,包括无限接入OpenAI o1和一个仅仅有Pro版本的o1。

  艾媒分析师点评:当前,推理AI正在蓬勃兴起。从国外OpenAI的o1到国内通义千问的QwQ、月之暗面的k0 math和Deepseek的DeepSeek-R1-Lite,一个个具有推理能力的AI大模型昭示着人工智能正一步步学会像人类一样深度思考与推理,而非像传统的大语言模型那样只能理解字面意思、搜索并整理海量信息却较难进行自我判断与纠正。国产推理大模型表现出色,在一些数学能力评测中,得分甚至不输于o1,在全面考察数学解题能力的MATH-500评测中,QwQ斩获90.6%的高分,一举超越了o1-preview和o1-mini。采用强化学习和思维链推理技术的大模型能够试图模拟人类的思考和反思过程,从而增强AI的数学推理能力。推理AI的发展与完善将帮助人类解决复杂困难的数学问题,促进知识的发展,进一步推动国际事务和科学技术等领域难题取得突破性进展。

  “AI教母”李飞飞空间智能首个模型诞生!一张图可生成交互式3D场景

  当地时间12月2日,AI学者、斯坦福大学教授李飞飞公布了她第一个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。虽然已有众多AI工具可以将照片转换为3D模型和场景,而World Labs称,他们所生成场景的独特之处在于它们具有交互性,而且是可修改的。“(我们的技术)能让你走进任何一张图像,并以3D的形式对其进行探索。”World Labs在一篇博客文章中写道。在World Labs网站的演示里,这些由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。

  DeepMind发布新基础世界模型Genie 2,解锁游戏制作新纪元

  仅在李飞飞的团队发布新模型的两天后,当地时间12月4日,谷歌DeepMind官宣了其最新一代大规模基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的可玩3D世界。Genie 2与World Labs有诸多相同之处,如单图生成可交互3D场景、空间记忆能力和扩图能力,但在底层技术逻辑上,二者仍有本质区别。普林斯顿AI创新中心创始人、主任,终身教授王梦迪表示Genie2使用的是video diffusion(视频扩散)技术,每一帧画面的生成都基于pixel prediction(像素预测),并通过额外的用户输入的引导来影响下一帧的概率分布;而World Labs则做到了挖掘世界的物理本质,从图片出发,估计图片中不同景物的深度和相对关系,从而生成了更加物理世界的3D环境建模。

  艾媒分析师点评:“世界模型”是近年来兴起的人工智能新领域,该类模型旨在创建对世界运作方式的内部表征,并具备推理行动后果的能力,可用于预测未来环境状态,帮助AI做出更明智的决策。World Labs和DeepMind发布的世界模型标志着AI技术在模拟和交互虚拟环境方面的巨大进步。这些模型不仅能够从单张图片生成可交互的3D场景,还提升了控制力和一致性。World Labs的系统通过估算3D几何形状和填补场景中未见部分,生成新内容,使用户能够以游戏般的方式自由探索3D场景。而DeepMind的Genie 2则能够生成可交互的3D游戏,并且保持虚拟世界的一致性,即使在视野之外也能准确再现场景。这些技术的应用将改变电影、游戏、模拟器等数字内容的制作方式,为创作者提供更快速的构思和开发流程。同时,作为世界模型,它们在机器人技术、游戏开发和气候建模等领域的潜在影响也不容忽视,为AI的未来发展开辟了新的可能性。

  广电总局再发管理提示,规范AI“魔改”短视频

  12月7日,广电总局网络视听司发布《管理提示(AI魔改)》指出,近期,AI“魔改”视频以假乱真、“魔改”经典现象频发。如《甄嬛传》变身“枪战片”、《红楼梦》改成“武打戏”、孙悟空骑着摩托车扬长而去等。《管理提示》认为,这些视频为博流量,毫无边界亵渎经典IP,冲击传统文化认知,与原著精神内核相悖,且涉嫌构成侵权行为。《管理提示》提出具体管理要求。首先,各相关省局督促辖区内短视频平台排查清理AI“魔改”影视剧的短视频,并于12月10日反馈工作情况;第二,严格落实生成式人工智能内容审核要求,举一反三,对各自平台开发的大模型或AI特效功能等进行自查,对在平台上使用、传播的各类相关技术产品进行严格准入和监管,对AI生成内容做出显著提示。

  加拿大多家媒体起诉OpenAI侵犯版权

  艾媒网(iimedia.cn)获悉,加拿大多家主流媒体11月29日入禀法院,以侵犯版权为由,对开发人工智能应用ChatGPT的美国科技公司OpenAI联合提起诉讼。兴讼媒体指称,OpenAI“经常违反”版权和在线使用条款,从加拿大媒体上抓取大量内容,以帮助开发ChatGPT等产品。OpenAI在未获内容所有者许可或对此作出补偿的情况下,利用这些内容并从中获利。

最新文章
香港2024正版免费资料,最新热门解答落实_mShop94.881
随着科技的不断发展,香港的电子商务市场也在不断壮大。2024年,香港的正版免费资料市场迎来了新的机遇和挑战。mShop94.881作为一个新兴的电商平台,以其独特的服务和优势,迅速在市场上占据了一席之地。本文将详细介绍mShop94.881的最新热
微信定位革新之旅,实时定位修改功能的未来展望(2024年12月18日)
随着科技的飞速发展,微信不仅仅是一个社交平台,更是现代生活方式的标志,在即将到来的XXXX年,微信再次引领风潮,推出全新的实时定位修改功能,将用户体验推向新的高度,这一创新技术不仅重塑了社交互动模式,更彰显了科技改变生活的无限
揭秘林芝SEO站内优化技巧,高效提升网站排名攻略
本文深度解析林芝SEO站内优化策略,从关键词布局、内容质量、内部链接等方面,为网站排名提升提供有效指导。通过实施这些策略,网站可提升用户体验,增强搜索引擎友好度,从而实现良好的排名效果。随着互联网的飞速发展,SEO(搜索引擎优化
谷歌正面迎战微软,ChatGPT打响搜索攻防战
聊天机器人ChatGPT爆火之下,各家都在寻求切入角度。谷歌正手忙脚乱,因为有微软+OpenAI打来的一记组合拳。微软最近官宣要把类ChatGPT技术嵌入必应搜索引擎和自家的Edge浏览器中。因为展现形式可能被颠覆,搜索界要迎来代际变革已成共识。
长链接怎样转成口令打开?
词令是一款关键词口令直达工具。打开词令,输入口令,直达该口令关联的目标。网址转成口令后,就可以通过词令,输入口令,打开口令关联的目标网址。口令打开网址体验口令是:vip88,请打开词令App或词令官网,输入口令【 vip88 】,搜索直
深入解析SEO外链建设,让SEO站长发外链不再迷茫
对于那些做SEO的人来说,外部链的构建是他们工作中不可或缺的一部分。为什么每个人都愿意做外链?原因还在于深层次的pagerank算法。搜索引擎技术不断进步,搜索引擎算法也日趋多样化。搜索引擎的目的是提供更好的搜索结果。关于SEO外部链的
最新部落冲突360版,游戏变革与深度体验分享
摘要:最新版本的360版部落冲突游戏带来了诸多变革与全新体验。游戏更新优化了界面设计,增加了新的战斗策略和英雄角色,提升了游戏的互动性和竞技性。玩家可以组建或加入部落,与全球玩家一同合作,共同争夺资源和领地。新版本还加强了社
超级文本处理工具 v3.3
超级文本处理工具 v3.3 骨瘦如柴百鸟画蛇添足鸣春10. 生活中能够没有诗歌,但不能没有诗意;行进中能够没有道路,但不能没有前进的脚步;工作中能够没有经验,但不能没有学习,人生中能够没有闪光,但不能有污迹。写作高手使用的高难度表达:
抖音豆包爆火!龙头10天6板 受益上市公司梳理
  豆包大模型概念股领涨AI赛道,公司移动应用分发平台服务了豆包在内的众多头部AI类产品的周五收盘10天6板,居然设计家业务正在与豆包进行对接的6天5板,与字节跳动旗下的豆包就智能设备领域进行初步洽谈的盘中一度20CM涨停。  消息面
贵宾犬能吃香蕉吗 饮食禁忌有哪些
贵宾犬是能吃香蕉的,但如果是没有打疫苗的幼犬,建议不要给它喂食香蕉,否则容易引起狗狗腹泻。此外,也不可给狗狗食用太多,过多会导致肠道菌群失衡。贵宾犬是可以吃香蕉的,在狗狗便秘或食欲不好的时候给于适当的香蕉可以起到调节作用,
相关文章
推荐文章
发表评论
0评