来源:AITOP100
OpenAI公司于12月10日宣布,其最新研发的视频生成模型Sora现已面向用户全面开放。自首次公开预览以来,该产品已历经10个月的精心打磨。Sora的独到之处在于,它能够根据用户的文本指令生成高度逼真的视频内容。据悉,Sora将率先向美国及其他市场的ChatGPT付费用户提供服务。为满足不同层级的用户需求,OpenAI还推出了升级版的Sora Turbo,该工具能够生成最长20秒的视频,并提供多种视频变体供用户选择。
来源:AIbase基地
近日,Reddit推出了名为“Reddit Answers”的新功能,旨在通过AI技术提升平台搜索的效率和相关性。然而,这一新功能并未获得用户的广泛好评,许多用户反映搜索功能仍存在诸多问题,对其实际效用表示怀疑。
来源:站长之家
艾伦人工智能研究所(AI2)近日发布了Tülu3系列模型,这是一套完全开源的先进语言模型,其性能与GPT-4o-mini等闭源模型不相上下。Tülu3不仅提供了模型数据、代码、训练配方,还配备了评估框架,旨在推动开源模型后训练技术的进一步发展。
来源:量子位
Adobe与MIT的研究团队共同推出了一项名为CausVid的自回归实时视频生成技术。该技术使得AI能够在生成首帧画面后立即开始播放视频,后续内容则动态生成并无缝衔接,从而极大地缩短了视频生成的等待时间。据研究团队介绍,这一创新技术有望彻底改变视频生成和播放的传统模式。
来源:智见AGI
为解决RAG(Retrieval-Augmented Generation)模型在实际应用中可能出现的回答不准确问题,亚马逊近日发布了一款名为RAGChecker的开源工具。该工具能够对RAG系统进行全面、可靠、细粒度的诊断,为开发者和研究人员提供改进性能的可操作方向,从而助力打造更智能、更可靠的RAG系统。
来源:站长之家
Stability AI的新任首席执行官普雷姆・阿卡拉朱在近期的一次会议上透露,经过一段艰难时期后,公司现已恢复增长态势,业务增长率达到三位数,并成功清偿了所有债务。阿卡拉朱表示,公司目前正专注于API和许可服务的发展,业务正蓬勃发展。
来源:新智元
近日,智源研究院推出了首个利用大规模无标注互联网视频学习的3D生成模型See3D。该模型采用全新的视觉条件技术,仅需输入单张图片即可生成逼真的3D世界。See3D不仅支持零样本和开放世界的3D生成,还具备广泛的适用性,可应用于3D编辑、表面重建等多种任务中。这一创新成果被视为迈向空间智能的重要一步。