本期智能时代,覆盖全球AI原生应用发展情况、AI视频应用Pika爆火出圈、7家头部公司动态(OpenAI、谷歌、亚马逊、Adobe、字节跳动、百度、昆仑万维)。
正文:
全文6,902字
预计阅读14分钟
全球AI原生应用发展情况,AI应用百花齐放,科技巨头、创业公司同台竞技
ChatGPT 2022年11月30日上线后,引发全球生成式AI浪潮,科技巨头纷纷在基础大模型、算力等方面大规模投入与竞争。随着大模型快速发展,各类生成式AI应用层出不穷,B端、C端均出现不少优秀AI原生应用,实现商业化落地,助力AI产业生态发展。
2023年9月,硅谷著名风投公司a16z发布报告,根据截至2023年6月LikeWeb统计的网页端与移动端APP流量数据,对目前市面上AI原生应用进行梳理,统计并分析访问量前50名应用。
访问量前50名AI应用,该排名仅根据流量数据得出,主要反映消费类AI产品用户使用趋势,不是对所有AI产品或平台的详尽排名
聊天机器人产品位居前列,ChatGPT遥遥领先,陪伴与创意工具正在增加。基于大语言模型的聊天机器人,占榜单总流量的68%;排名前5的AI应用中,4款是聊天机器人产品。
近几个月来,有两类AI应用已开始有大量用户使用。一个是AI伴侣,比如Character.AI;另一个是内容生成工具,比如Midjourney、ElevenLabs;泛内容生成类AI应用中,图像生成是最主要场景,占内容生成类AI应用总流量41%,其次是写作工具、视频生成工具,分别占内容生成类AI应用总流量26%、8%。
ChatGPT,在这次排名中夺冠,问世以来,打破应用程序下载量最快破亿记录。报告显示,ChatGPT每月流量占整个前50名AI应用榜单总流量60%,每月访问量高达约16亿次,在全球网站中访问量排名24。
Character.AI,排第2,特点在于用户可在网站上自定义对话角色,并与之进行交互。
谷歌Bard,排第3,是部署在谷歌最新大语言模型PalM 2上的AI聊天机器人。2023年7月,谷歌对Bard进行扩展更新,增加40种新语言与一些新功能。
Poe,排第4,用户可通过该平台与不同大型语言模型构建的聊天机器人对话,包括OpenAI GPT-3.5与GPT-4、Google PaLM、Meta Llama 2等,美国问答网站Quora旗下产品。
QuillBot,唯一位列前5的写作工具,提供句子改写、文章重写、AI生成内容等功能,用户主要是学生群体。该产品由美国在线辅导网站Course Hero在2017年推出,创立时间较排名前4款产品更早。
科技巨头旗下产品占比少,大多数产品来自AI创业公司。上榜50款AI应用中,只有5款是大型科技公司现有产品或收购产品,剩余产品主要是AI创业公司研发,其中48%公司完全没有外部融资,这些自力更生公司为在技术方面节省支出,大多数没有自己专有模型。
上榜50款AI应用,在底层大模型方面,主要分3种:1、训练自己专有模型;2、微调现有模型;3、在开源模型上构建产品与用户界面UI。
前10名产品中,5款基于自己模型构建,4款是微调模型,只有1款属于开源模型上构建。
AI应用类别多样,免费流量占大头。上榜AI应用类别多样,专为特定场景或工作流程构建的产品,在与更通用工具一起发展,尚未出现赢家通吃的情况。
分类别看,每个类别下排名第1与排名第2AI应用之间,目前流量差异接近1倍。上榜AI应用过去6个月,平均每月流量增长50%左右,未来第1名也有可能被后来者超越。
受益AI热潮,大多数AI应用没有进行大规模营销推广,就能获得可观免费流量与用户规模。大多数上榜AI应用,以免费用户为主,付费用户占比低。
目前多数高流量应用均在网页端,少数应用是移动端流量更高,总体移动端流量处于上升趋势。ChatGPT以网页端为起点,大多数AI应用沿用这种模式,同时很多AI创业公司团队规模不大,无法将注意力与资源同时分散在Web、iOS、Android等多个平台。
上榜50款AI应用中,只有15款AI应用拥有移动端APP,每月总流量中只有不到10%来自APP。
Character.AI的APP流量,约占总流量46%,是榜单上为数不多的主要通过APP获取流量AI应用之一。
文生视频工具Pika 1.0爆火,加速AI视频生成应用发展
2023年11月29日,成立仅半年的美国AI创业公司Pika,正式发布第一款产品AI视频生成工具Pika 1.0,在Pika官网与Discord平台上线,支持网页端与移动端使用。用户输入文字,AI能自动生成与编辑3D动画、动漫、卡通、电影等视频。
Pika 1.0凭借强大视频生成能力,一夜爆火,席卷硅谷AI圈。目前Pika 1.0已开启申请试用,预约名额持续增长,Pika社区已发展到50万名用户,每周生成数百万个视频。
Pika公司联合创始人95后女生郭文景,父亲是A股上市公司信雅达科技实控人郭华强,母亲是麻省理工毕业高材生。
2015年,郭文景曾作为浙江第一个被哈佛本科提前录取的学生被央视报道,被称为哈佛天才少女。郭文景高一获全国青少年信息学奥林匹克联赛(浙江省赛区)一等奖,随后两次拿到奥林匹克数学比赛冠军;此后受美国麻省理工学院邀请参加比赛,获北美编程邀请赛第2名,超过来自哈佛、斯坦福、卡内基梅隆等大学代表队。
进入哈佛后,郭文景一边攻读学业,还先后去Meta AI Research、微软、谷歌大脑、Epic Games等公司实习,拿到计算机硕士与数学本科学位,又到斯坦福大学读博。
2022年,郭文景与几位博士同学参加Runway首届AI电影节,本来他们对获奖很有信心。但在用AI工具制作电影过程中,她们发现Runway、Adobe Photoshop等工具不好用,最后没有获奖。既然现有工具不好用,不如自己开发。
2023年4月,郭文景与同学Chenlin Meng一起从斯坦福退学创业,共同开发AI视频工具Pika。
《福布斯》报道,Pika成立仅半年,Pika已完成3轮融资,总金额5,500万美元;前两轮由前GitHub CEO Nat Friedman领投,最近一轮3,500万美元A轮融资由Lightspeed Venture Partners领投;Pika目前估值2~3亿美元之间,超过10亿人民币。
Pika身后投资人阵容不容小觑,包括OpenAI董事会成员Adam D'Angelo与技术大神Andrej Karpathy(前特斯拉AI总监),前Github CEO Nat Friedman,Hugging Face创始人Clem Delange,Giphy联合创始人Alex Chung,YC合伙人Daniel Gross,硅谷著名投资人Elad Gil等。
投资大佬对Pika产品高度认可。Friedman表示,自己对Pika团队使用单GPU制作出的初期demo,印象非常深刻。Karpathy在社交平台上评价,Pika影响令人难以置信,每个人都成为多模态梦想的导演,就像《盗梦空间》中建筑师一样。
不可思议的是,Pika团队目前只有4位全职成员,郭文景担任Pika CEO,Chenlin Meng担任CTO。郭文景接受采访时表示,Pika将持续轻体量化发展,随用户暴增,2024年或将团队拓展到20人。
郭文景与Chenlin Meng
Pika 1.0核心功能是AI视频生成与AI视频编辑。
AI视频生成方面,Pika 1.0主要通过两种方法实现。
一是文字生成视频:例如,通过输入提示词elon musk in a space suit, 3d animation,便可得到马斯克穿着太空服的动画视频。
二是提示词搭配图片:实现方式是以图片为第一帧,通过文字控制动画演示效果与镜头,例如,为《最后的晚餐》图片,配上提示词the last supper, dolly out,便可实现让这幅世界名画动起来。
生成质量看,Pika生成视频在画质清晰度与动画连贯性上均表现出色,相比Runway生成视频质量,稳定性更高。
Pika 1.0生成视频
AI视频编辑方面,Pika 1.0主要有风格转换、尺寸调整、内容编辑、时长剪辑四大功能。
风格转换:官方演示效果看,基于用户提供视频,通过提示词,便可实现影视内容从像素风,到黑白影像、乃至现代风格的互通切换。
尺寸调整:Pika 1.0内置16:9、5:2、1:1、9:16四种尺寸,供用户选择视频比例,在拉伸画布过程中可对影像内容进行自动填充,避免出现留白或破坏视频观感。
内容编辑:用户只需框选想要编辑影像范围,配以恰当提示词,便可实现对影像内容的自由修改,包括增添、修改视频中特定元素等。
时长剪辑:用户可使用AI,扩展现有视频时长等。
Pika 1.0编辑视频
Pika力求为日常消费者提供有趣产品,与Runway相比各有擅长。Pika之前,Runway、Stable Video Diffusion等AI视频应用功能已十分亮眼,在AI视频技术不断发展同时,行业竞争逐渐加剧,Pika与Runway等竞品相比,风格侧重有所不同。
视频时间上:Pika生成视频最长时间为3秒,低于Runway 18秒。
生成视频风格上:Runway生成视频现实感更强,Pika生成视频更具立体感与动画感。
发展目标上:Runway目标是为有视频与图像编辑需求的个人和企业,提供更高效服务,Pika致力为日常消费者提供有趣产品。
Pika 1.0发布同一时期,海外多家企业接连推出AI视频生成工具或功能更新,AI视频工具密集发布,助推行业景气向上,也代表AI多模态能力持续进步,有望为影视、游戏、营销等行业提供助力,广泛帮助各行业降本增效。
2023年11月3日,Runway推出Gen-2更新,支持4K超逼真清晰度作品,之后不久发布动态笔刷Motion Brush功能。
操作上,用户仅需拖动鼠标对静态图像刷一刷,便可使指定区域动起来,从而得到一段动画视频,用户可自由选择不连贯的区域,还能控制元素运动的方向与状态。实测效果看,目前动画稳定性与连贯性,仍有较大进步空间。
Runway同步上线风格预设功能,提供26个无需复杂提示,便可直接选用的视频滤镜,与能配合Motion Brush使用的大师级运镜效果。
2023年11月23日,Adobe宣布已完成收购印度AI初创公司Rephrase Al,该公司在生成式AI、音视频技术、文本到视频生成工具等方面积累丰富,预计将有效扩展Adobe生成式视频功能。
2023年11月24日,Stability AI发布最新生成式视频模型Stable Video Diffusion,宣布对外开源,支持基于文本、图像生成视频,仅需较小算力,便能以3~30帧/s可定制帧率,生成14、25帧的视频。
头部公司动态
OpenAI用户自定义GPTs应用已达3.2万个,ChatGPT网站流量接近峰值水平
2023年11月6日,OpenAI举办首届开发者大会,正式公布GPT Store应用商店与用户自定义GPTs功能。GPTs可针对特定任务进行定制,允许任何人无需编码,即可创建与共享自己GPT应用,大幅降低AI应用创建门槛。OpenAI通过共享收益方式,提升用户创作积极性,发展AI应用生态。
OpenAI官方目前开发并上线16个GPTs应用,包括具备多模态能力的DALL·E。截至2023年11月20日,GPTs功能上线半个月后,DALL·E以22.3%份额,位居GPTs应用排行榜第1,代表用户对多模态应用旺盛需求。
GPTs Hunter统计,截至2023年12月3日,GPTs应用数量已达3.2万个,不乏处理多种类型数据的多模态应用。
OpenAI原计划2023年11月底正式推出GPT Store应用商店。
2023年12月2日,OpenAI向GPTs开发者发布一封信,宣布GPT Store应用商店将推迟至2024年初发布,原因是最近CEO罢免事件,影响产品研发进度,同时收到大量GPTs使用反馈,希望优化该产品。
部分GPTs应用
Similarweb数据,ChatGPT网站流量,2023年以来,经过爆发式增长,2023年4月、5月,ChatGPT网站每月全球访问量达到18亿次左右峰值。
2023年6月开始,经过大量新用户尝鲜后,ChatGPT网站连续3个月流量下滑,2023年8月访问量降至14亿人次左右。
2023年9月开始,受益产品端持续改进与新学年开学等因素影响,ChatGPT网站实现连续2个月流量正增长,分别同比增长4.45%、13.75%,2023年10月流量已超过17亿人次,接近历史峰值水平。
ChatGPT网站流量,仅美国本土访问人次看,2023年4月达到1.88亿次峰值,2023年6月降至1.37亿次左右,2023年9月份回到1.64亿次左右,2023年10月超过1.92亿次,超过历史峰值水平。
谷歌发布首个AI Core应用更新,赋能手机端本地AI大模型运行
2023年11月28日,谷歌面向Pixel 8 Pro手机,发布AI Core应用首个更新,用于在安卓手机本地管理与运行AI大模型。
AI Core是谷歌推出的一种后台服务,在设备本地运行后,将为Pixel 8 Pro的Android系统与其他应用程序,提供最新AI大模型支持,与其他系列AI驱动功能。
用户可通过AI Core应用,管理本地运行的AI模型,还配AI Core Persistent开关,以便应用始终驻留内存,支持随时调用AI大模型,并长时间运行。
通过在手机设备本地运行AI大模型,可减少对云端算力依赖,提高AI大模型运行性能与隐私性。
谷歌推出AI Core,目前仅限Pixel 8 Pro机型,预计后续会向其他Pixel机型与其他安卓手机品牌开放。
谷歌AI Core应用
亚马逊推出生成式AI服务Amazone Q与AI编程工具CodeWhisperer正式版
2023年11月28日,亚马逊AWS举办2023 re:Invent大会,推出生成式AI服务Amazone Q。该服务核心定位B端,旨在利用企业私有知识完成任务,能与AWS旗下诸多产品结合使用,更好助力企业提升运营与开发效率。
当前公开能力,包括:1、Amazon Q,作为客户在亚马逊AWS上构建、部署与操作应用程序和工作负载的专家,能通过自然语言问答形式,帮助开发人员快速获取所需服务;2、通过代码转换能力,帮助开发人员简化应用程序开发与维护;3、通过连接到企业客户的业务数据、信息系统,根据每个用户身份、角色、权限,与用户进行个性化交互;4、生成图表信息分析报告,支持客户进行高度定制。
亚马逊在2023 re:Invent大会上,还推出CodeWhisperer正式版。亚马逊2022年6月推出AI编程工具CodeWhisperer预览版;开发人员经过1年多改进,为CodeWhisperer正式版加入多项新功能,包含发现与修复代码漏洞能力,新增基础架构即代码Infrastructure as Code服务,允许在Visual Studio 2022中使用等,还可强化开发者脚本编写效率。
CodeWhisperer正式版支持Python、Java、JavaScript等语言,可依据开发者代码编写风格与变量名称,提供系列代码建议。
CodeWhisperer正式版
Adobe召开年度创意大会Adobe MAX,宣布AI应用Firefly全面商用
美国软件巨头Adobe,推出Photoshop等多款软件,一直是创意人员日常工作必备工具。生成式AI兴起以来,Adobe持续开发优化软件AI功能,推动AI产品商业化落地。
2023年10月10日,Adobe召开年度创意大会Adobe MAX,宣布多种新AI工具与服务。
Adobe展示AI视频编辑技术Project Fast Fill,用户只需输入文字提示,就能在几秒内删除、添加对象或更改背景元素,减少大量琐碎工作。
Adobe推出3个新的生成式AI模型,图片编辑功能获全面升级。新发布Firefly Vector汇集Adobe矢量图形与生成式AI专业知识,是全球首个用于矢量图形的生成AI模型。
Adobe此前公布旗下生成式AI工具Firefly商业化方案,采用点数制收费模式,用户使用AI作图时消耗生成点数,每个点数对应一张图,每月可免费获得25点生成点数,同时可以付费购买额外点数,支持单独购买,或购买Creative Cloud全家桶(含Photoshop等服务的Adobe全家桶)。
中国香港地区Firefly个人版加油包,月付价格38港币,年付价格336港币,包含每月100个生成点数与去水印功能。人民币计算,最低档订阅生成一张图,价格约0.35元。
Creative Cloud全家桶,中国香港地区用户,月付价格618港币,按年订阅可享优惠价格228港币/月,或年付价格2,736港币,包含每月1,000个生成点数、教学课程等服务。
字节跳动成立新部门Flow,加速布局AI应用层
字节正把资源与人力,倾斜向信息平台运营与商业化,新的探索集中在AI领域,从模型层到应用层全面布局。
字节在大模型战略上,沿着三条路线同时进行,领导者分别是TikTok产品技术负责人、大模型团队负责人朱文佳,侧重大模型业务落地探索;字节人工智能实验室AI Lab总监李航,偏重学术研究;数据-应用机器学习Data-AML负责人项亮,处于前两者中间位置。
字节在大模型业务侧,分别在语言与图像两种模态上发力。语言大模型团队,由字节搜索部门领导,目前规模在十数人左右;图像大模型团队,由产品研发与工程架构部下属的智能创作团队牵头;两个团队均向朱文佳汇报。
2023年8月,字节上线首个大语言模型豆包、多模态大模型BuboGPT;2023年8月底,抖音云雀大模型,通过中国监管部门首批备案,面向公众开放。字节还推出大模型服务平台火山方舟,面向企业提供模型精调、评测、推理等全方位平台服务。
2023年11月,字节进行多项业务与架构调整,包括成立专注AI创新业务的新部门Flow,该部门由朱文佳担任业务负责人,技术副总裁洪定坤担任技术负责人。Flow除正开始进行大量招聘外,也从飞书、抖音等各BU抽调人选,研发大模型C端产品。
Flow部门已推出两款AI对话类产品,豆包、Cici,分别面向国内、海外市场,有多个AI相关创新产品在孵化中。字节正在致力开发文本到图像的AI生成器,与Midjourney类似。
字节跳动未来战略规划,探索新的生成式AI产品与现有产品整合方式。
2023年12月4日,字节跳动一份内部备忘录披露,机器人开发平台项目计划,将在2023年12月底推出公开测试版,将允许用户自主创建自己的聊天机器人。
百度上线国内首个AI原生应用商店,推出AI原生应用超级助理
2023年10月17日,百度举办百度世界2023大会,百度智能云宣布,百度智能云千帆大模型服务平台已服务1.7万多家客户,覆盖近500个场景。
生态建设,是百度智能云在大模型时代最重要一环,百度智能云大模型生态支持体系分为三部分。
第一,从多个方面支持开发者与创新企业,开展大模型实训营,为新入行开发者与企业客户提供培训支持,与创新应用孵化等支持。
第二,百度智能云打造国内首家面向企业客户,进行一站式交易的AI原生应用商店,千帆AI原生应用商店,加速AI原生应用商业化落地。
第三,百度智能云建设千帆社区,为广大开发者提供交流、分享AI原生开发案例与实践经验。
百度千帆AI原生应用商店,2023年10月16日正式上线,金蝶等合作伙伴打造的首批精选应用已入驻商店。
用户可通过百度智能云官网进入商店,看到新品推荐榜、热门应用榜、行业推荐榜等各类榜单,快速找到最新、最热门AI原生应用。同时该应用商店,连接AI原生应用供应商与需求方,提升企业客户在应用选择与采购方面效率,帮助开发者更快速把应用推向市场,致力成为大模型商业机会汇集地,进一步加速AI原生应用商业化落地。
百度千帆AI原生应用商店
2023年12月4日,百度智能云发布基于文心一言的AI原生应用超级助理,已正式开启公测。
超级助理,能以浏览器插件Web Copilot形态,在用户使用浏览器过程中,随时感知用户需求,在解析复杂问题、辅助文案创作、智能文档处理、对话式搜索、全文翻译等场景中提供帮助,还支持集成到不同系统中,有望打造一站式超级AI助手。
昆仑万维发布天工SkyAgents,零代码打造AI智能体
2023年12月1日,昆仑万维发布天工SkyAgents平台,基于公司天工大模型打造,具备从感知到决策、从决策到执行的自主学习与思考能力。
通过该平台,用户仅需利用自然语言与菜单式操作,无需拥有任何编程知识,便可完成部署独属于自己的AI代理AI Agent,进而完成研报撰写、单据填报、创意设计、旅行航班设定等多项私人定制需求。
针对B端,天工SkyAgents可按需拼装成企业IT、智能客服、企业培训、HR、法律顾问等多种个性化应用,支持一键服务部署,确保在不同业务系统之中无缝接入。
应用上,天工SkyAgents主要具有3大优势:
1、通过将Agent-to-Agent、Human-to-Agent交互模式,集成在高度模块化大语言模型中,实现完全无代码化操作,人机交互更友好。
2、具备数据检索增强能力,支持导入更多格式与更大规模数据和知识。