近日,OpenAI公司在直播中表示,其为ChatGPT开发的类似人类的对话功能“ChatGPT Advanced Voice (高级语音模式)”正在实现视觉化,Advanced Voice由OpenAI的多模态模型GPT-4o支持。这意味着OpenAI 终于发布了近七个月前演示的ChatGPT实时视频功能,但目前不是向全部用户开放。
带视觉的ChatGPT Advanced Voice还可以通过屏幕共享了解设备屏幕上的内容。例如,展示案例中给咖啡壶拍照让ChatGPT教授如何制作手冲咖啡。只需给ChatGPT打一通“视频通话”,它能根据你面前的物品,然后手把手教用户完成每一个步骤。在整个演示过程中,ChatGPT的声音自然而亲切,还可以像人类一样大笑。
在ChatGPT中用户还可以上传植物的照片并询问养护技巧,或者展示教科书中的数学问题并要求分步解决方案。
据息,这种集合视觉、听觉、文本还有语音的多模态交互方式非常适合教育场景。
来源:多知
【点击进入京领国际学校大数据平台,
为孩子选择美好人生】
转载或商务合作请联系
电话:010-82362348
微信:Kinglead008