OpenAI新王炸:ChatGPT语音助手可以“看”人说话了能实时视频对话
发布日期: 2025-01-23
OpenAI为期12个事业日的新产物和手艺公布行动出了新王炸:正在初次公然演示快要七个月后,OpenAI正式面向壮伟付用度户推出ChatGPT类人高级人工智能(AI)语音助手的新效用,及时视频对线日周四,OpenAI公告,正在ChatGPT的挪动端运用次第App中,上线ChatGPT高级语音形式Advanced Voice的视频和共享屏幕效用。Advanced Voice由OpenAI的众模态模子GPT-4o助助。
OpenAI的咨询员正在直播中演示了任何使用新效用,点击ChatGPT 谈天栏旁边的语音图标,然后点击左下角的视频图标,就能够启动视频对话。假如思共享屏幕,手机用户重点击掀开一个有三个喧哗的菜单,采用此中的“共享屏幕”(Share Screen)。
![]()
正在和ChatGPT的视频对话中,OpenAI咨询员提问,咨询员先让GPT看到并和现场的OpenAI事业职员区分打过宽待,然后问GPT,现场谁的妆扮最像圣诞白叟,谁像圣诞白叟的驯鹿,GPT均作出确实而答复。咨询员演示了,给GPT转发一个短信内容及图片,让GPT倡导若何答复对方的短信。
咨询员还演示了,应用Advanced Voice的新效用让GPT助手订正或者通过GPT进修新东西。好比寻找少许创制手冲咖啡的咖啡壶、过滤杯等器材,向GPT涌现并讯问若何操纵这些器材,正在操作时,让GPT评判做得若何,并给出倡导。
OpenAI吐露,大无数ChatGPT Plus和 Pro套餐的订阅用户以及全体Team用户都将能够正在此后几天内通过ChatGPT的App访候周四推出的新效用,估计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很速能够使用新效用。ChatGPT的企业版和培植版Enterprise和Edu将于来岁1月上线新效用。
![]()
同时OpenAI公告,正在Advanced Voice这一高级语音形式中,新增了“限时”的圣诞白叟声响动作“节日特供”,有用期连续到来岁1月初,正在环球畛域内,全体挪动、搜集和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访候。
华尔街睹闻曾提到,本年5月OpenAI就正在推出新旗舰模子GPT-4o时演示了语音形式Voice Mode,然而该形式真正落地一波三折。
![]()
OpenAI原筹划6月末向一小批Plus筹划用户推出该语音形式,6月又公告推迟一个月公布,以便确保该效用安适有用地惩罚来自数百万用户的乞求。当时OpenAI称,筹划本年秋季让全体Plus用户都能够访候该效用,切当的时分外取决于是否抵达内部对安适性和牢靠性的高程序。
7月末,OpenAI对有限的片面付费Plus用户推出高级语音形式下的ChatGPT,称语音形式无法师法他人的言语方法,且补充了新的过滤器,包管软件可以浮现并拒绝某些天生音乐或其他花式受版权爱护音频的乞求。当时上线月OpenAI涌现过的不少效用,好比揣测机视觉效用,相似于本周四OpenAI公告将要推出的视频对话答问。