OpenAI最新的AI模型可以进行类人对话
GPT-4o可以看、听、说,并且响应时间近乎即时。这种多模态模型将在未来几周内免费推出。2024年5月14日凌晨1:03(GMT+5)
作者:安吉拉·杨OpenAI推出了迄今为止最全面的人工智能项目:一种能够通过文本和语音与用户交流的多模态模型。
OpenAI周一表示,GPT-4o不仅将在未来几周内推出ChatGPT和API版本,还能实时识别物体和图像。该模型综合了OpenAI其他各种模型中已经单独存在的多种AI能力。但通过结合所有这些模态,OpenAI的最新模型有望更高效地处理文本、音频和视觉输入的任意组合。用户可以通过手机摄像头、上传文档或共享屏幕来传递视觉信息,同时就像在视频通话中一样与AI模型交谈。该公司宣布,这项技术将免费提供,但付费用户的容量限制将是免费用户的5倍。微软支持的OpenAI还宣布,将在MacOS上推出其2022年首次推出的热门聊天机器人ChatGPT的桌面应用程序。OpenAI首席技术官米拉·穆拉蒂在直播演示中表示,免费向用户提供先进的AI工具是该公司使命的"非常重要"组成部分。穆拉蒂说:"这是我们真正迈出巨大一步,提高了易用性。这一点非常重要,因为我们正在展望人机交互的未来。我们认为GPT-4o真正将这一范式推向了未来的协作,使这种交互变得更加自然和简单。"在直播中,团队成员演示了新模型的音频功能,并在社交媒体上分享了剪辑。一款能够实时利用视觉、文本和语音进行推理的AI助手,将使该技术能够执行各种创造性任务——例如引导用户解决数学问题、在对话中翻译语言以及读取人类面部表情。穆拉蒂在直播中表示,GPT-4o的响应时间比以前的模型快得多。根据OpenAI关于此次消息的博客文章,该模型在50种不同语言上显著提高了性能的质量和速度。在英语和代码能力方面,它与GPT-4 Turbo(GPT-4o之前的最新一代模型)相当。该公司写道,它还超越了现有的OpenAI模型在视觉和音频理解方面的能力。首席执行官萨姆·阿尔特曼在周一的博客文章中写道,GPT-4o的新语音和视频功能是他"使用过的最佳计算界面"。阿尔特曼写道:"它感觉就像电影中的人工智能;而且我仍然有些惊讶于它是真实存在的。达到人类级别的响应时间和表现力确实是一个巨大的变化。原版ChatGPT只是展示了语言界面所能实现的一点点;而这个新东西感觉完全不同。它快速、智能、有趣、自然、实用。"ChatGPT中的语音功能并不新鲜——该模型自去年秋季以来一直为用户提供对话式语音助手。但与现有的语音模式不同,穆拉蒂表示,GPT-4o的语音功能可以实时反应,消除了两三秒的延迟,模拟人类响应时间。与ChatGPT之前的语音模式不同,即使用户在GPT-4o回应过程中打断它,对话也可以继续流畅进行。在周一的演示中,OpenAI前沿研究主管马克·陈透露,GPT-4o不仅能读懂用户的语气,还能在自己的声音中生成各种情感。这个新模型紧随公司最新的(尚未发布)文本到视频模型Sora而来,该模型自2月公布以来在科技和娱乐界引起了轰动。OpenAI的这一声明也恰好在谷歌年度开发者大会I/O前一天发布,谷歌预计将在周二的大会上更新其最新的AI相关发展。2023年,有创纪录的291亿美元投资于近700笔生成式AI交易
GPT-4o可以看、听、说,并且响应时间近乎即时。这种多模态模型将在未来几周内免费推出。2024年5月14日凌晨1:03(GMT+5)
作者:安吉拉·杨OpenAI推出了迄今为止最全面的人工智能项目:一种能够通过文本和语音与用户交流的多模态模型。
OpenAI周一表示,GPT-4o不仅将在未来几周内推出ChatGPT和API版本,还能实时识别物体和图像。该模型综合了OpenAI其他各种模型中已经单独存在的多种AI能力。但通过结合所有这些模态,OpenAI的最新模型有望更高效地处理文本、音频和视觉输入的任意组合。用户可以通过手机摄像头、上传文档或共享屏幕来传递视觉信息,同时就像在视频通话中一样与AI模型交谈。该公司宣布,这项技术将免费提供,但付费用户的容量限制将是免费用户的5倍。微软支持的OpenAI还宣布,将在MacOS上推出其2022年首次推出的热门聊天机器人ChatGPT的桌面应用程序。OpenAI首席技术官米拉·穆拉蒂在直播演示中表示,免费向用户提供先进的AI工具是该公司使命的"非常重要"组成部分。穆拉蒂说:"这是我们真正迈出巨大一步,提高了易用性。这一点非常重要,因为我们正在展望人机交互的未来。我们认为GPT-4o真正将这一范式推向了未来的协作,使这种交互变得更加自然和简单。"在直播中,团队成员演示了新模型的音频功能,并在社交媒体上分享了剪辑。一款能够实时利用视觉、文本和语音进行推理的AI助手,将使该技术能够执行各种创造性任务——例如引导用户解决数学问题、在对话中翻译语言以及读取人类面部表情。穆拉蒂在直播中表示,GPT-4o的响应时间比以前的模型快得多。根据OpenAI关于此次消息的博客文章,该模型在50种不同语言上显著提高了性能的质量和速度。在英语和代码能力方面,它与GPT-4 Turbo(GPT-4o之前的最新一代模型)相当。该公司写道,它还超越了现有的OpenAI模型在视觉和音频理解方面的能力。首席执行官萨姆·阿尔特曼在周一的博客文章中写道,GPT-4o的新语音和视频功能是他"使用过的最佳计算界面"。阿尔特曼写道:"它感觉就像电影中的人工智能;而且我仍然有些惊讶于它是真实存在的。达到人类级别的响应时间和表现力确实是一个巨大的变化。原版ChatGPT只是展示了语言界面所能实现的一点点;而这个新东西感觉完全不同。它快速、智能、有趣、自然、实用。"ChatGPT中的语音功能并不新鲜——该模型自去年秋季以来一直为用户提供对话式语音助手。但与现有的语音模式不同,穆拉蒂表示,GPT-4o的语音功能可以实时反应,消除了两三秒的延迟,模拟人类响应时间。与ChatGPT之前的语音模式不同,即使用户在GPT-4o回应过程中打断它,对话也可以继续流畅进行。在周一的演示中,OpenAI前沿研究主管马克·陈透露,GPT-4o不仅能读懂用户的语气,还能在自己的声音中生成各种情感。这个新模型紧随公司最新的(尚未发布)文本到视频模型Sora而来,该模型自2月公布以来在科技和娱乐界引起了轰动。OpenAI的这一声明也恰好在谷歌年度开发者大会I/O前一天发布,谷歌预计将在周二的大会上更新其最新的AI相关发展。2023年,有创纪录的291亿美元投资于近700笔生成式AI交易
原来嘉伦哥@任嘉伦Allen 是一个害怕孤单的人~[可怜]
放心,不会了,以后都不会孤单了。无论日后你走到哪里,世界的各个角落都会有你的嘉人在。[心][心][心]
只是单纯的喜欢你,喜欢你做人做事的方式,喜欢你的温柔,喜欢你传递的正能量,反正就是喜欢你所有的一切![害羞]
也希望你别给自己太大压力,做自己就好,我想大嘉一定是希望你开心最重要的!
✨#任嘉伦[超话]#
✨#任苒时光#
✨#任嘉伦最新动态#
✨#向全世界安利任嘉伦#
放心,不会了,以后都不会孤单了。无论日后你走到哪里,世界的各个角落都会有你的嘉人在。[心][心][心]
只是单纯的喜欢你,喜欢你做人做事的方式,喜欢你的温柔,喜欢你传递的正能量,反正就是喜欢你所有的一切![害羞]
也希望你别给自己太大压力,做自己就好,我想大嘉一定是希望你开心最重要的!
✨#任嘉伦[超话]#
✨#任苒时光#
✨#任嘉伦最新动态#
✨#向全世界安利任嘉伦#
亚历山大王包臀裙烫钻 亚历山大王骷髅头卡包普拉达 背包(灰\/棕内缝)????爱马仕HermèsHerdag进口防水帆布系列出货????批:????Cabag是爱马仕帆布系列的经典之作,外形简单,容量超大,时尚而又不张扬,它采用原版进口帆布制作??防水度超级强??清晰的防伪线做工??上等五金材料,凸显整个包之形状完美,非常适合现代女性首选包包????尺寸:31cm PM69110LVESCALEZIPPY钱夹路易威登经典Zippy钱夹于2020夏季LVEscale皮具和配饰系列再换新颜。MonogramGiant帆布的扎染效果传递日本传统绞染工艺之美,拉链设计稳妥保护口袋、隔层及卡位。详细特征,19.5x10.5x2.5cm(长x高x宽))Monogram涂层帆布牛皮内衬 金属件、拉链封口、大号风琴隔层、开口式钞票隔层、拉链零钱袋、内贴袋、卡片夹层。 新款双肩带包??1BH191\/tote包 这款皮革迷你单肩包设计简约。正面金属三角形徽标平添标志性格调。配有可拆卸徽标印花织带和皮革肩带,不同衣着不同场随时可调换????彰显其现代风范。高级时尚,是日常搭配的主力时尚。赶紧入手吧,太美了????67835 长19x高20x底6cm
秘?最新GGMarmont系列手袋采用斜纹绗缝经典GG牛皮材质.焕新演绎2020魅力手提包呈现略微挻括的造型.可拆卸金属链肩带设计.令手提包轻松转换成肩背包!型号:583571白拼蓝尺寸:21x15.5x8cm ? ? ?
秘?最新GGMarmont系列手袋采用斜纹绗缝经典GG牛皮材质.焕新演绎2020魅力手提包呈现略微挻括的造型.可拆卸金属链肩带设计.令手提包轻松转换成肩背包!型号:583571白拼蓝尺寸:21x15.5x8cm ? ? ?
✋热门推荐