跳票了近一年！OpenAI终究上线o原生图像生成功能-沈阳海贝奇科技有限公司

跳票了近一年！OpenAI终究上线o原生图像生成功能

来源：安徽海贝奇交通应用技术股份有限公司时间：2025-04-17 15:53

　　OpenAI颠末一年取人类锻炼师协做优化，发布了GPT-4o原生多模态图像生成功能，支撑生成愈加逼线。用户只需正在ChatGPT中描述图像（可指定宽高比、色号或通明度等参数），GPT-4o便能正在一分钟内生成响应图像。OpenAI正在通知布告中确认，GPT-4o图像生成功能具有以下特点：除了通过GPT-4o能够正在ChatGPT中间接生成图像，该模子还整合进了OpenAI的视频生成平台Sora，新模子本日起将做为ChatGPT的默认图像生成引擎，向ChatGPT Free、Plus、Team及Pro用户，代替此前利用的DALL-E 3。教育版以及API接口也将正在不久后支撑该功能。取过去那些难以生成清晰、得当文字的AI模子分歧，GPT-4o现正在能够精确地将文字嵌入图像中；—— 加强的上下文理解：GPT-4o通过操纵聊天汗青，答应用户正在互动中不竭细化图像，并连结多次生成之间的分歧性；—— 改良的多对象绑定：过去的模子正在准确定位场景中的多个分歧物体时存正在坚苦，而GPT-4o现正在能够一次处置多达10至20个物体；—— 多样化气概顺应：该模子能够生成或将图像为多种气概，支撑从手绘草图到高清写实气概的转换。做为客岁推出的多模态模子，GPT-4o最后的定位是成本优化版的旗舰AI模子，具备生成和理解文本、视频、音频和图像等能力。OpenAI暗示，可读文本段落，项目首席研究员Gabriel Goh透露，然而，GPT-4o的图像生成手艺仍然存正在局限性。华尔街日报称OpenAI展现的一个案例中，当用户上传了一张带有两扇窗户的客堂照片，并要求从头安插家具时，同时，AI图像生成的利用仍然激发争议。一些艺术家AI图像生成器抄袭他们的做品，并到他们的生计。OpenAI首席运营官布拉德·莱特卡普对此回应称，OpenAI总裁格雷格·布罗克曼早正在2024年5月就预告过GPT-4o的原生图像能力，但出于未公开的缘由，该公司曲到现正在才发布该功能。此前，谷歌AI Studio的Gemini 2 Flash尝试模子曾经推出了雷同功能。OpenAI暗示，正正在通过持续的模子改良积极处理这些问题。做为OpenAI对负义务AI开辟的许诺的一部门？。

关注热点聚焦行业峰会

关注热点
聚焦行业峰会