
图片来源:Unsplash/ @ilgmyzin
ChatGPT Plus和企业用户将在未来几周内使用这些功能
突出了
ChatGPT很快就能做到这一点反向使用文本转语音技术
这个聊天机器人也正在获得分析和理解图像的能力
这些ChatGPT功能将在未来几周向用户推出
广告
OpenAI周一宣布,ChatGPT已经升级,支持语音对话和图像识别。该公司的人工智能聊天机器人将很快能够理解用户捕获或分享的图像,并在聊天机器人可用的平台上提供详细信息或相关信息。它还将能够使用OpenAI的Whisper语音识别工具和该公司的一项新的文本到语音(TTS)技术进行来回对话,该技术据称可以在该公司的智能手机ChatGPT应用程序上提供“类似人类”的音频。
OpenAI在一篇博客文章中透露,该公司为ChatGPT提供的新图像识别功能将在所有平台上可用,而语音对话功能将通过可选设置在iOS和Android上可用。这些功能将提供给ChatGPT Plus和企业用户,至于将来是否会向免费用户推出,目前还没有消息。
进入ChatGPT的语音对话可以通过进入设置>新功能并切换选项来启用语音对话。然后你可以从五种声音中进行选择——OpenAI表示,他们已经与专业配音演员合作提供了这项新功能。ChatGPT应用程序将能够通过将你的口头询问转换成聊天机器人可以理解的文本来回答问题,然后使用该公司的新TTS技术将回答转换成音频。
ChatGPT并不是唯一使用OpenAI新TTS技术的服务——Spotify周一宣布了一款新的基于人工智能的播客语音翻译工具,该工具可以自动将播客从英语翻译成法语、德语和西班牙语。该流媒体平台表示,该工具正在与一些播客主持人进行测试,无论Spotify在哪里,翻译后的剧集都将向所有用户开放。
OpenAI表示,新的图像识别工具运行在该公司的多模式GPT-3.5和GPT-4模型上,能够分析照片、截图和文档中包含的图像和文本。用户可以通过ChatGPT捕捉图像或在手机上分享现有图像,以获得聊天机器人的见解。
据OpenAI称,ChatGPT还将允许用户分享多张图片,并与聊天机器人进行讨论。如果你想让它聚焦在一个特定的区域,内置的绘图工具将允许你标记图像的一部分。例如,在与ChatGPT共享的照片中画出一条脱落的自行车链条,可能会让聊天机器人向您展示解决问题的方法。
点击分享到









