先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
OpenAI 发布了旗舰模型GPT4-o,引起了全球关注!GPT4-o("o "代表 "omni")是 OpenAI GPT-4 最新、最强大的迭代版本。
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
GPT-4o能同时输入和输出文本、音频和图像信息,反应速度最短达到了232毫秒,完全可做到与人类在正常对话中同频。
那么,对于这个人工智能聊天机器人领域的新趋势,全球的技术爱好者都是怎么玩的呢?
GPT-4o 的 12 项惊人功能
这款最新的旗舰模型具有 GPT-4 的智能水平,但在文本、视觉和音频方面的速度更快。它具有更强的视觉功能,你可以使用图像和视频和它交流。
以下是 GPT-4o 的 12 项惊人功能:
1. 文本生成字体图像
一位AI爱好者Andrew Gao在 X 上分享了一张图片,展示了GPT-4o可以根据输入的提示生成字体图像。在这个例子中,输入的文本是要求将字母以超未来主义字体显示在三行中。
GPT-4o 能出色地显示提示中提到的字体。这一切都归功于 GPT-4o 强大的文本分析能力。
2. 解答三年级数学题
另一位用户在 X 上分享了一个 GPT-4o 解答三年级数学题的演示视频。这道题有些复杂,甚至涉及到公式。
但出乎意料的是,聊天机器人不仅成功解决了问题,给出了正确答案,还对问题进行了很好的逻辑解释。
这说明,GPT-4o 在处理复杂的数学问题方面有着高超的技巧和经过充分训练的能力,这需要进行深入的思考和分析。
3. 极快解决代码相关问题
在这个试验中,我们看到 GPT-4o 解决了一个很难的编程问题,那就是在满足特定条件的前提下,以最小的成本建造 K 个机器人。
GPT-4o 不仅在很短的时间内提供了编码解决方案,还一步步分析了代码。
这让我们看到了GPT-4o处理问题的速度和效率。它非常适合那些希望更快、更简单地解决复杂代码问题的开发人员。
4. 更快地检索必应搜索结果
X 上的人工智能影响者 Mukul Sharma 尝试在 GPT-4o 和普通的 GPT-4 上搜索最新的技术信息。两个聊天机器人都使用必应搜索引擎检索用户所提问题的最新答案。
然而,令人惊讶的是,与标准的 GPT-4 聊天机器人相比,GPT-4o 从必应搜索引擎中提取信息的速度要快得多。
这是否可以看出 GPT-4o 获取实时信息的强大能力呢?如果我们能得到一个可以充当搜索引擎的聊天机器人,那将是一个重大突破。
5. 准确识别图像内容
Jakub Jakóbowski 用 GPT-4o 做了一个有趣的试验。他给了 GPT-4o 一张导弹的图片,并问它是在哪里生产的,还要求提供三个理由。
GPT-4o 不仅猜对了答案,即哈尔科夫,而且还提供了关于设计特点、背景和建筑材料的详细证据,证明了导弹是在哈尔科夫制造的。
这表明GPT-4o具有很强的视觉能力,可以在图像和自然语言之间进行更精准的交互。否则,聊天机器人就不可能如此准确地判断出导弹的来源地!
6. 调整图像细节
Andrew Gao 在 X 平台上分享了一张图片,展示了这个功能。他上传了一张年轻白人男子的照片,并通过文字描述了这个男子。然后,他问聊天机器人如何得到这个男子在白色背景上的漫画版本。
GPT-4o完美地满足了用户的需求,提供了准确的图像。这幅漫画捕捉到了真实照片的特点,并带有询问中所要求的卡通和俏皮风格。
7. 漫画风格的滑稽图像
Shijie Wang 也用 GPT-4o 进行了一次试验,结果很有趣!他上传了一张美食的图片,并要求 GPT-4o 画出这张图片的卡通版。
但是,他收到的是一张卡通图片,并附有 "处理此图片时出现错误 "的文字。
显然,我们可以看出,GPT-4o还没有完全掌握捕捉所有图像细节并以相关风格转换的能力。
8. 用 GPT-4o 准备面试
这个测试是由 OpenAI 的官方账号分享的。在视频中,你可以看到OpenAI的技术人员Rocky Smith在GPT-4o的帮助下为OpenAI的软件工程面试做准备。
他询问聊天机器人自己是否适合面试,GPT-4o告诉他要修饰自己的外表,让自己看起来更适合面试。
9. 音效合成
GPT-4o 不仅能生成语音,还能制作声音效果。Andrew Gao 在 X 平台上分享了一个例子,他让 GPT-4o 模仿硬币敲击金属的声音。
虽然他没有提供我们能听到声音的视频,但我们可以看到,GPT-4o用一个三秒钟的音频文件做出了惊人的反应。
声音制作功能让聊天机器人的能力达到了一个新的高度,这也是 OpenAI 的最新成果。
10. 两个人工智能相的对话
这是 OpenAI 做的一个令人震惊的试验。在这段来自 X 的 OpenAI 的视频中,你可以看到两个 GPT-4os 在一个环境中互相对话。
其中一个人工智能既能看到也能听到周围的环境,而另一个只能听到却看不到。
在整个互动过程中,你可以看到第一个人工智能是如何通过和第二个人工智能的交流,帮助它了解周围的环境。
在视频的最后,你还可以看到两个 GPT-4os 一起唱歌,看起来很开心。
谁能想到,我们可以如此轻松地实现两个人工智能之间交流呢?
11. 生成可视化数据
X 平台上的一个AI爱好者 Zain Kahn 用 GPT-4o 做了一个测试。他让 GPT-4o 分析电子表格,并根据表格的数据生成图表和可视化数据。
GPT-4o 生成的图表和图形质量很高,包含了很多变量。它们还用多种颜色区分,以帮助更好地识别数据点和变量。
最后,GPT-4o 还提供了一些见解,帮助更好地理解数据。此外,这个操作的处理时间也非常快。
12. 用 Python 编写游戏
Alvaro Cintas 用 GPT-4o 做了一个惊人的试验。他截取了一张闯关游戏界面的截图,并将图片提供给GPT-4o。并让它用 Python 语言编写游戏代码。
GPT-4o 很快就提供了代码,用户还在编译器中运行了它。令他惊讶的是,这个代码运行得非常好,游戏也能正常运行,游戏界面和原来的截图非常相似。
这个试验让我们看到了 GPT-4o 的视觉功能和编程知识的强大。如果把这两个功能结合起来,就能得到这样的结果。
最后
聊天机器人在各种场景下都表现出色,它的能力让所有人都感到惊讶。这说明在OpenAI的帮助下,GenAI已经取得了巨大进步。未来,GPT-4o还会给我们带来更多惊喜。