5月16日 消息:在社交软件上,OpenAI的GPT-4o成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。GPT-4o的免费特性更是让其成为了互联网上的新宠。
在5月14日的官方演示中,GPT-4o展现出了令人印象深刻的性能,其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款AI的多种功能,从生成图表和统计分析到创建3D模型的STL文件,GPT-4o都能在极短的时间内完成。
GPT-4o的应用场景多种多样,网友们的创意层出不穷。例如,有网友使用GPT-4o解答了著名的“爱因斯坦谜题”,展示了其强大的逻辑推理能力。此外,还有网友利用GPT-4o开发了自动选股器,将复杂的选股指标自动改写成选股器,并输出图表和数据归档,极大地提高了效率。
GPT-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始HTML,GPT-4o不仅准确地完成了任务,还保持了数据结构变化时的HTML更新。此外,GPT-4o的OCR(光学字符识别)能力也得到了认可,它能够识别并吐出连人类都难以辨认的图像中的内容。
以下是GPT-4o的一些亮点功能:
多模态输入输出:GPT-4o能够接受文字、音频、图像的任意组合作为输入,并生成相应的文字、音频、图像输出。
逻辑能力测试:GPT-4o成功解答了被称为“爱因斯坦谜题”的逻辑题,展示了其出色的逻辑推理能力。
自动选股器:尽管OpenAI表明GPT不能用于选股,但网友使用GPT-4o创建了一个自动选股器,并能输出图表和数据归档。
纸质原型转录:网友利用GPT-4o将纸质原型转录为电脑内的初始HTML,大大节省了开发时间。
OCR能力:GPT-4o展现了其强大的光学字符识别(OCR)能力,能够识别复杂图像中的文字。
图片来自推特博主:JerLin
在GPT-4o发布的同时,谷歌也推出了自己的大模型产品Project Astra。尽管Project Astra同样具备强大的功能,但有专家指出,谷歌的产品在多模态输出方面仍有待提高。虽然OpenAI和谷歌都先后推出重磅产品,但这波比拼,谷歌可以说是一点好处都没捞着,直接被OpenAI“艳压”了。
与此同时,马斯克旗下的xAI公司推出的Grok模型在某些测试中表现超过了GPT-4o,比如它正确回答了Ilya离开公司的问题。而OpenAI自己的大模型未能提供正确响应。