站长之家(chinaz.com)5月16日 消息:在社交软件上,openai的成为了热议的焦点。这款最新旗舰产品以其全能的特性——接受文字、音频、图像的任意组合输入,并生成相应的文字、音频、图像输出——迅速吸引了全球网友的关注。gpt-4o的免费特性更是让其成为了互联网上的新宠。
在5月14日的官方演示中,gpt-4o展现出了令人印象深刻的性能,其响应音频输入的速度甚至与人类相媲美。网友们已经迫不及待地开始尝试这款ai的多种功能,从生成图表和统计分析到创建3d模型的stl文件,gpt-4o都能在极短的时间内完成。
gpt-4o的应用场景多种多样,网友们的创意层出不穷。例如,有网友使用gpt-4o解答了著名的“爱因斯坦谜题”,展示了其强大的逻辑推理能力。此外,还有网友利用gpt-4o开发了自动选股器,将复杂的选股指标自动改写成选股器,并输出图表和数据归档,极大地提高了效率。
gpt-4o的纸质原型转录功能也受到了网友的好评。有网友尝试将手写的原型转录为电脑内的初始html,gpt-4o不仅准确地完成了任务,还保持了数据结构变化时的html更新。此外,gpt-4o的ocr(光学字符识别)能力也得到了认可,它能够识别并吐出连人类都难以辨认的图像中的内容。
以下是gpt-4o的一些亮点功能:
- 多模态输入输出:gpt-4o能够接受文字、音频、图像的任意组合作为输入,并生成相应的文字、音频、图像输出。
- 逻辑能力测试:gpt-4o成功解答了被称为“爱因斯坦谜题”的逻辑题,展示了其出色的逻辑推理能力。
- 自动选股器:尽管openai表明gpt不能用于选股,但网友使用gpt-4o创建了一个自动选股器,并能输出图表和数据归档。
- 纸质原型转录:网友利用gpt-4o将纸质原型转录为电脑内的初始html,大大节省了开发时间。
- ocr能力:gpt-4o展现了其强大的光学字符识别(ocr)能力,能够识别复杂图像中的文字。
图片来自推特博主:jerlin
在gpt-4o发布的同时,谷歌也推出了自己的大模型产品project astra。尽管project astra同样具备强大的功能,但有专家指出,谷歌的产品在多模态输出方面仍有待提高。虽然openai和谷歌都先后推出重磅产品,但这波比拼,谷歌可以说是一点好处都没捞着,直接被openai“艳压”了。
与此同时,马斯克旗下的xai公司推出的grok模型在某些测试中表现超过了gpt-4o,比如它正确回答了ilya离开公司的问题。而openai自己的大模型未能提供正确响应。