OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?

OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?

OpenAI又杀疯了,在中国时间半夜发布了GPT-4o多模态大模型,短短二十几分钟的发布会,干翻了好几个行业。
图片[1]-OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?-夜影资源
我相信这一晚上对于很多人来说是紧张又刺激的一晚,和Sora发布不太一样的是,Sora其实有一些空降的意思,因为在这之前没有做太多的宣传(即便宣传了,没有引起太多人、特别是国人的关注)。
虽然才时隔三个月,现在关注AI的人确实比三个月前多了很多。
GPT-4o的发布,奥特曼和他的团队做足了戏,吊足了大家的胃口。
今天发布会一出……不得不承认,
确实牛X!
还有谁?!
图片[2]-OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?-夜影资源
GPT-4o是真正的多模态大模型,“o”是omni,也就是全能的意思。
它能实现文本、图片、音频、视频之间的随意组合、「实时交互」。
简单来说,你可以和它真正实现像人那样交流,它能通过视频看到你今天穿了一件什么颜色的衣服,能读懂你的语气,还有自己的小情绪,还能在交流时被打断后再做出迅速响应。
越来越像一个没有身体的人了。
很多人包括奥特曼自己都在说,这就像电影《她》。
图片[3]-OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?-夜影资源
而给我的感觉,钢铁侠中贾维斯的雏形,已经具备了。
众所周知我超级喜欢钢铁侠,拥有一个贾维斯,就像一个小朋友一直憧憬一件有趣的玩具一样。
而这个梦想,应该快要实现了。无非就是再等点时间,让它和智能体相结合…
最炸裂的是开放免费使用,不过付费用户有更多的额度。
感觉这里在怼脸奥特曼额的好基友…
图片[4]-OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?-夜影资源
回顾一下新版Chatgpt的亮点:
1. 最伟大的改变应该就是实时语音和视频,新模型增加了【打断模型】,就是用户无需等它说完才能开始说话,它能实时响应,有很好的识别能力。性子急的人有福气了…
2. 讲故事的时候更加富有情感,和人交流的时候有了更多的情绪,甚至!!还能即兴演唱????这一次,把文生音乐也得颠覆了。
同样颠覆的可能还会有儿童故事,将来孩子们可以根据自己的需求定制故事,让AI陪读、陪唱,一起做游戏。
3. 视觉+语音交互。你可以像跟一个老朋友视频电话那样,让它帮你处理一些问题。
比如说发布会现场处理数学题,不仅能告诉你结果,还能告诉你处理过程是怎样的。

教育,被推翻了……

孩子们相当于有了一个无所不能的爸爸,可以实时视频让“爸爸”们解答问题,并且“爸爸”们还能识别孩子的情绪,安慰、鼓励,可能比真爸爸好使N倍,至少不会问多了烦。

医学,也被推翻了……

病人有任何不舒服的情况,小问题甚至再也无需跑医院,强大的AI医生诊断完,可以就近帮助买药送到家门口,这就是AI Agent……

4. 有自己的可爱小情绪。比如主持人在纸上写了一句表白的话,它竟然像小女生那样娇羞地尖叫起来:“噢,我看到了‘I Love ChatGPT’,你太有爱了!”
咱们就是说,情绪价值这一块拿捏住了。
5. 能够读懂屏幕信息,并且解答代码问题和分析图表。
图片[5]-OpenAI发布GPT-4o:免费!真正的多模态!贾维斯的雏形来了?-夜影资源
对于这一块最新鲜的并不是读懂屏幕信息和分析,而是你能和他实时语音,他能告诉你如果没有了什么函数,会出现什么问题,并告诉你解决方案,这太牛了。
6. 实时翻译。它不仅能听懂不同国家的语言,翻译成各个国家的语言,甚至可以用语音输出出来,没有延时!还会很幽默地模仿你的语气。
同声传译这个行业也要被干趴下了…
7. GPT-4o的API,比之前快2倍,价格还便宜50%。
还有很多小的细节点,我就不一一列举了,大家可以看看发布会现场视频。
现在是凌晨5点40,我到现在还没睡,心情很复杂。
AI的迅速发展帮助人类打开了一个又一个未知的维度,就是我们以前说的“上帝视角”。
我认识的世界,正在肉眼可见一点一点坍塌,成为一个新的世界。
虽然我可能说得有点夸张,但现实正在朝这些发展,这才短短几个月的时间,像是过了一个世纪。
以后的人类到底应该怎么办?如何定义人类在未来社会中的角色,很多学科都要被重新赋予意义。
所以AI,到底是好是坏?
可能没法用好坏来定义,这是一种无法改变的趋势,我们能做的,就是尽快去拥抱它。

 

© 版权声明
THE END
喜欢就点赞支持一下吧
点赞5 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情图片

    暂无评论内容