首页 > 虚拟现实 > 人工智能再迎大事件!GPT-4o重磅发布,AGI时代加速到来(学到了吗)
2024
05-15

人工智能再迎大事件!GPT-4o重磅发布,AGI时代加速到来(学到了吗)

全球人工智能领军企业OpenAI再次震撼世人,GPT-4o炸裂发布!

北京时间5月14日凌晨,OpenAI举办了“春季更新”活动,外界极为关注本次发布会。OpenAI不仅推出了新旗舰大模型GPT-4o,将实时多模态AI以低成本提供给用户,还将在ChatGPT中提供更多免费功能。

发布会对GPT-4o进行了全方位的介绍,更好的多模态数据处理能力、更快的速度都让用户满怀期待。特别是GPT-4o可以仅用232毫秒对音频做出反馈,这已经达到实时交流的水平。

OpenAI春季发布会之后,Altman便直言GPT-4o语音和视频模式体验极佳,像科幻电影一样使用AI。

自年初发布Sora文生视频模型以来,OpenAI不断筑牢技术护城河,并加速发展通用人工智能技术,这将对AI及众多行业产生较大影响。

关注【光大快评】,紧跟财经热点!

1、GPT-4o重磅发布,实时语音交互时代到来

随着全球科技巨头不断加大人工智能投入和研究力度,越来越多的科幻电影场景逐渐变为现实。

如果您曾经看过钢铁侠系列电影,肯定对人工智能助手贾维斯印象深刻,实时交互、极快响应让贾维斯成为钢铁侠最亲密的合作伙伴。

OpenAI最新发布的大模型GPT-4o,似乎已经让我们接近拥有贾维斯类型的人工智能助手。

GPT-4o中的字母“o”为英文单词“omni”缩写,汉语意思为“全能”,这意味着GPT-4o大模型具有较为强悍的实力。

经过OpenAI的演示,GPT-4o确实再次震惊世界。我们总结下来,GPT-4o拥有如下四大特点:

①与之前的GPT大模型不同,GPT-4o处理信息更像人类,可以接受音频、图像和文本三种数据组合输入,并输出对应形式的内容。OpenAI甚至演示了用GPT-4o处理含有数学方程的图片,大模型给出了正确的答案。

②GPT-4o处理速度极快,可以实时对多模态信息进行推理,并能够处理50种不同的语言。GPT-4语音模式的平均时延为5.4秒,而且会丢失大量数据、无法感受对方情绪。GPT-4o处理语音时延可以达到232毫秒,平均时延约为320毫秒,基本达到了人类的反应速度,并且还能根据呼吸来感受对方的情绪。

③为了实现GPT-4o的先进功能,OpenAI进行了多模态端到端训练新模型,用同一个神经网络输入和输出数据。GPT-4o很多能力已经和GPT-4 Turbo相当,在音频、视觉等方面表现更好。

④GPT-4o将免费开放,并开始推出ChatGPT Free,但有使用限额。ChatGPT Plus用户享受更多的消息限额。

GPT-4o是OpenAI在多模态AI领域探索的最新成果,音频、视频处理能力得到极大的提升。

早在今年2月,OpenAI发布了首个文生视频模型Sora,已经展示了公司在视频领域的技术实力。Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,这标志着OpenAI已经研究出通用视频生成解决方案。

2023年,Pika、Runway等AI视频公司掀起了一轮AI热潮,OpenAI又提升了AI视频处理能力。

2、通用人工智能时代或加速到来,AI依然有较大发展空间

2024年,多模态AI已经取得显著的进展,AGI(通用人工智能)日益成为行业发展趋势。

与专用人工智能不同,AGI又被称为强AI,适用领域和智力水平要远超专用人工智能,相当于人类智慧的AI。

与文本AI大模型不同,通用人工智能和人类一样,能够处理视频、音频、图片、文本等多种信息源,并在此基础上生成各类信息,与使用者实现动态交互。

科技巨头积极推动AGI发展,这为AI生成内容(AIGC)领域提供了更加强大的技术基础。

根据腾讯研究院发布的《AIGC发展趋势报告2023》,AIGC产业生态已在加速形成和发展,呈现基础层、中间层、应用层“三层架构”形态。AIGC有望成为未来互联网的内容生产基础设施,促进应用生态、内容消费市场的繁荣。

Gartner预计,2025年AIGC产生的数据占比有望达到10%,而2021年该比例仅有1%。同时,药物研发、制造业都将引入AIGC技术。

AIGC产业链仍处于初级发展阶段,可以划分为三个紧密联系的产业链节点:上游为AI芯片、云计算、大数据、通信服务商等,为AIGC提供基础性的服务;中游则为AIGC研究机构、AIGC商业化公司,这是整个产业链的核心公司;下游则是丰富的应用场景,涵盖传媒、金融、零售、政务、教育等领域。

正是看到AIGC广阔的应用领域,A股多家公司已经率先布局。根据iFinD数据库,流通市值排名靠前的AIGC概念股包括:科大讯飞、紫光股份、浪潮信息、昆仑万维、恒生电子、同花顺、软通动力、人民网、芒果超媒、光线传媒等。

(本文首发于2024年5月14日)

李泉

投资顾问执业编号:S0930622070004

基金从业编号:A20211203001155

免责声明:本文只是根据公开信息进行内容创作,并不能保证准确性、及时性,也不构成投资建议;投资有风险,入市需谨慎。

本文》有 0 条评论

留下一个回复