OpenAI开放GPT-4o重大更新:视频,音频,能力大提升

GPT-4o2024-05-14224

先做个广告:如需代注册GPT4或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

在5.11 OpenAI就表示将在太平洋时间5.13早上10点进行直播,让大家开始猜想会发布一些什么新奇的东西。

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

而OpenAI的员工也在推特上集体发疯。一些推断表示很有可能是奥特曼为了查内鬼而设计的局,并表示并不是发布GPT-5,也不是发布搜索引擎,而是发布一些人们会喜欢的新东西。

OpenAI凌晨官宣!Google、llama江湖地位不保?

发布会前网友的猜想

  1. APi接口大降价
  2. 基于 gpt 的个人助理工具
  3. starshine gpt4免费(不是)
  4. gpt4挤牙膏!
  5. Q*发了吗?
  6. 韵动只因 将动物发音转换为token的多模态模型
  7. 张辉 宣布公司改名为closeAI
  8. 小队长@无尽人生你的江南 宣布降价
  9. 语音端到端交互

在上周Deepseek和ChatGLM宣布降价之后,OpenAI会宣布降价吗?🤔

发布会内容

  1. GPT-4o发布

GPT-4o(“o”代表“omni")是迈向更自然的人机交互的一步-它接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合输出。它可以在短至232毫秒的时间内对音频输入做出响应,平均为320毫秒,这与人类在对话中的响应时间相似。它在英文文本和代码上与GPT-4Turbo性能相当,在非英文语言中的文本上有显着改进,同时在API中速度更快,价格便宜50%。与现有型号相比,GPT-40在视觉和音频理解方面尤其出色。

  1. GPT-4o API

更快 更便宜 相比起GPT-4 Turbo更高的限流

  1. 模态的增加

  • 基础的text模块
  • 能够输入语音(不再依赖 Speech to Text 模块 )
  • 能够输入视频信号,对视频内容进行理解
  1. 语音变化

语音的语调、语速变化,能够声情并茂、可打断

视频中让GPT使用机器人、唱歌的语调进行故事讲述,其模仿能力不错。

数字人将不再存在了🤔

  1. 视频推理

数学能力增强,能够通过视频,推理解方程,速度快的同时可以

国内的AI教培公司感到了压力。😟

视频理解能力,能在听说到我爱ChatGPT的时候,有很强的情感波动。

或许这就是硅基生命的起点?🤔

  1. 代码理解能力

能根据代码给出合理的建议,或许你的下一个程序员不是Copilot,而是GPT。

  1. 图表理解

能够根据图表进行分析,获得结论,GPT会成为你最佳的数据分析师。

GPT能够对jupyter notebook内的可视化内容(表格曲线进行分析),似乎也能成为一个不错的分析师。🤔

  1. 同声传译

过程中GPT能够对意大利语进行同声传译,实时性很强,能够一定程度胜任同声传译的工作。

联合国的俄语同传小姐姐有福了。🤣

  1. 面对面聊天对话

具有实时对话的能力,也有对。

网友对此反响

真的震撼

就是来秀肌肉的吧

翻译失业

是不是以后可以和gpt录播客了

不知道明天去单位什么心情了

微软暴涨

速度确实可以

而且人格化也非常好

最后,GPT-4o已经上架。

OpenAI的发布会回放链接如下,大家对这次的重大更新感觉如何?欢迎来评论区发表见解。

回放链接:https://meeting.tencent.com/v2/cloud-record/share?id=400da0f0-caef-40a1-b030-1b47a4b93f18&from=3&record_type=2

chatgpt plus(GPT4)代充值

本文链接:https://gpt-4o.net/chatgpt/463.html

华为版 ChatGPTstyledropGPTschatgpt plus自动续费吗chatgpt怎么自动续费chatgpt如何续费chatgpt国内怎样续费chatgpt4.0可以续费吗chatgptpluse开通后自动续费吗chatgpt入口

相关文章

网友评论