OpenAI 在北京时间6月13日凌晨发布了一系列令人兴奋的更新,包括:
在 Chat Completions API 中引入了新的函数调用功能。
更新了更具可控性的 gpt-4 和 gpt-3.5-turbo 版本。
将这些视为视频游戏的软件更新。它们使 AI 更智能、更好、更易于指导,因此您可以从中获得更准确的结果。
推出了具有 16k 上下文长度的 gpt-3.5-turbo 新版本(相较于标准 4k 版本)。
这就像提高 AI 的记忆力。“上下文”是 AI 从之前的对话中记住的内容。之前它可以记住 4k(或 4,000)个对话单元,但现在它可以记住 16k。
降低了最先进的嵌入模型(Embeddings )的成本,降幅达 75%。
这意味着 AI 的一个真正先进的部分可以帮助它理解和处理单词,现在使用起来要便宜得多。这就像以大折扣购买全新的游戏机!
降低了 gpt-3.5-turbo 输入 token 的成本,降幅达 25%。
公布了 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的弃用时间表。
一些旧版本的 AI 将停止提供。这就像一家公司停止支持旧型号的手机或游戏机。
想象一下您的计算机可以像人一样理解您说的话,然后使用它们在其他计算机程序中执行操作。例如,您说“我需要知道波士顿的天气”,它可以自动从天气应用程序获取该信息。这次更新让 AI 做到了!
当你与 AI 交谈时,你所说的每一个部分都称为token。此更新使您每次使用它都更便宜。这就像您最喜欢的商店里的糖果刚刚便宜了 25%!
有什么意义:这些更新的重要性在于,它们使 AI 更智能、更有用且使用成本更低。它们还开辟了新的可能性,例如构建更智能的聊天机器人或帮助更轻松地处理和理解大量信息。这会影响很多方面,从做作业、玩游戏到探索新爱好等等。OpenAI 内容全文
今年早些时候,我们发布了gpt-3.5-turbo和gpt-4,短短几个月内,开发者们已经在这些模型基础上构建了令人难以置信的应用。
今天,我们带来了一些激动人心的更新:
聊天补全API中新的函数调用功能 更新的、更可控的gpt-4和gpt-3.5-turbo版本 gpt-3.5-turbo新的16k上下文版本(标准版本是4k) 最先进的嵌入模型的价格降低75% gpt-3.5-turbo输入token的价格降低25% gpt-3.5-turbo-0301和gpt-4-0314模型的弃用时间表公布
所有这些模型都具有我们在3月1日发布的数据隐私和安全保证 —— 客户拥有通过他们的请求生成的所有输出,以及他们的API数据将不会用于训练。
函数调用
开发者现在可以向gpt-4-0613和gpt-3.5-turbo-0613描述函数,并让模型智能地选择输出一个包含调用这些函数参数的JSON对象。这是一种更可靠地将GPT功能与外部工具和API连接的新方法。
这些模型已经过微调,既可以检测何时需要调用一个函数(取决于输入的问题),还可以更准确地生成包含函数名称和参数的JSON对象。函数调用使开发者能够更可靠地从模型中获取结构化数据。例如,开发者可以:
* 创建通过调用外部工具(如ChatGPT插件)回答问题的聊天机器人
* 将查询诸如“下周五发邮件问Anya是否想喝咖啡”转换为像`send_email(to: string, body: string)`的函数调用,或者将“波士顿现在的天气如何?”转换为`get_current_weather(location: string, unit: 'celsius' | 'fahrenheit')`。
* 将自然语言转换为API调用或数据库查询
* 将“本月前十名客户是谁?”转换为内部API调用,如`get_customers_by_revenue(start_date: string, end_date: string, limit: int)`,或者将“Acme, Inc.上个月下了多少订单?”转换为使用`sql_query(query: string)`的SQL查询。
* 从文本中提取结构化数据
* 定义一个名为`extract_people_data(people: [{name: string, birthday: string, location: string}])`的函数,用于从维基百科文章中提取所有提到的人物信息。
上述用例得以实现,是因为我们在`/v1/chat/completions`端点中引入了新的API参数`functions`和`function_call`,它们允许开发者通过JSON Schema向模型描述函数,并可选择让模型调用特定函数。请查阅我们的开发者文档以开始使用,如果您发现函数调用可以在某些场景中得到改进,请添加评估。
自从ChatGPT插件的alpha版本发布以来,我们在让工具和语言模型安全地协同工作方面学到了很多。然而,仍有一些尚未解决的研究问题。例如,一个概念验证漏洞展示了来自工具输出的不受信任数据如何指示模型执行意外操作。我们正努力降低这些和其他风险。开发者可以通过仅从可信工具中获取信息,并在执行具有现实影响的操作(如发送电子邮件、在线发布或购买)之前包含用户确认步骤来保护他们的应用程序。
新模型
GPT-4
gpt-4-0613是一个更新和改进的模型,支持函数调用。
gpt-4-32k-0613在gpt-4-0613的基础上增加了更长的上下文长度,以便更好地理解较大的文本。
在未来几周里,随着这些更新的推出,我们将邀请更多等待名单上的人尝试GPT-4,目的是在这个模型上完全取消等待名单。感谢大家的耐心等待,我们很高兴看到您用GPT-4构建的应用!
GPT-3.5 Turbo
gpt-3.5-turbo-0613具有与GPT-4相同的函数调用功能,以及通过系统消息更可靠的操控性,这两个特性使开发者可以更有效地引导模型的响应。
gpt-3.5-turbo-16k的上下文长度是gpt-3.5-turbo的4倍,价格是gpt-3.5-turbo的两倍:每1000个输入令牌$0.003,每1000个输出令牌$0.004。16k上下文意味着模型现在可以在单个请求中处理约20页文本。
模型废弃
今天,我们将开始升级和废弃我们在3月宣布的gpt-4和gpt-3.5-turbo的初始版本。自6月27日起,在应用程序中使用稳定模型名称(gpt-3.5-turbo、gpt-4和gpt-4-32k)的开发者将自动升级到上述新模型。为了比较版本之间的模型性能,我们的Evals库支持公共和私有评估,以展示模型更改如何影响您的用例。
需要更多时间过渡的开发者可以继续通过在API请求的“model”参数中指定gpt-3.5-turbo-0301、gpt-4-0314或gpt-4-32k-0314来使用旧模型。这些旧模型将在9月13日之前可用,之后指定这些模型名称的请求将失败。您可以通过我们的模型废弃页面随时了解模型废弃情况。这是对这些模型的第一次更新;因此,我们热切期待开发者的反馈,以帮助我们确保平稳过渡。
价格降低
我们将继续提高系统效率,并将这些节省下来的成本传递给开发者,即日生效。
嵌入
text-embedding-ada-002是我们最受欢迎的嵌入模型。今天我们将成本降低了75%,每1000个token的价格降至$0.0001。
(注:text-embedding-ada-002 是一个由OpenAI开发的文本嵌入模型。文本嵌入(Text Embedding)是将文本数据转换成数值向量表示的过程。这种向量表示可以捕捉词语、短语或者整个文本的语义信息,便于计算机理解和处理。在自然语言处理(NLP)领域,文本嵌入在许多任务中起着关键作用,如文本分类、情感分析、文本相似性度量、命名实体识别等。text-embedding-ada-002模型通过学习大量的文本数据,将文本转换为具有语义信息的高维向量,这些向量可以作为其他机器学习模型的输入。)
GPT-3.5 Turbo
gpt-3.5-turbo是我们最受欢迎的聊天模型,为数百万用户提供ChatGPT服务。今天我们将gpt-3.5-turbo的输入令牌成本降低了25%。现在,开发者可以仅需$0.0015每1000个输入token和$0.002每1000个输出token使用该模型,相当于每美元约可处理700页文本。
gpt-3.5-turbo-16k的价格是每1000个输入token $0.003,每1000个输出token $0.004。
开发者反馈是我们平台发展的基石,我们将继续根据收到的建议进行改进。我们很期待看到开发者将如何在他们的应用程序中使用这些最新模型和新功能。
原文地址:https://openai.com/blog/function-calling-and-other-api-updates
网友评论