一个令人兴奋的消息:现在所有人都可以构建由 ChatGPT & Whisper 提供支持的下一代应用程序!
ChatGPT 和 Whisper 模型现已在 OpenAI API 上提供,让开发者可以访问最先进的语言(不仅限于聊天!)和语音转文本功能。通过一系列全系统优化,自去年 12 月以来,OpenAI 团队已经实现了对 ChatGPT 的 90% 成本削减,现在将这些节省成本传递给API 用户。主要包括以下几方面:
ChatGPT API 用户可以期待持续的模型改进,并选择专用容量以更深入地控制模型。
开发者现在可以在 API 中使用 OpenAI 开源的 Whisper large-v2 模型,以获得更快速和经济实惠的结果。
密切关注开发者的反馈,并改进 API 服务条款,以更好地满足用户的需求。
早期产品
使用 ChatGPT API 和 Whisper API 的早期用户
Snap
Snap Inc. 是 Snapchat的创建者 [1],本周为 Snapchat+ 推出了 My AI。这项实验性功能是在 ChatGPT API 上运行的。My AI 为 Snapchat 用户提供了一个友好的、可定制的聊天机器人,它提供推荐,甚至可以在几秒钟内为朋友写一首俳句。在 Snapchat,沟通和信息传递是一种日常行为,每月有 7.5亿 Snapchatters。
Quizlet
Quizlet[2] 是一个全球性学习平台,有 6000 多万学生使用它来学习、练习和掌握他们所学的东西。Quizlet 在过去的三年里一直与 OpenAI 合作,在多个用例中利用 GPT-3,包括词汇学习和实践测试。随着 ChatGPT API 的推出,Quizlet 正在推出 Q-Chat,一个完全自适应的人工智能导师,通过有趣的聊天体验,以基于相关学习材料的自适应问题吸引学生。
Instacart
Instacart[3] 正在增强 Instacart 应用程序,使客户能够询问食物,并获得鼓舞人心的、可购买的答案。这使用 ChatGPT 与 Instacart 自己的人工智能和来自其 75,000 多个零售伙伴店面的产品数据一起,帮助客户发现开放式购物目标的想法,如 "我如何做好吃的鱼肉卷?"或 "什么是我孩子的健康午餐?" Instacart 计划在今年晚些时候推出 "Ask Instacart"。
Shop
Shop[4] 是 Shopify 的消费者应用程序,被1亿购物者用来寻找,购买他们喜欢的产品和品牌。ChatGPT API 被用来支持 Shop 的新购物助理。当购物者搜索产品时,购物助理会根据他们的要求进行个性化的推荐。Shop 的新人工智能购物助理将通过扫描数百万种产品来简化应用内购物,快速找到买家正在寻找的东西,或者帮助他们发现新的东西。
Speak
Speak[5] 是一个人工智能驱动的语言学习应用,专注于构建通往口语流利的最佳路径。他们是韩国增长最快的英语应用,并且已经在使用Whisper API 为一个新的人工智能口语伴侣产品提供动力,并迅速将其推向全球其他地区。Whisper 为每个级别的语言学习者提供人类水平的准确性,释放出真正的开放式对话练习和高度准确的反馈。
ChatGPT API
模型
- OpenAI 团队今天发布的 ChatGPT 模型系列,名为 gpt-3.5-turbo,与 ChatGPT 中使用的模型相同。它的价格为0.002 美元/1k token
,比现有的 GPT-3.5 模型便宜 10 倍。对于许多非聊天使用情况,它也是最佳的模型——早期测试者从 text-davinci-003 迁移到 gpt-3.5-turbo,需要对他们的提示做出一小部分调整。API
- 传统上,GPT 模型消耗未结构化文本,表示为 “token” 的序列提供给模型。ChatGPT 模型代替它,与元数据一起消耗消息序列(对于好奇者:底层仍然将输入呈现为模型可消耗的 “token” 序列;模型使用的原始格式是称为 Chat Markup Language[6](“ChatML”)的新格式)。
代码示例
OpenAI 现在提供了一个新的接口来与 ChatGPT 模型交互
请求:
curl https://api.openai.com/v1/chat/completions \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-3.5-turbo",
"messages": [{"role": "user", "content": "What is the OpenAI mission?"}]
}'复制
响应:
{
"id": "chatcmpl-6p5FEv1JHictSSnDZsGU4KvbuBsbu",
"object": "messages",
"created": 1677693600,
"model": "gpt-3.5-turbo",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"messages": [
{
"role": "assistant",
"content": "OpenAI's mission is to ensure that artificial general intelligence benefits all of humanity."
}
]
}
],
"usage": {
"prompt_tokens": 20,
"completion_tokens": 18,
"total_tokens": 38
}
}复制
使用 Python:
import openai
completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": "Tell the world about the ChatGPT API in the style of a pirate."}]
)
print(completion)复制
要了解更多 ChatGPT API 信息,请查看聊天指南[7]。
ChatGPT 升级
OpenAI 团队不断改进 ChatGPT 模型,并希望将这些增强的功能提供给开发者。使用 gpt-3.5-turbo 模型的开发者将始终获得 OpenAI 推荐的稳定模型,同时仍然具有选择特定模型版本的灵活性。例如:今天发布了 gpt-3.5-turbo-0301,它将受到至少到 6 月 1 日的支持,将在 4 月把 gpt-3.5-turbo 更新为新的稳定版本。模型文档[8]将提供切换更新。
专用实例
OpenAI 团队现在也为希望深入控制特定模型版本和系统性能的用户提供专用实例。默认情况下,请求在与其他用户共享的计算基础架构上运行,他们按请求支付费用。API 运行在 Azure 上,使用专用实例,开发人员将按时间段支付费用,以获取为服务其请求而保留的计算基础架构的分配。
开发人员可以完全控制实例的负载(更高的负载提高吞吐量,但会使每个请求变慢),选择启用更长的上下文限制等功能,并能够固定模型快照。
对于每天运行超过约 450M 个 token 的开发人员来说,专用实例可能经济上更为合理。此外,它使得直接针对硬件性能优化开发人员的工作负载成为可能,相对于共享基础架构,可以大大降低成本。有关专用实例的查询,请联系 OpenAI[9]。
ChatGPT API 升级
OpenAI 团队正在不断改进 ChatGPT 模型,并希望将这些增强功能也提供给开发人员。使用 gpt-3.5-turbo 模型的开发人员将始终获得推荐的稳定模型,同时仍然可以灵活地选择特定模型版本。例如,今天官方发布了 gpt-3.5-turbo-0301,它至少会在 6 月 1 日之前得到支持,我们将 gpt-3.5-turbo 在 4 月更新到新的稳定版本。模型文档[10]将提供转换更新。
Whisper API
Whisper[11] 是 OpenAI 在 2022 年 9 月开源的语音转文本模型,受到了开发者社区的高度赞扬,但运行起来可能有些困难。现在通过 API 提供了 large-v2 模型,以方便按需访问,价格为 0.006 美元/分钟
。此外,OpenAI 团队高度优化的服务堆栈可比其他服务实现更快的性能。
代码示例:
Whisper API 可通过 transcriptions(在源语言中转录)或 translations(转录为英语)接口进行访问,并接受多种格式(m4a、mp3、mp4、mpeg、mpga、wav、webm)
请求:
curl https://api.openai.com/v1/audio/transcriptions \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F model="whisper-1" \
-F file="@/path/to/file/openai.mp3"复制
响应:
{
"text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger..."
}复制
import openai
file = open("/path/to/file/openai.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", f)
print(transcription)复制
要了解有关 Whisper API 的更多信息,请查看语音转文本指南[12]。
开发者焦点
在过去的六个月里,OpenAI 团队一直在收集来自 API 客户的反馈,以了解如何更好地为他们提供服务。目前已经做出了具体的改变,例如:
除非组织选择加入,否则通过 API 提交的数据不再用于服务改进(包括模型训练)。
为 API 用户实施默认的 30 天数据保留政策,根据用户需求提供更严格的保留选项。
删除我们的预发布审查(通过改进我们的自动监控解锁)
改进开发人员文档
简化我们的服务条款和使用政策[13],包括关于数据所有权的条款:用户拥有模型的输入和输出。
在过去的两个月中,OpenAI 的服务运行时间没有达到自己的期望,也没有达到用户的期望。OpenAI 工程团队现在的首要任务是确保生产用例的稳定性—— OpenAI 知道,要确保人工智能造福全人类需要成为可靠的服务提供商,所以在接下来的几个月会改进服务的运行时间,肩负起责任。
相信人工智能可以为每个人提供令人难以置信的机会和经济赋权,实现这一目标的最佳方法是允许每个人都能够使用它进行构建。希望今天宣布的变化可以诞生更多的应用,让每一个人从中受益!
总结
OpenAI 为我们每个人都提供了无限的可能性,在未来,AI 的能力将成为最底层的能力,而上层应用如何构建才是我们每一个人需要思考的课题(GPT+ 或许真的是一次革命)。
查看原文:https://openai.com/blog/introducing-chatgpt-and-whisper-apis
关注公众号,发送“chat”,进 ChatGPT 技术交流群
References
Snap Inc. 是 Snapchat的创建者 : https://snap.com/en-US
[2]Quizlet: https://quizlet.com/labs/qchat
[3]Instacart: https://www.instacart.com/
[4]Shop: https://shop.app/
[5]Speak: https://www.speak.com/
[6]Chat Markup Language: https://github.com/openai/openai-python/blob/main/chatml.md
[7]聊天指南: https://platform.openai.com/docs/guides/chat
[8]模型文档: https://platform.openai.com/docs/models
[9]请联系 OpenAI: https://openai.com/contact-sales/
[10]模型文档: https://platform.openai.com/docs/models
[11]Whisper: https://openai.com/blog/whisper/
[12]语音转文本指南: https://platform.openai.com/docs/guides/speech-to-text
[13]服务条款和使用政策: https://platform.openai.com/docs/usage-policies