查看: 777|回复: 2

OpenAI向第三方开发者开放最强大模型o1 [复制链接]

tayun

军衔等级：

上尉

注册：2015-11-14 点赞数

4

发表于 2024-12-18 14:40:13 |显示全部楼层

12月18日消息，在为期12天的假日发布会进入第9天之际，OpenAI宣布其最先进的模型o1系列已通过应用程序接口（API）全面向第三方开发者开放。这一发布标志着开发者向构建先进人工智能应用迈出了重要一步。它也让开发者能够将OpenAI的顶尖技术无缝集成到现有的企业级应用或面向消费者的工作流程中。

OpenAI的o1系列模型于2024年9月首次亮相，是该企业推出的“新模型家族”中的首个成员。这不仅意味着对GPT系列大语言模型（LLM）的突破，更引入了全新的“推理”能力。

简单来说，o1系列模型（包括o1和o1 mini）相比传统大语言模型，虽然响应时间稍长，但能够在生成回答时进行自我校验，确保回答的准确性，从而有效避免“幻觉”现象。OpenAI此前表示，o1模型能够处理更复杂的任务，甚至包括博士级别的问题，而实际应用的反馈也验证了这一点。

此前，开发者已可通过o1预览版构建各种应用，例如“博士导师”或“实验室助手”。如今，伴随通过API发布的生产版o1模型正式上线，其性能得到显著提升，延迟更低，并新增了多项功能，极大简化了模型在实际场景中的集成和应用。

大约两周半前，OpenAI已通过ChatGPT Plus和ChatGPT Pro计划向消费者开放了o1模型，并增加了对用户上传图像及文件的分析和响应功能。

此外，OpenAI还在今天的发布会上公布了对其Realtime API的重大更新，包括价格下调及一种全新的微调方法，赋予开发者更高的模型控制能力。

1. o1模型现已通过API向开发者开放

新版o1模型（版本号：o1-2024-12-17）在复杂且多步推理任务中表现出色。与此前的o1-preview版本相比，该版本在准确性、效率和灵活性方面均实现了显著提升。

OpenAI表示，新版o1模型在多项基准测试中取得了突破性成绩，涵盖编码、数学和视觉推理等多个领域。例如，在SWE-bench Verified测试（该基准用于评估模型解决实际App问题的能力）中，o1的得分从41.3提升至48.9；而在数学领域的AIME测试中，得分从42大幅跃升至79.2。这些改进使得o1模型成为优化客户支撑、提升物流管理效率或解决复杂分析问题等场景中的理想工具。

此外，OpenAI为开发者提供了多项新功能：

·结构化输出：允许生成符合自定义格式（如JSON架构）的响应，确保与外部系统交互时保持结果一致性；

·函数调用：简化了模型与API及数据库的连接流程；

·视觉推理：使模型能够处理视觉输入，拓展了制造、科学研究和编程等领域的全新应用场景。

开发者还可以通过新增的reasoning_effort参数对o1模型进行微调。该参数可平衡任务的性能和响应时间，控制模型在任务处理时所投入的计算时间。

2. Realtime API重大更新，为智能语音/音频AI助手提供支撑

OpenAI同时宣布对Realtime API进行重大更新，旨在支撑低延迟、自然流畅的语音交互体验，适用于语音助手、实时翻译工具和虚拟导师等场景。

新增的WebRTC集成为开发语音应用提供了直接支撑，包括音频流、噪声抑制和网络拥塞控制等功能。即使在网络条件不稳定的情况下，开发者也能以最小的配置轻松实现实时功能集成。

在定价方面，OpenAI显著降低了Realtime API的成本：

·GPT-4o音频：价格下调60%，每100万输入Token费用降至40美金，输出Token费用降至80美金；

·缓存音频输入：成本降低87.5%，定价为每100万输入Token 2.5美金；

·GPT-4o mini：作为更小、更经济高效的模型，每100万输入Token费用仅为10美金，输出Token费用为20美金。

此外，GPT-4o mini的文本Token价格也大幅降低，输入Token的起始价格为0.60美金，输出Token的起始价格为2.40美金。

除了降低成本，OpenAI还为开发者提供了对Realtime API更高的控制权：

·并发带外响应：允许后台任务（如内容审核）在不影响用户体验的情况下运行；

·上下文定制：开发者可以根据对话内容定制输入上下文，并精确控制语音响应的触发时机，以实现更准确、流畅的交互体验。

3. 偏好微调提供了新的自定义选项

OpenAI新推出的另一个重要功能是偏好微调，这是一种基于用户和开发者偏好来定制模型的新方法。

不同于传统的监督式微调依赖精确的输入-输出对，偏好微调采用成对比较的方式，引导模型识别并生成更符合用户偏好的响应。这种方法在处理主观性任务时尤其高效，比如摘要生成、创造性写作，或在语气和风格至关重要的场景中。

与合作伙伴Rogo AI的早期测试显示了令人鼓舞的结果。Rogo AI为金融分析师开发智能助手，测试表明偏好微调在处理复杂、分布外查询时，相较于传统微调方法，显著提升了模型的表现，将任务准确率提高了5%以上。目前，该功能已应用于GPT-4o-2024-08-06和GPT-4o-mini-2024-07-18版本，并计划于明年初拓展到更多新模型上。

4. 面向Go和Java开发者的新SDK

为简化模型集成，OpenAI正在扩展其官方SDK产品线，推出Go和Java语言的测试版SDK。这些新SDK与现有的Python、Node.js和.NET库一同，为开发者提供更多编程环境的支撑，使与OpenAI模型的交互更加便捷。

·Go SDK：特别适用于构建可扩展的后端系统，提供高性能和灵活的开发能力；

·Java SDK：专为企业级应用设计，凭借强类型支撑和成熟生态系统，适配复杂且稳定性要求高的项目。

通过这些更新，OpenAI为开发者提供了更丰富的工具集，帮助他们构建先进、高度可定制的人工智能应用程序。无论是o1模型在复杂推理任务中的增强，Realtime API的优化，还是偏好微调的推出，OpenAI的最新产品旨在提供更强大的性能和更高的成本效益，助企业不断拓展人工智能技术的应用边界。

（小小）

来源：网易

举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2025-2-24 09:01 , Processed in 0.159625 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册