OpenAI 直播再放大招

云轩宝贝 · 发表于 2025-1-5 19:59:17

马上注册，结交更多淘宝商家，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有帐号？立即注册

x

OpenAI 开启了“连续 12 天直播发布”的第二天。第二天的直播内容再次引爆了科技圈。
这次上阵直播的四人，是 OpenAI 的研究员 Mark Chen、John Allard、Julie Wang，以及伯克利实验室盘算生物学家 Justin Reese。

这一次，OpenAI 向我们展示了强化微调（Reinforcement Fine-Tuning）技能的惊人力气，使得本来气力不俗的 o1-mini 模子，实现了对地表最强底子模子 o1 的全面逾越。
这一突破性的结果，为将来的模子定制和应用开辟了新的门路。
强化微调技能揭秘
强化微调，作为 OpenAI 此次直播的核心内容，着实质是一种基于强化学习的模子优化技能。
与传统的微调方法差别，强化微调真正利用了强化学习算法，把模子从高级中学程度提拔到专家博士级别。
强化微调（RFT），能让开辟者、研究职员和呆板学习工程师初次有机遇利用强化学习来创建专家级模子，在特定范畴的使命中有精良表现。
对于法律、金融、工程、保险等范畴，这项技能简直是量身打造的。
举例来说，OpenAI 近来和汤森路透相助，利用强化微调对 o1 Mini 举行了微调，使其成为了一名法律助手，帮法律专业人士完成了一些复杂、必要深入分析的工作流程。
o1-mini 模子逆袭的故事
在此次直播中，OpenAI 特殊提到了 o1-mini 模子的逆袭进程。
颠末强化微调技能的加持，o1-mini 在多个关键指标上均实现了对 o1 模子的逾越。此中，Top-1 正确率的提拔尤为明显，从 o1 的 25%跃升至 o1-mini 的 31%，增幅高达 180%。
值得一提的是，强化微调技能的研发思绪与字节跳动此前公开辟表的研究结果不谋而合。
强化微调技能应用
强化微调技能的出现，将为多个范畴带来革命性的厘革。无论是法律、金融、工程照旧医疗保健等行业，都必要高度专业化和精准化的模子来应对复杂的寻衅。而强化微调技能正是办理这些标题的关键地点。
以医疗保健范畴为例，强化微调技能可以资助医生更正确地诊断疾病、订定治疗方案。通过与医学专家的知知趣团结，模子可以或许学习到更为复杂和风雅的医学知识，从而进步诊断的正确性和服从。别的，在药物研发、基因编辑等范畴，强化微调技能也将发挥不可更换的作用。
随着强化微调技能的不绝美满和成熟，OpenAI 有望在将来推出更多具有创新性和实用性的产物和服务。这些产物将不但满足各行业的需求，也将推动整个人工智能范畴的发展进程。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

DDSSLLL · 发表于 2025-1-6 02:36:23

学习到了赶快利用一下去

qurro2 · 发表于 2025-1-11 14:56:49

楼主很优秀啊

allenpeng · 发表于 2025-1-16 13:28:55

66666666666666

flamefir · 发表于 2025-1-18 10:33:22

不知道实力运用这个方法会怎么样

qwe12as · 发表于 2025-1-19 22:01:07

过来学习啦哈哈

rh881001 · 发表于 2025-1-20 00:00:37

谢谢楼主分享

disabc · 发表于 2025-1-21 06:24:57

厉害学习到了

bs130 · 发表于 2025-1-26 06:23:31

写的不错谢谢分享

东方如风 · 发表于 2025-2-15 19:03:50

支持楼主来学习一下

OpenAI 直播再放大招

马上注册，结交更多淘宝商家，享用更多功能，让你轻松玩转社区。

浏览过的版块

让创业更简单

关于我们

云服务支持

精彩文章，快速检索

关注我们