直达「 通往AGI之路 」飞书知识库 →
知识库精选- 9 月 13 日
知识库精选- 9 月 13 日
知识库精选|2024-9-13|最后更新: 2024-9-14
type
status
summary
date
slug
tags
category
password
icon
  • OpenAI:我憋了个新大招儿,它叫o1-perview/mini 》来自蓝衣剑客的分享,他感悟推理模型的准确率不断攀升、甚至达到完全可信的地步确实是一件非常惊喜又恐怖的事情。之前让模型干创意的活儿,现在又能干精确的活儿,这属于全场景覆盖,这意味着AI技术可以渗透到更多行业、更多高精尖业务中去!
notion image
  • 「草莓」实测:可能只是工程 Trick,且有扣费陷阱!》来自大聪明的实测,OpenAI 新发布的「草莓」模型(o1 系列) 在 STEM(理工科)领域进行了特别优化,在回答之前会进行思考,在物理、生物和化学问题(GPQA)的基准测试中超越了人类博士水平的准确性,但是存在多个问题和高额的计费陷阱。虽然在某些领域超越了 GPT-4o,但整体效果和特性远低于预期,且支持多种功能,输出限制明显。模型的推理过程消耗大量 tokens,可能导致用户费用飙升。
  • OPENAI新模型9.12发布:OpenAI o1》,模型亮点:
    • 更聪明的思考方式:这些模型像人一样,会花更多时间思考问题,尝试不同的策略,甚至能意识到自己的错误。
    • 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上,新模型表现得像博士生一样好,甚至在 IMO 和 Codeforces 竞赛中取得了高分。
    • 暂时缺少一些功能:虽然目前还没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上,OpenAI O1 已经非常强大了。
    • AI 能力的新高度:这个新系列代表了 AI 能力的一个新水平,所以我们把它命名为 OpenAI O1。
notion image
知识库精选- 9 月 14 日知识库精选- 9 月 12 日