数字公司标志

(SeaPRwire) –   OpenAI于周四向付费用户发布了其迄今为止最先进的AI模型o1。此次发布启动了该公司为庆祝节日季而举办的“ ”活动——连续发布12款产品。

OpenAI曾吹嘘o1的“复杂推理”能力,并于周四宣布,该模型的无限访问权限每月费用为200美元。在该公司发布的展示该模型优势的视频中,一位用户上传了一张木制鸟屋的图片,并向模型寻求如何建造类似鸟屋的建议。该模型“思考”了一会儿,然后给出了表面上看起来很全面的说明。

仔细检查后发现,这些说明几乎毫无用处。AI用英寸来测量完成这项任务所需的油漆、胶水和密封剂的用量。它只给出了鸟屋前面板的尺寸,而没有其他尺寸。它建议剪一块砂纸到另一组尺寸,原因不明。在说明列表的另一部分,它说“精确尺寸如下……”,然后没有给出任何精确尺寸。

英国行业机构木匠协会主任詹姆斯·菲勒斯在一封电子邮件中表示:“你从图片中获得的关于建造鸟屋的知识与从文本中获得的知识一样多,这有点违背了AI工具的初衷。”他指出,材料清单包括钉子,但所需工具清单中不包括锤子,而且建造这个简单的鸟屋的成本“远不及”o1估计的20-50美元。“简单地说‘安装一个小铰链’并没有真正涵盖可能是设计中最复杂的部分,”他补充道,指的是视频中另一部分声称解释如何为鸟屋添加可开启屋顶的内容。

OpenAI没有立即回应置评请求。

这只是AI产品演示适得其反的最新例子。去年,一个AI辅助搜索工具的演示错误地表示詹姆斯·韦伯太空望远镜取得了一项它从未取得的发现,这一失误导致该公司的股价暴跌。最近,类似的谷歌工具的更新版本犯了类似的错误,并表示他们可以用胶水将奶酪粘在比萨饼上。

OpenAI的o1根据公开基准测试是其迄今为止最强大的模型,它采用了一种与ChatGPT不同的方法来回答问题。它本质上仍然是一个非常先进的下一个词预测器,使用机器学习从互联网及其他来源的数十亿字的文本中进行训练。但它不是立即对提示做出文字回应,而是使用一种称为“思维链”推理的技术,在幕后“思考”答案一段时间,然后才给出答案。这种技术通常比让模型下意识地给出答案产生更准确的答案,而OpenAI也曾吹捧o1的推理能力——尤其是在数学和编码方面。根据OpenAI在9月份发布的模型预览版本附带的数据,它可以准确回答78%的博士级科学问题。

但显然一些基本的逻辑错误仍然可能出现。

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。

Last modified: December 8, 2024