OpenAI的巨变如此悄悄的来了,AI大模型开启推理新时代
来源:华尔街见闻
在人工智能的历史上,2024年9月12日或许将被铭记为一个历史性转折点。就在这一天,OpenAI宣布了其最新系列AI模型——o1。据官方称,o1是史上最聪明的模型,思考方式也更接近人类,标志着人类正在通往推理时代的新道路。
o1模型的核心在于其推理能力。与基于预测的模型不同,o1在回答问题之前会进行深入的思考,探索不同的路径直到找到最佳答案。
这种能力使得o1能够在给定更多的“思考”时间时,回答更难的问题,类似于在国际象棋比赛中关键时刻考虑可能的走法。这种推理能力是AI发展的一大步,它使得AI能够在更广泛的领域中应用,包括但不限于编程、数学和科学问题。
普通用户在日常使用中可能难以察觉o1模型与GPT系列之间的微妙差异,但对于深入研究AI技术的研究人员而言,这一变化却是革命性的。
据《The Atlantic》上周文章,研究人员已经认识到,与GPT等旧模型相比,o1模型不仅仅是一次简单的升级,而是标志着一个“完全不同的游戏规则”和“真正的进步”。作为第一个具备真正通用推理能力的大模型,o1模型在处理复杂问题和推理任务时展现出的能力,或预示着人工智能技术的一个历史性转折点。
OpenAI研究副总裁Mark Chen今年早前指出,o1与标准 ChatGPT 有着根本的不同,因为它可以“推理”,这是人类智能的标志。此后不久,OpenAI首席执行官Altman宣布“智能时代即将到来”,人工智能将帮助人类解决气候问题并殖民太空。上周,这家初创公司向公众发布了具有完全成熟推理能力的o1完整的第一代版本。
第一个具备真正通用推理能力的大模型
OpenAI称,o1模型是第一个具备真正通用推理能力的大模型,这一点在测试化学、物理和生物学专业知识的基准GPQA-diamond上得到了充分体现。
根据OpenAI的评估,o1在该测试中全面超过了人类博士专家,准确率达到78.3%,而人类专家的得分为69.7%。OpenAI称,“通用人工智能(AGI)之路,已经没有任何阻碍”。
此外,o1在多个高难度的推理基准测试中表现优异,例如在美国数学邀请赛(AIME)中,o1的正确率达到了83.3%,远超其前身GPT-4o的表现。
o1模型的推出,也使得国内外的AI企业开始密切关注彼此的动态,意图在AI大模型领域实现突破。市场涌现出一批新兴的大模型,如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆仑万维的“天工大模型4.0”o1版,它们在逻辑思维与深度推理的能力上,试图与o1抗衡。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
转载原创文章请注明,转载自沈阳屹晟自控设备有限公司,原文地址:https://wap.syysheng.com/post/2157.html