财联社5月27日讯(编辑 潇湘)将近半个世纪前,一位不会打字的土豆大亨最先重仓押注美光。而如今,整个世界都在效仿…… 这家总部位于美国爱达荷州博伊西的...
2026-05-27 6
【环球网科技综合报道】2月17日消息,近日,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。
论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。
该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。(勃潺)
相关文章
财联社5月27日讯(编辑 潇湘)将近半个世纪前,一位不会打字的土豆大亨最先重仓押注美光。而如今,整个世界都在效仿…… 这家总部位于美国爱达荷州博伊西的...
2026-05-27 6
高市早苗的政府似乎陷入了一种自我催眠的状态,渴望得到美国的明确支持,却总是面对特朗普政府的冷遇。与此同时,日本外相茂木敏充的频繁游说行动,不仅暴露出东...
2026-05-27 4
近日,海南某小区 居民和物业的电话录音被曝光 引发关注 5月23日,海南海口一小区发生电梯困人事件,一女子带着孩子被困在电梯里,女子打电话求助物业。...
2026-05-27 5
来源:21世纪经济报道 据央视新闻报道,当地时间27日,伊朗国家安全委员会成员布鲁杰迪表示,根据伊朗与美国达成的初步协议草案,美方将在第一阶段承诺在所...
2026-05-27 6
驾车追尾肇事,男子非但没有配合处理,反而借机逃窜躲入农田。近日发生在海曙区古林镇的这起交通事故,背后隐藏着酒驾违法的荒唐真相。 事发当日傍晚5点40分...
2026-05-20 4
广州天河招商迎来标志性项目! 4月28日,全球科技巨头谷歌(Google)正式签订合同,入驻位于天河CBD珠江新城的城市地标广州国际金融中心(西塔),...
2026-04-30 13
4月21日,记者从上海市公安局获悉,上海市公安局普陀分局成功破获一起潮玩公仔盗窃案。据了解,一对情侣多次至潮玩店,偷了上千个热门“卡皮巴拉”萌粒玩偶,...
2026-04-22 14
发表评论