暴雨、局地大暴雨、 短时强对流天气 今天(8日)午后就将抵达武汉! 最强降水时段主要集中在 8日夜间至9日上午 刚刚,很多武汉人收到提醒短信: 请密切...
2026-04-08 1
2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
华为诺亚方舟实验室声明截图
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。
爆料文章截图
该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。
自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”
最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。
截至目前,华为并未对此自曝内容发表声明。
来源:新黄河客户端综合新浪科技
诺亚方舟实验室、云头条
相关文章
暴雨、局地大暴雨、 短时强对流天气 今天(8日)午后就将抵达武汉! 最强降水时段主要集中在 8日夜间至9日上午 刚刚,很多武汉人收到提醒短信: 请密切...
2026-04-08 1
4月7日,据中国裁判文书网:2023年2月,邓某强与陈某玲相亲相互看中后,双方父母当即为二人定下婚事,约定由男方支付彩礼188000元并为陈某玲购置四...
2026-04-08 1
4月7日10时至4月8日10时,一天之内,有一名中管干部官宣被查,两名“老虎”被提起公诉。 中纪委打下今年第20“虎” 4月7日17时30分许,中央...
2026-04-08 2
最近,印度面临的困境似乎是个多重叠加的“霉运包”。不仅在霍尔木兹海峡的能源通航问题上陷入困境,连向法国购买“阵风”战机的谈判也未能如愿。 让我们回顾一...
2026-04-08 1
4月7日,在张雪峰老师离世半个月后,其创办的“峰学未来”团队正式恢复直播。 这场备受关注的复播于当日早7点开启,至中午12点24分结束,历时超5小时,...
2026-04-08 1
极目新闻记者 陈洋洋 近日,吉林一名“95后”女程序员在个人账号发布多条视频称,自己辞去了北漂的工作,目前返乡和父亲一起工作开挖掘机。许多网友好奇,程...
2026-04-08 1
四月的第一天,京城天气十分怡人,春和景明,晴朗舒适。北京市气象台1日14时发布:今天下午晴转多云,偏南风三级左右,阵风五级,最高气温19℃;夜间多云转...
2026-04-01 3
广州市应急管理局3月31日公布了《广州从化“10·20”较大道路交通事故调查报告》。 2025年10月20日13时43分许,从化区285县道与左灌渠...
2026-04-01 4
发表评论