江苏省委组织部9月22日发布省管领导干部任职前公示。 其中: 邢正军,男,汉族,1971年3月生,在职研究生,博士,中共党员,现任连云港市委副书记、市...
2025-09-23 9
2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
华为诺亚方舟实验室声明截图
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。
爆料文章截图
该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。
自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”
最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。
截至目前,华为并未对此自曝内容发表声明。
来源:新黄河客户端综合新浪科技
诺亚方舟实验室、云头条
相关文章
江苏省委组织部9月22日发布省管领导干部任职前公示。 其中: 邢正军,男,汉族,1971年3月生,在职研究生,博士,中共党员,现任连云港市委副书记、市...
2025-09-23 9
在波澜壮阔的国际政治舞台上,以色列总理内塔尼亚胡似乎是个不怕风头的人物。他在美国访问期间竟然放出狠话,重申“绝不会有巴勒斯坦国”,而这一番反其道而行之...
2025-09-23 8
据报道,当普京宣布70万俄军已经在乌克兰前线“压阵”时,世界的目光再次聚焦在这场旷日持久的冲突上。这不仅仅是对战局的一个数字性表述,更是一种极为明显的...
2025-09-23 6
妻子去世后,七旬老人崔某称在遗物中发现了一个存折,并以此向法院提起诉讼,要求中国某有限公司长春朝阳支行(以下简称朝阳支行)给付存款本金60万元及利息。...
2025-09-23 6
在国际政治舞台上,波兰的一声令下,竟然让中欧班列这一重要的贸易通道陷入了停滞。而波兰本以为借此机会可以“拿捏”局势,却没想到中国早已做好了应对策略。这...
2025-09-23 7
当前固态电池产业化已进入“冲刺阶段”。 跨界收购半导体企业 向日葵“一”字涨停 今日(9月22日),向日葵(300111)“一”字涨停,截至收盘,该股...
2025-09-23 6
与传统的公域直播不同私域直播往往通过微信群将老年人引导到特定的直播间这些直播通常需要输入密码才能观看内容 私域直播将信息传播限制在一个可控的小范围内具...
2025-09-23 5
01 心疼高位买了银行的小伙伴。 别人是“躲牛市”,充其量不赚钱,或赚的少。 他们是“在牛市中被毒打”,中证银行走出了“股灾”行情,最高点以来跌了15...
2025-09-23 8
发表评论