“妈,我撞死人了,快救我!” 一通带着哭腔的陌生来电 让营口市81岁的苑大娘瞬间陷入慌乱 一场针对老年人的电信诈骗就此上演 近日 营口市公安局站前分局...
2025-12-18 4
2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
华为诺亚方舟实验室声明截图
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。
爆料文章截图
该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。
自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”
最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。
截至目前,华为并未对此自曝内容发表声明。
来源:新黄河客户端综合新浪科技
诺亚方舟实验室、云头条
相关文章
“妈,我撞死人了,快救我!” 一通带着哭腔的陌生来电 让营口市81岁的苑大娘瞬间陷入慌乱 一场针对老年人的电信诈骗就此上演 近日 营口市公安局站前分局...
2025-12-18 4
18日,2003年龄段中国U22队离开集训地广东肇庆,乘坐下午1点多起飞的航班前往阿联酋迪拜,为即将于明年1月初揭幕的第7届U23亚洲杯进行冲刺阶段的...
2025-12-18 3
“我刚倒车,天上就飞下来一把菜刀!” 日前,宁波奉化莼湖派出所接到一起报警,报警人声音发颤地称,自己刚吃完午饭,坐进车里准备倒车时,一把菜刀突然从天而...
2025-12-18 3
近日,媒体报道南京博物院馆藏名画现身拍卖市场,引发关注。12月17日,南京博物院发布情况说明回应此事。对此,12月18日,江苏省文化和旅游厅工作人员回...
2025-12-18 1
家有宠物狗的朋友请注意啦! 新修订的《中华人民共和国治安管理处罚法》 将于2026年1月1日正式实施 这次修订专门给养犬划了“红线” 违规养犬 轻则罚...
2025-12-18 3
泰柬边境的枪炮声已经响了8天,现在战局彻底明朗了——泰国军队靠着碾压式的火力把柬埔寨按在地上打,曾经在东南亚政坛说一不二的洪森,这次带着刚接班的儿子洪...
2025-12-18 3
近日,记者收到山西大同大学一教师反映:该校音乐学院现任副院长曹某某,在今年5月的副院长人选民主推荐环节,存在违规拉票的行为。事后经大同大学纪委部门调查...
2025-12-18 2
来源:市场资讯 (来源:IT之家) IT之家 12 月 18 日消息,科技媒体 benzinga 今天(12 月 18 日)发布博文,报道称特斯拉首席...
2025-12-18 2
发表评论