近日,华为公司推出的AI大模型“盘古”引发了轩然大波。一名自称华为诺亚方舟实验室员工的匿名者,在社交媒体平台上发布了一篇长达6000字的文章,揭露了该公司在大模型研发过程中的诸多不当行为,包括抄袭和内部斗争等问题。
在这篇名为《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》的文章中,爆料者详细描述了自己参与“盘古”大模型开发的经历。他表示,面对外界对盘古模型涉嫌抄袭的质疑,自己夜不能寐,经过深思熟虑后决定将自己所见所闻公之于众。
文章指出,在开发过程中,由于华为内部竞争激烈,研发进展缓慢,团队面临着来自上级的压力和质疑。为了缩小与竞争对手的差距,实验室主任王云鹤出手,决定通过套用竞争对手的技术实现快速提升,结果使得模型各项指标在短时间内平均提高了10个百分点。这种“套壳”手法成为了他们的“第一次杰作”。
爆料者提到,华为的高层管理者对于这种抄袭行为并未有清晰认识,误以为团队实现了算法创新。此外,文章中还提到,华为在开发“盘古”模型的过程中,曾多次借鉴阿里巴巴的千问及DeepSeek等竞争对手的AI产品。
随着内部斗争的加剧,华为在短时间内失去了多位优秀的大模型人才。爆料者在文末特别声明自己“不会自杀”,表达了对自身及家人安全的担忧。他表示,自己将定期向公众报平安,以防止被公司追责或抹杀。
这一爆料在社交媒体上引发了广泛讨论,许多网友对此表示关注。有评论指出,华为的造假问题并不新鲜,认为这是其在激烈竞争中的必然结果。同时,也有声音对爆料者的勇气表示赞赏,认为在当前社会中,敢于揭露真相的行为十分稀缺。
华为在6月30日正式推出了开源的盘古7B参数模型及盘古Pro MoE 72B混合专家模型,然而,随之而来的抄袭指控使得其声誉受到重创。研究团队“HonestAGI”于7月4日发布的技术分析报告指出,华为的“盘古”模型结构与阿里巴巴的Qwen-2.5 14B模型高度相似,相关系数高达0.927,远超行业标准的0.7。这一研究表明,华为的模型可能并非完全从头训练,而是经过再加工而成。
对此,华为于7月5日发布声明,否认了抄袭的指控,但承认部分基础组件代码“参考了业界开源实践”,并强调遵循了开源许可证的要求。尽管华为自2021年就已推出初代盘古模型,并在大模型领域较早布局,外界依然将其视为落后于竞争对手。本次事件的发酵,势必将对华为及整个AI行业产生深远的影响。