LLaMA可谓是「驼红是非多」。
新版本刚发布没多久,就遭到了LSTM之父Jrgen Schmidhuber的炮轰。
你「饭来张口」也就算了,竟然还「放下碗骂娘」?
Schmidhuber称,Meta在练习LLaMA 2的时候用到了他在1991年提出的主意,结果LLaMA却对他张狂抹黑。
一开端,网友发现在询问LLaMA 2关于Schmidhuber的事时,得到了令人意外的回复。
抱愧,我不能供给关于有负面布景的人的信息……
LLaMA还说,Schmidhuber「从事过有害活动」「对社会没有奉献」云云。
有网友猜测,这个回答是LeCun硬编码进去的。
LLaMA究竟是成心仍是不小心的,这一点无从考证,不过能够确定的是这个消息传到了Schmidhuber的耳朵里。
Schmidhuber要求Meta和LeCun对此做出解说,两方到目前均没有回应。
「LeCun抢了我许多主意」
Schmidhuber提到的1991年的效果,是一种Transformer的线性(未归一化)变体。
Schmidhuber说,这也是最早的Transformer变体。相关论文在1992年宣布,1993年登上了ICANN。
另外,依据Schmidhuber的说法,LeCun在「抢效果」方面已经是「惯犯」了。
不仅是LLaMA,LeCun还有许多效果都用到了他的主意,却声称自己是创始。
Schmidhuber称,早在2017年,Meta(其时还叫Facebook)就使用了他发明的LSTM。
不过其时Facebook的通告傍边通篇未提及Schmidhuber的姓名。
乃至还说LSTM是自己发明的。
又如在2022年,LeCun总结了10年来AI领域最重要的五大突破。
Schmidhuber表明,这些效果大部分都是来自他的实验室:
- 自监督学习实际上便是把1991年的RNN进行堆叠
- ResNet便是2015年的Highway Net
- 3和4便是1991年的fast weight
- 5实际上便是1991年的线性Transformer变体
其时的LeCun毫不客气地回怼,还对Schmidhuber挖苦了一番:
在莱特兄弟之前也有人发明过飞机,可是只飞了不到50米,所以没有人记住他(Ader)的姓名。
Schmidhuber做出来的模型就和Ader的飞机一样,就算是最早的,也没有什么作用。
Schmidhuber接下来又拿出了LeCun的一篇关于机器自主智能的论文。
Schmidhuber说,这篇论文中涉及了1990-2015年间的效果,但并未标注引用。
为了充分展现这篇论文中「抢」走的效果,Schmidhuber还专门做了一个网页,详细列举了有关内容。
具体内容这里就不逐个介绍了,咱们来看LeCun是怎么回应的。
LeCun先是呛了一句,「咱就不能说点有建设性的意见吗?」,之后又说:
我在论文里都说了,许多概念已经存在了很长时间,你为什么非揪着不放?
再说了,可练习的世界模型本便是系统辨认的核心思维。
并且论早的话,80年代就有人用神经网络学习人类世界了,不比你1991更早?
就这样,这场战火一直烧到今年。
2月,Schmidhuber发推称,LeCun既没有承认错误,也没有通过正确的方式(OpenReview)对他的论文进行辩解,而是针对Schmidhuber宣布了极具误导性的观念。
直到这次LLaMA 2被曝出宣布攻击Schmidhuber的言论,两人之间的争斗好像仍未停息。
One More Thing
「羊驼事情」发生之后,有网友调侃性地创造了「Schmidhubered」这个新单词。
「schmidhubered」的体现包含下面这几点:
- 发明晰很好的东西,结果不光没人关心,反而被讪笑
- 几年之后(这个方面)又流行起来了,可是却被别人说是创始
- 开端解说自己才是最早的发明者
- 结果没人在意,乃至所有人都觉得你是在
- 姓名被做成动词
如果Schmidhuber的说法都属实,那么这个词的解说的确形象地描述了他的遭受。
LeCun这次又会做出什么样的回应?仍是让子弹再飞一会儿……
参考链接:
[1]people.idsia.ch/~juergen/le…
[2]twitter.com/Schmidhuber…
—完—