LSTM之父炮轰LLaMA 2：抄我想法还羞辱我！网友：LeCun干的吧？

LLaMA可谓是「驼红是非多」。

新版本刚发布没多久，就遭到了LSTM之父Jrgen Schmidhuber的炮轰。

你「饭来张口」也就算了，竟然还「放下碗骂娘」？

Schmidhuber称，Meta在练习LLaMA 2的时候用到了他在1991年提出的主意，结果LLaMA却对他张狂抹黑。

一开端，网友发现在询问LLaMA 2关于Schmidhuber的事时，得到了令人意外的回复。

抱愧，我不能供给关于有负面布景的人的信息……

LLaMA还说，Schmidhuber「从事过有害活动」「对社会没有奉献」云云。

有网友猜测，这个回答是LeCun硬编码进去的。

LLaMA究竟是成心仍是不小心的，这一点无从考证，不过能够确定的是这个消息传到了Schmidhuber的耳朵里。

Schmidhuber要求Meta和LeCun对此做出解说，两方到目前均没有回应。

「LeCun抢了我许多主意」

Schmidhuber提到的1991年的效果，是一种Transformer的线性（未归一化）变体。

Schmidhuber说，这也是最早的Transformer变体。相关论文在1992年宣布，1993年登上了ICANN。

另外，依据Schmidhuber的说法，LeCun在「抢效果」方面已经是「惯犯」了。

不仅是LLaMA，LeCun还有许多效果都用到了他的主意，却声称自己是创始。

Schmidhuber称，早在2017年，Meta（其时还叫Facebook）就使用了他发明的LSTM。

不过其时Facebook的通告傍边通篇未提及Schmidhuber的姓名。

乃至还说LSTM是自己发明的。

又如在2022年，LeCun总结了10年来AI领域最重要的五大突破。

Schmidhuber表明，这些效果大部分都是来自他的实验室：

其时的LeCun毫不客气地回怼，还对Schmidhuber挖苦了一番：

在莱特兄弟之前也有人发明过飞机，可是只飞了不到50米，所以没有人记住他（Ader）的姓名。
Schmidhuber做出来的模型就和Ader的飞机一样，就算是最早的，也没有什么作用。

Schmidhuber接下来又拿出了LeCun的一篇关于机器自主智能的论文。

Schmidhuber说，这篇论文中涉及了1990-2015年间的效果，但并未标注引用。

为了充分展现这篇论文中「抢」走的效果，Schmidhuber还专门做了一个网页，详细列举了有关内容。

具体内容这里就不逐个介绍了，咱们来看LeCun是怎么回应的。

LeCun先是呛了一句，「咱就不能说点有建设性的意见吗？」，之后又说：

我在论文里都说了，许多概念已经存在了很长时间，你为什么非揪着不放？
再说了，可练习的世界模型本便是系统辨认的核心思维。
并且论早的话，80年代就有人用神经网络学习人类世界了，不比你1991更早？

就这样，这场战火一直烧到今年。

2月，Schmidhuber发推称，LeCun既没有承认错误，也没有通过正确的方式（OpenReview）对他的论文进行辩解，而是针对Schmidhuber宣布了极具误导性的观念。

直到这次LLaMA 2被曝出宣布攻击Schmidhuber的言论，两人之间的争斗好像仍未停息。

「羊驼事情」发生之后，有网友调侃性地创造了「Schmidhubered」这个新单词。

「schmidhubered」的体现包含下面这几点：

如果Schmidhuber的说法都属实，那么这个词的解说的确形象地描述了他的遭受。

LeCun这次又会做出什么样的回应？仍是让子弹再飞一会儿……

参考链接：
[1]people.idsia.ch/~juergen/le…
[2]twitter.com/Schmidhuber…

—完—

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。