现在好多媒体都在鼓吹AI无所不能,说得神乎其神。又是要替代人类,又是引发大面积赋闲,还有的说“不是AI筛选了你,而是筛选了没有把握AI的你”。吧啦吧啦,跟直播间带货相同。

我自己便是做AI应用开发的,或许是才触摸到皮裘的原因,我从一开端就没有感觉到,有什么值的震动的当地。

由于我感觉东西仍是那些东西。它便是个任务式生成。不管是写案牍的文字创造,仍是智能对话,或许关闭、开发式问答,这些都是老生常谈的功用。当川普仍是总统的那年,这些东西就有许多Demo了,我也逐个测验过。仅仅现在,有人乐意花钱了,乐意买GPU了。并且从全球的网络上,搞到了足够多的练习数据,再加上算法的确优化了,所以才让AIGC瓜熟蒂落地锋芒毕露。

可是,上面的这些话,我可不敢说呀。

由于说了便是逆着潮流,现在咱们对ChatGPT可谓是好评如潮。我一说,信任网友的唾沫就能把我淹死,我的罪行比哥白尼轻不了。

博士的言论

后来,仍是有一位老前辈说了,他便是吴军博士。

我可能要给鼓吹AI的那些人,浇盆凉水了

吴军博士说完后,如同也被网友攻击了。媒体给起得标题是“吴军说ChatGPT没什么”。

为了保命,我表达观点之前,先真心肠必定一下ChatGPT。ChatGPT的确很强壮。在内容创造范畴来讲,他的确起到了革命性的作用。AIGC爆火后,信任咱们也看到了许多新闻,比方游戏公司裁掉了一些美工,电商店肆也不再聘请一天四五万的服装模特,取而代之的是改用了AI来生成作用图。

其实,吴军也没有否定它的价值。

我仔细分析了吴军说的内容,其实,跟我上面的见地也差不多。当然,这不排除是由于我喜爱读他的书,受他的影响。

他说,ChatGPT是一个言语模型,言语模型并不是新产品。另外,复杂模型的成败受算力的影响很大。这一点,以前是没有人乐意不计本钱地花钱研讨的。可是OpenAI这次舍得花钱了。这一火爆,会引发咱们都舍得花钱。终究,他说ChatGPT在内容创造范畴的确有用,可是人类的涉及的范畴何其广泛。他提醒其他范畴的同学们,不要盲目跟风,小心被卖课程的割了韭菜。

我觉得他说的没啥毛病。

文末假如有人想持续怼他或许怼我,请恕我无力回复。咱们素昧平生,犯不上有这般的冤仇。假如乐意平和地讨论,我乐意互相交换一下想法。

我仅仅想说一下自己遇到和看到的工作,仅此而已。

电力哥

最近,我遇到了许多人找我,有公司的领导,也有外界的朋友。

他们找我,无非便是想搞一搞人工智能,给自己的产业稍微加持一下AI能力,然后期望在职业内,能火上一把。

很遗憾,我帮不上他们的忙。或许说,他们有些达观了。

有个做电力的老哥,他经朋友介绍,找到我。他见我第一面就跟我讲ChatGPT。然后,给我讲大言语模型,他还知道Transformer(一种神经网络的架构)。他说,他有个哥们在澳大利亚研讨ChatGPT的源码

介绍人跟我说,这哥们有AI需求,想咨询一下。怎样我这一来,他开端给我讲课了呢?

后来他说,他对AI是有触摸的,可是太忙,没时刻研讨。

我点了允许说,是的,您连Transformer都知道。

他说,现在ChatGPT很火,又是开源的。能不能帮助在私有云布置一套,他想自己再练习一下。他的要求不高,便是想完成电力数据的AI确诊。便是把一个工厂的电力信息给到ChatGPT,然后让ChatGPT供给一份具体的分析陈述。包含哪个设备耗电多,哪个设备运转不正常。然后,再归纳起来,评价一下这个工厂整体的电力布局,有什么优势,存在什么危险,并给出一些优化主张。

我可能要给鼓吹AI的那些人,浇盆凉水了

他差点就开口问五千块够不够了。我赶忙说,我干不了。

我除了自己无能以外,我也给他分析了其他的几点客观原因。

咱们也都看到了,像ChatGPT 4.0,铺天盖地满是新闻,可是国内还没有普遍运用。并且,ChatGPT它是以API的形式供给的,也便是花钱买一个账号,每次都去问它,它现场答复,要是断网那就芭比Q了。对方也能随时让你的账号失效。自从ChatGPT开端好用的那个版本开端,它就不开源了。一方面他开源了你也用不了,由于硬件本钱太高。你自己练习一次需求上千万人民币。许多企业触摸ChatGPT都是想要挣这上千万,并不是花这个钱。

再说,人家OpenAI投入几十亿美金,搞出一个成果,很难白送,只会馋哭隔壁的小孩。所以,它有什么功用,你就用什么功用,想打造自己的GPT,难度很大。到现在为止,我还没听过它能为某家工厂确诊电力的问题。所以,大哥您无法运用。

这哥们似乎有些闷闷不乐,他感觉我说的不符合“人人皆可用AI逆天改命”的结论。他表明让我再研讨研讨,他也再找澳大利亚的那个哥们问问。

眼镜哥

我还触摸过一个人,他文质彬彬戴眼镜。他没有透露自己的单位,但我感觉他应该不是在小私企。

我问:“您也想搞一个,自己职业定制的ChatGPT吗?”

这位眼镜哥,连连摇头:“不,不,不!ChatGPT咱们不敢搞。他不支持私有化布置。咱们要的渠道,必定要能在内部网络中关闭运用”

我遽然有种遇到至交的感觉。

眼镜哥持续说:“其实,ChatGPT还有一个价值观导向的问题。假如它成了全民的常识大神、精力导师,它又是通过API方法调用,那么很难确保他不胡说乱说。除此之外,咱们也不想,把要害数据送给它去练习,那样信息安全就无法保障了”

他问,有没有一种功用相似于ChatGPT,可是能够私有布置、内部练习的开源渠道?

我问,预算多吗?

他答复,预算不少。

我说,你能够试试一个号称是ChatGPT的平替计划,是在4月中旬刚发布的。它便是Databricks公司发布的Dolly 2.0。据说它能够到达ChatGPT 3.5的水平。它完全开源,本钱也低,从技术上来说是零门槛。人家官方也说了,能够随意用。这个公司便是看不惯ChatGPT打着Open的旗号搞Close的工作。Dolly在做1.0时,那时GPT-3还开源,因而就借用了它的一些数据,成果OpenAI就限制它不能商用。到Dolly 2.0时,由于这个公司本身便是做大数据的,这次他们就自己花钱做了练习数据集。并且他们还声明“任何人均可出于任何意图运用、修改或扩展这套数据集,包含商业应用程序”。它起名叫“Dolly”,其实指的是从前的克隆羊多莉,便是期望咱们多Copy,让老树发新芽的意思。

我可能要给鼓吹AI的那些人,浇盆凉水了

眼镜哥问:“本钱大约得多少?”

我答复:“假如想跑得流畅,硬件起码得8块A100 GPU。这就80万了。再加上制作职业数据集,程序员开发布置。我觉得,少100万下不来”

后来,眼镜哥给了一个红包,就没再联络过我。

老领导

有一天,我的一个老领导也找到我。

老领导请我吃烤鱼,他说:现在ChatGPT很火,我很想借一把力。

老领导的公司是做教育职业的。我尽管不在那里干了,可是咱们的私人关系一直很好。

我太了解原来的公司了:乐意投多少钱,有什么机器,有什么数据,有多少人,想到达什么意图。我门清儿。

我说,好啊,最初在你手下时,我就一直撺弄公司搞AI。可是你连一台物理机都不舍得买。现在终于主动了。

老领导说,咱也不搞大的,就搞一个又小又有用的。咱们不是靠AI生计,仅仅想用AI给咱们的渠道点缀一下。

这样吧,咱们就搞一个相似ChatGPT的功用。不必比它强,有那么点意思就行。能够中英文翻译,让学生不必上网查询。能够常识问答,让学生不必查书就能快速获取到答案。能够案牍创造,让学生能够依据要害词就能学习如何写一段作文。

就这点功用吧,嵌入到咱们的一个兴趣问答的页面。学生闲暇时,能够跟它聊聊天。也算是增加了用户的粘性。可是,要注意要害词和灵敏信息的阻拦,这个和算法无关,我让他们从事务接口过滤就行了。

对我来说,这些需求很Easy。

于是,我就在我的电脑,搭建了一套清华大学的ChatGLM-6B模型。然后跑起来,给老领导看。

老领导喜爱看作用,并且还喜爱体验成果。

老领导问,这是你从GitHub上找的吧,哪个开源项目,叫什么名?

我说这是清华大学出的大言语模型,它用的练习数据集十分优质。所以,在中文的答复上,它表现很好,比百度那个强。并且它开源,能够自己布置,也能够自己微调练习。

“叫什么?”老领导问。

我说叫“ChatGLM-6B”。

“哦,ChatGLM-6B。哎,6B是什么意思?”

我说,B指的是billion,便是十亿的意思,6B便是60亿。这个数量,指的是大模型神经网络的参数。

我可能要给鼓吹AI的那些人,浇盆凉水了

这个参数就像是一个公司的部分。假如一个公司具有采购部,行政部,人力资源部,财务部,后勤部,部分越多,看问题的角度就越多,关于一个问题的表决就相对更准确。假如一个公司就一个人,老板、保洁满是自己干,那他答复的是很快,也省本钱,可是成果全看他的心境。

老领导点了允许:“清华的这个是60亿参数。你原来说的那个什么克隆羊,它多少参数?”

我说,Dolly 2.0是12B,120亿参数。

“ChatGPT呢?”

“ChatGPT4.0……它的参数是B前面多个零,x00000B是百万亿级其他参数”

老领导想了想,他问,那咱们这个6B会不会有点low啊?

我说,应对你提的那些小问答,绰绰有余。最要害的是,我的电脑就能跑,不必买服务器。就算是想要自己个性化练习,万元之内也能搞定。

老领导传闻不必花钱,便饶有兴致地持续试用。

终究,领导说,它回复的还行,可是不符合职业特征。

我问:“什么职业特征?”

老领导说:“拿文本生成来说,我给它几个要害字,让它生成一段文本。我想让它给出学生作文的那种风格。可是,它输出的却更像是产品描绘,或许新闻报道,并且文笔太过老道,没有稚气,更像是大人写的。我想要的是学生写记叙文、议论文的那种感觉”

我说,这个好办呀,咱们能够练习自己的数据,这叫做“微调”。

老领导说,那你微调看看!

我说,我调不了。这种风格类的东西,得由专业一些的人来制作,像制作课件相同。

我给他展示了一条ChatGLM-6B中关于广告案牍生成的练习集:

输入: 类型#上衣颜色#是非风格#精约风格#休闲图案#条纹衣款式#风衣衣款式#外套。

输出: 规划师以条纹作为风衣外套的首要规划元素,以精约……带来大气休闲的视觉作用……不容易让人觉得它过时。

人工智能并不是天生就这么聪明的,其实它是通过海量数据练习出来的。

练习数据便是人工标记好的一些已知答案的数据。一般成对呈现。比方练习辨认猫,那这条数据便是先有一张猫的图片,然后再有一个猫的成果。通过上万条这样的数据练习。终究,再给一张猫的图片,人工智能就能分辨出来了。其实它的底层也是阅片许多,终究才干修成正果。

我可能要给鼓吹AI的那些人,浇盆凉水了

就跟教孩子叫爸爸相同,你得先朝着她喊几百声“爸爸”,她才干学会怎样叫。

练习案牍自动生成也是相同,需求先有一组要害词作为输入,然后再来一段相匹配的终究成果作为输出。终究把它交给算法模型,告知它:“你看,假如有人这么问,你就这么答复,好好体会下”。

终究,她就像孩子学话相同,她不但会说“爸爸”,也会偶尔冒出一句“哔了狗了”。这句话你并没有教她,是她自己从抖音上听的。她离开了你,也会学习了。

老领导说:“嗯,我理解了。我找人收拾一下你说的练习数据。大概要多少条?”

我说:“先测验2000条吧,这点数据量,作用或许也就一般。ChatGLM-6B能到达这个作用,那是运用了十万多条数据,才练习出来的!”

我可能要给鼓吹AI的那些人,浇盆凉水了

老领导终究仍是放弃了。

他叹了一口气说:“咱们都挺忙的,或许没有人去干这件事。就算有人,估计公司也没有途径,去弄那么多优质的学生作文数据”。

本钱、通用和定制

上面三件事,提到了一个限制,那便是人工智能有三驾马车:算法,算力,数据。

关于算法,其实好多年才更新一次。相似ChatGPT这么优秀的NLP模型,它上一次的霸主仍是Google推出的BERT,那仍是2018年。

当然,只要算法这一架马车,其实无法跑。这不叫缺一条腿,实际上是只要盆骨,你想单腿蹦跶都立不起来。

因而,得花钱,搞算力,得买练习设备,买机器。就跟当年比特币挖矿相同。

这个投入,五位数入个门,上不封底。马斯克前段时刻张狂抢购了1万个GPU,少不了上亿人民币。这点GPU,不必定够用。

那位问了,我不求快,不搞你们那些个并行运算,我排着队行吗?行!设备不够,倒是也能跑,便是时刻的问题,需求等。

需求等多久?举个例子。普通三五千的GPU练习Dolly 2.0,7.5个小时一轮。练习10000轮是3125天,练习完毕需求八年半的时刻。练习完了,终究工程师说,哎呦,不好意思,忘了加一个参数,得从头再来一遍。你说,这个企业还活不活了。

你要是用集群的英伟达A100,几天搞定。你用好设备,能够反复调试,调一点看一点,这样才干获得好的成果。A100,十万块钱一个,国内还买不到。兄弟,都是钱啊。

有人说,我为啥要练习呢?我花那个冤枉钱干啥?人家ChatGPT不都练习好了吗?我一块钱买5000个字符,也能跑起来。

这就不得不说第三辆马车,那便是数据。

数据是模型的灵魂与中心。人家拿自己手头的数据,练习出来的模型,那是人家的。类比到养孩子的话,数据就像是家庭、校园和社会对孩子的教育。培养出的孩子是勇敢担当,仍是胆小怕事,全看平常的所见所闻,并由此形成的人格。 尽管练习的数据都是通用的,可是细分到每个职业,却又有自己共同的需求。

我就遇到过一个关于职业特性的事儿,挺有意思的。

当年做教育软件的时候,给学生做了一个用手写笔做试卷的功用。学生拿笔在设备上写,考试答题。然后系统依据轨道转成汉字。

成果教师找来了,有的学生写了这么一个字。

我可能要给鼓吹AI的那些人,浇盆凉水了

这个字便是功夫的“武”啊,只不过是右下角多写了一撇。

关于输入法来说,这个字和武很像,就很合理地被辨认成了“武”。

可是,关于教师来说,这是学生写错了,要保存原字图画,让我知道他写错了。写对了,你蹦出来个字没问题,写错了你就别再把正确的字给出来了。

这个问题,咱们就解决不了。算法是人家的,人家怎样供给,咱们就怎样用。人家也不会由于咱们一家,去修改他们的程序。要是咱们的改好了,写错了不出字,那么你让其他人怎样办?还有人想着写一横就出来个“武”字,他们感觉这样便利。

这或许不是特例。

那是厚积薄发,投机需谨慎

通用数据练习出来的模型,在垂直范畴内运用时,往往会不够准确,或许偏重点有偏差。

因而说,职业数据很重要。

咱们看,其实AIGC各有不同,也是有所偏重的,分为了许多方向。他们各自坚守一方,并不是啥都干,啥都能干。

Adobe公司推出了一款叫Firefly的软件。它能使用AI,完成对话式修图。下面这个图,你输入“把景色换成冬季”,咔一下,夏天变成冬季了,还能变成带有雪花飘飘的视频。

我可能要给鼓吹AI的那些人,浇盆凉水了

有人看到这个新闻就慨叹了:“快看,人家很快都搭上AI的快车道了,咱们公司得追上才行!”

其实,他们或许不知道Adobe公司是1982年创办的,到现在也40多年了。咱们熟悉的Photoshop便是他家的产品。他们在图画的处理、规划、印刷等范畴,深耕了几十年。相似的功用,我从2018年就看见他们提过,仅仅作用不好。

他们不是搭上了AI才火的,相反,是他们搞火了AI。

再个举例,微软搞的那个Office365 Copilot。说一句话就能自动制作PPT。你输入“给我增加一张PPT,内容是关于再生资料的优点”,咔咔就自动蹦出来一张规划好的PPT。

我可能要给鼓吹AI的那些人,浇盆凉水了

那么,谁又知道,这一项功用背后的算法、算力和数据呢?得是微软近50年来的沉积吧。

我也听到过许多老板,乃至产品经理都说,他们说“管它爱啥啥的,都扔给ChatGPT,让它去自己想去,咱们喝茶”。

说这么多,我一直没有否定AI的快速开展和巨大作用。我能去研讨那么多AI渠道和结构,还写这么一篇千字长文,说明我并不是一个科技保守派,顽固派。

我仅仅想说,蹭热度要适当,要量力而为,兢兢业业才是成功之道,千万不能脑袋一热就陷进去了。

作为一个普通人,咱们能够使用AI让日子和工作愈加便利。现在来看,基本免费用,因而你也不必投入太多。咱们便是普通用户。对咱们来说,是四爷登基,仍是八爷当皇上,跟咱们关系不大,这家关了,咱们就再换一家。

作为一个中小企业,假如不是以AI为生的,或许时机也不是许多。只要大模型才有惊人的作用,可是你自己又练习不起。假如仅仅是调用人家的API,运用别人练习好的模型,那么你与其他千千万万都调用的,又有什么区别呢?中心竞赛点在哪里?或许便是开头一段时刻火,会吸引一些普通用户注册个会员。可是,假如投入太大,后面仍是得自谋生路。

关于大企业,尤其是大企业中有海量职业数据沉淀的,有财力的,还乐意搞研讨的,或许是一个时机。花个千八百万,或许会省去一些人工本钱,并且有时机完成集团的智能化转型。

没啥其他意思。便是感觉过火了,唠一唠,期望能降降温。身边有许多连linux和windows还分不清的朋友,都想着自己搭一个ChatGPT挣钱。赚啥钱?赚到了吗?或许最挣钱的仍是那些卖课的。

正如吴军博士说的,这有点像当年的淘金潮。咱们都传闻这里有一座金山,等着自己去挖,因而大批人涌来淘金。终究淘到金子的人很少,路边卖水的人却发财了。就连吴教师也去卖课了,由于卖课的确挣钱,需求量大。他提前提醒过咱们,也算是讲些武德。

这次AI在一个范畴内的打破,就如同是研讨出来一种能彻底治愈艾滋病的解药。却引得糖尿病人、老年痴呆等一众患者纷纷张狂抢购。或许他们也清楚,抢到了药并不意味着就能改动自己的命运。可是,间隔他们的解药成功研制出来,应该也不远了。