今年以来,跟着ChatGPT持续展现出惊艳的表现,关于人工智能是否能代替某些作业岗位成了最抢手的社会论题之一。Business Insider 经过与各范畴专业人士对话,列出了最高危的 10 类作业清单,其间代表高技能工种之一的数据剖析师也名列其间。

这儿你或许会充溢好奇,ChatGPT所代表的LLM真有那么神吗?要深入的讨论这个问题,咱们首要需求了解LLM在数据剖析这个范畴究竟能有多能打?

*由 ChatGPT-4 充当数据剖析师
-
数据清洗和预处理:人工智能能够经过主动化的办法检测和处理数据中的异常值、缺失值和重复值。例如,运用机器学习算法能够主动辨认和填补缺失值,或许运用自然语言处理技能处理文本数据中的噪声和过错。
-
数据可视化:人工智能能够生成交互式和可视化的陈述和图表,以更好地出现数据剖析成果。例如,基于大数据的可视化东西和技能能够主动生成动态和多维度的图表,帮助用户更好地了解和探究数据。
-
主动化模型挑选和调优:人工智能能够经过主动化的办法挑选适宜的模型和算法,并进行参数调优。例如,运用主动机器学习(AutoML)技能能够主动挑选和优化机器学习模型,减少了人工进行模型挑选和调优的作业量。
-
主动化陈述生成:人工智能能够根据数据剖析的成果主动生成陈述和摘要。例如,运用自然语言生成(NLG)技能能够将数据剖析成果转化为自然语言文本,生成易于了解的陈述和摘要。
-
数据猜测和决议计划支撑:人工智能能够使用大数据和机器学习算法进行精确的数据猜测和决议计划支撑。例如,运用深度学习算法能够对大规划数据进行形式辨认和猜测,然后供给精确的猜测成果和决议计划主张。
-
…
甚至还有一些“好事”的研讨团队从不同的范畴随机挑选了 100 个问题,这些问题具有不同的图表类型和不同的难度等级。并请来了一位有两年经验的数据剖析师来跟 GPT-4 PK,从实际表现看,GPT-4 不只在数据和剖析的正确性上表现更好,而且往往能产生更多的成果。

看到这儿,你有可能会升起深深的危机感:怎么办,LLM真要代替人类数据剖析师吗?要失业了吗?
真的是这样吗?要回答这个问题,咱们需求从更高的层面来看问题,LLM和数据剖析师之间一定是彼此代替的关系吗?咱们有什么AI代替不了的优势吗?难道两者不能共生,并发挥出更大的效能吗?
LLM年代,数据剖析师面对的变和不变
进步意味着目标不断前移,阶段不断更新,它的视界总是不断改动的;——亚考利《改动莫测》

在LLM年代,人工智能在数据剖析和模型构建方面一定会的越来越出色,但人类专家现在依然是必不可少的,需求监督整个进程。
ChatGPT在构建计算模型时经常会出现过错(至少现在),并在做出决议计划时犯错。公司依然需求拿手数据剖析的职工来监督整个进程,保证模型被正确地引导,生成的成果符合企业或安排的实际情况。
数据剖析师依然需求履行一些使命,如需求搜集、调试和验证模型的输出,因而LLM无法创建完好的数据产品。
然而,公司在履行这些使命时将不再需求像曾经那样多的人员,LLM所带来的显著功率进步意味着团队规划能够缩小;
例如,公司能够只招聘2名数据剖析师来完结原本需求4名人员才干完结的作业。我信赖,初级数据剖析师岗位将首要遭到这一开展的影响,由于LLM在有经验的剖析师监督下现已能够担任他们的岗位。
咱们相比LLM的真实优势是什么?
如今,LLM正在改动数据运用的办法,还改动着数据剖析师在此进程中的角色。在 AI 遭到大肆宣传的背景下,咱们很简略疏忽人类考虑的一起性,特别是在数据剖析范畴。
LLM作为一门计算科学,它所做的事便是从前史的数据中找到一定的规则,并以此来确定当下自己面对的事应该怎么去做,它的决议计划根底是数据,是概率。因而对于许多重复性的作业,人工智能能够很快的学会。经过咱们过往的一些操作数据,人工智能能够快速学习,然后把握这个技能。 就比方说之前百科词条里边的数据搜集,整理,这些能够说都是一些内容相对固定,切重复性高的作业,人工智能能够轻松学会。包括咱们的一些简略的剖析,比方趋势剖析展现,简略的数据陈述等都能够被LLM代替。
不过,LLM终究和人类是有区别的。人是有情感和思想的,而机器没有(起码现在没有)。因而想要在人工智能手下不被代替,咱们的作业重心应该是向“人”挨近的。我个人以为,不会被代替的有以几点:
1.对事务的全方位了解才能
尽管LLM有潜力为客户行为和新式趋势供给有用的见地,但在某些事情上,人类能够比机器做得更好。例如,剖析客户反馈和对目标细分商场进行研讨,需求更详细地了解人们的需求和行为,以及有人类才具备的杂乱处理问题的技能。l当数据出现大幅度下降时,一定是有原因的,而这个原因是由咱们的事务改动引起的,这个时分相关的东西就多了,可能是竞品的上线,广告战略的调整或许说某个社会热点事件的产生等等。这些内部或外部要素的产生才引起了数据的改动,只要深入了解咱们的事务,咱们才干在这多个要素之间快速定位到问题的根本原因,并产出处理的方案,为企业的下一步动作进行决议计划支撑。在这一点上,现在的人工智能仍是无法学习的,由于它所触及的要素太多,随机性太强,它需求人的考虑与判断。

2.对人道的深入感知
不管什么职业,咱们都是在为特定用户进行服务的,这些用户都是活生生的人,有情感,有欲望、喜怒哀乐。当咱们企业的数据产生改动时,咱们反思事务上的原因,更应该考虑的是用户为什么会产生这样的行为,用户的情感产生了哪些改动。人有七情六欲,用户的每一个行为,都是其内心活动改动的表现。在人道这一点上,我信赖LLM在可见的未来仍是无法超越人类的,这也是咱们最大的优势。
3.立异和问题处理才能
人类具备立异思维和问题处理才能,能够应对杂乱和未知的情况。咱们能够从不同的角度考虑问题,提出从未有过的办法和技能,并灵活应用东西和技能来处理特定的数据剖析挑战。这种立异才能是人工智能现在还无法完全代替的。例如,在新式范畴或杂乱问题的数据剖析中,人类数据剖析师能够运用发明性的思维和灵活性来开辟新的剖析办法。
共生——与其和轿车赛跑,不如学会驾驭轿车
全球品牌SwagMagic生产商、零售商和分销商SwagMagic联合创始人兼首席履行官Shaunak Amin表明:“生成式人工智能消除了对客户需求的猜测,节省了用于一遍又一遍地处理类似问题的时刻和资源。”经过这种办法,数据剖析师和支撑团队能够一起尽力,为个人客户发明高度个性化、即时和轻松的体会。”阿明以为,这些类型的体会有助于发明更忠实的客户。“因而,职工将LLM视为一种有用的东西,而不是对他们作业的要挟,这一点至关重要。”
所以,与其白费的轿车赛跑,不如学会驾驭轿车。咱们应该尽力将LLM当成生产力进步的东西,去寻求共生,以取得1+1>2的作用:
互补协作
人工智能和人类数据剖析师能够相互弥补,发挥各自的优势。人工智能能够处理大规划数据、进行主动化剖析和形式辨认,供给快速的洞悉和猜测模型。而人类数据剖析师则能够应用范畴常识、提出关键问题、解说数据成果,并进行故事叙述和决议计划支撑。经过协作,能够将人工智能的高效性与人类数据剖析师的专业性和判断力相结合,取得更好的成果。现在在金融范畴中,现已有出资公司运用这种形式,他们使用LLM剖析大量的买卖数据,发现潜在的商场趋势和买卖信号。然后,人类数据剖析师能够结合自己的专业常识和判断力,对这些趋势进行解说和评价,并提出相应的出资战略。这种协作能够进步买卖决议计划的精确性和功率。
但这么做的条件是什么?便是咱们需求深度了解公司运营和客户需求,那么咱们就处于一个一起的方位,能够发现增强公司或安排才能的时机。你不能再想着单纯成为办理excel表的那个人,或许只是被迫的去做绩效报表。这些作业很简略被主动化代替,在LLM年代将首要消失。
数据质量办理
人工智能在处理数据时高效而精确,但对于数据的质量和精确性依然需求人类数据剖析师的监督和办理。人类数据剖析师能够担任数据的搜集、清洗和预处理,保证数据的精确性和一致性。咱们能够辨认和修复数据中的过错和缺失值,并规划质量操控流程来保证数据的可靠性。这样能够为人工智能供给高质量的数据根底,然后进步其剖析和猜测的精确性。比方,在医疗研讨中,人类数据剖析师能够担任搜集和整理临床试验数据,保证数据的精确性和完好性。然后,人工智能能够使用这些数据进行形式辨认和猜测剖析,帮助研讨人员发现新的治疗办法或疾病风险要素。
总而言之,人工智能和人类数据剖析师能够经过互补协作、数据质量办理等办法完成共生。经过充分发挥各自的优势,能够取得1+1>2的作用,进步数据剖析的精确性、功率和决议计划支撑才能。
LLM 年代,对数据剖析更多的考虑
展望未来,以下是数据剖析师职业最有可能出现的一些未来趋势,只要顺应这些趋势,咱们才可能会获得更好的生长:

考虑1:主动化和智能化
跟着人工智能和主动化技能的不断开展,数据剖析师职业将愈加智能化和主动化。人工智能算法将能够主动进行数据清洗、特征挑选、模型训练和猜测剖析等使命,减少人工干预的需求。数据剖析师能够更专心于问题定义、成果解说和提出决议计划支撑等高层次的作业。
考虑2:大数据和实时剖析
跟着数据的不断增长和获取途径的多样化,数据剖析师将面对处理大规划数据和实时数据剖析的挑战。数据剖析师需求把握大数据处理技能和实时剖析东西,并借助LLM快速提取有价值的信息,并及时做出决议计划;
考虑3:高档数据可视化和交互性
数据可视化将变得愈加高档和交互性。数据剖析师需求借助LLM,以更生动、直观的办法出现数据洞悉,并供给用户友爱的交互功用,运用户能够自主探究数据和发现新的洞悉;
考虑4:跨学科协作
数据剖析师将更多地与其他范畴的专业人士进行跨学科协作。数据剖析师需求与事务专家、范畴专家和技能专家等进行严密协作,一起处理杂乱问题和完成事务目标。跨学科协作将促进常识交流和立异,进步数据剖析的综合才能。这一点现在LLM是做不到的,也是咱们的优势;
考虑5:解说性和可解说性:
跟着LLM的广泛应用,数据剖析师将愈加注重模型的解说性和可解说性。他们需求能够解说模型的决议计划进程、特征重要性和猜测成果,以便事务团队和决议计划者能够了解和信赖模型的成果。简略来说,你要让事务团队和决议计划者了解LLM生成的成果是正确的仍是存在偏差的。
考虑6:持续学习和开展:
数据剖析师需求不断学习和开展自己的技能,跟上技能和职业的开展趋势。他们需求关注新的数据剖析东西、算法和办法,特别需求深入了解事务和用户,并不断进步自己的专业素养和范畴常识。
总之,在 LLM 年代,未来的 数据剖析师 职业将愈加智能化、主动化。 大模型 的广泛应用,或许意味着许多人将失掉作业,但 OpenAI 首席履行官 Sam Altman 以为这也将是个找到更好作业的时机:「咱们能够拥有更高的生活质量。同时,人们需求时刻来更新、做出反应、习气这项新技能。」