10月28-29日,第八届我国开源年会(COSCon’s23)在四川成都高新区菁蓉汇成功举行。作为开源范畴的年度盛会,本次以“开源:络绎不绝、山海相映”为主题,吸引了很多职业学者、技能专家、开源爱好者的一起到场,KaiwuDB CTO 魏可伟受邀于主论坛宣布《万物互联,探究新一代数据底座》主题讲演。

KaiwuDB CTO 魏可伟:万物互联,探究新一代数据底座

AI4DB—从数据中获取“常识”,提高数据活力

万物互联年代激发了数据使用的多样可能性,但一起也对数据办理这一课题提出更多诉求。在 IoT 场景下,数据的获取、交流和处理是中心,随着数据量的激增,数据的边际价值下降,为了从这些工业数据中获取价值,AI 与 IoT 的结合显得尤为重要。

在IoT范畴中,咱们一般会把“A”加在前面,构成咱们熟悉的 AIoT。究其原因,数据本身并不能为企业带来价值,但当经过不断学习,从数据中获取“常识”,数据才具有生命力。更重要的是,万物互联年代所带来的本钱和其所产生的收益,无法有效支撑企业构成良性发展,假如短少 AI 加持,整个职业发展或将受阻。

回归到用户本位,技能背面的关键在于咱们能否为用户供给卓有成效的解决方案。实际情况中,技能存在很多不可控的问题阻碍用户使用;前期贵重的基础设施投入,似乎也不是真的在帮用户降低本钱。

KaiwuDB CTO 魏可伟:万物互联,探究新一代数据底座

因而,KaiwuDB 在立足于技能、产品及职业需求的基础上,主张“化繁为简”,重视培养“原生 AI”才能,包括:智能生命周****期办理、降采样、智能预核算等功能,协助企业构建数据获取、数据交流、数据处理剖析的全链路才能,为终端用户供给发掘更多数据价值的解决方案,以满意用户的实际需求。

  • 智能生命周期办理

用以完成存储本钱与数据价值之间的需求匹配。以时序数据为例,存储本钱随着时刻的推移不断加大,因而如何进行数据生命周期的办理至关重要。

其间,紧缩是一种常用方法,但是紧缩会带来功能上的耗费,因而需求权衡新旧数据的需求,使用 AI 技能对时刻较长的数据进行紧缩以减小存储空间,近期的数据能够存储在较大的空间中,合理平衡存储本钱和数据的价值。

  • 降采样

即削减数据收集频率。面对海量数据的场景,此刻能够将高频率的数据收集降低为低频率,以削减存储本钱。选取方法能够是随机选择或其他方法,中心方针是在尽可能保存表明趋势和重要信息的一起,削减数据存储量和处理开支。

在数据办理中,为了保存有价值的数据部分,能够使用 AI 技能介入,进行数据特征提取和信息紧缩。例如 AI 能够依据使用需求剖析数据行为形式,协助用户选择更优的降采样战略,以保存具有代表性的数据。

  • 智能预核算

即经过剖析数据行为和查询形式,提前准备数据并优化聚合操作,从而提高查询功能。以时序数据场景为例,会以时刻维度进行数据的聚合剖析,这背面的一项关键技能便是智能预核算—即使用 AI 大脑预判用户会对哪些内容会做聚合剖析,提前把结果“常识”核算好。

这一才能可快速完成结果反馈,极大程度提高功能;在生命周期办理方面,也能够经过 AI 对用户使用情况做出预判,假如 AI 预判用户对某一类数据不再频频调用,能够自动挪到冷存储上,降低资源占用。

DB4AI—数据更活跃,用户低担负

在IoT 范畴有一些常见的算法,比方常见的时刻序列猜测、图像识别等,这些都是咱们在 AIoT 范畴中比较关心的话题;与此一起,咱们还需求解决数据库和 AI 两大生态分裂的问题,即如何完成从数据库里的数据产生的模型能够在数据库里用起来,一起避免让数据工程师、数据科学家们觉得有很多额外担负。

为此,KaiwuDB 供给了原生猜测剖析才能。咱们希望供给一个渠道,能够完成数据库和算法的紧密结合。比方,支撑数据库中的函数调用渠道上的模型练习、模型推理等才能。这样从数据库开发人员和办理人员的操作层面来看,他们相当于只在使用咱们数据库的一个根本才能,并不会产生额外担负。另一方面,咱们也可认为数据科学家敞开接口,让他们能够把练习出来的模型,放进数据库中。经过上述方法,能够把各类数据库相关人员紧密联系起来。

KaiwuDB CTO 魏可伟:万物互联,探究新一代数据底座

此外,咱们还供给一项生命周期办理引擎才能—Modelops in Database。举个比方:咱们的 AI 模型,它本身是有时效性的。比方,用去年的数据练习出来的模型,今年未必适用。这个时候谁能够第一时刻发现这个问题?应该是数据库。由于当咱们发现数据散布现已产生明显的变化的时候,能够推测出该模型的功能可能也将处于危险之中,这个也是 KaiwuDB 在做 DB For AI 的关键思路。

写在最终

KaiwuDB 作为一款多模数据库,一个很重要的中心是用一体化的方法、一致的接口供给给用户数据办理和处理的才能。 “大模型给咱们带来一个非常好的时机,让咱们真正地去完成一个完全不同的多模数据库” ,魏可伟表明。

就数据库而言,开源和立异一直是密不可分的。回忆整个数据库发展历程,立异至关重要,而开源是引领立异的重要途径。未来,KaiwuDB 将努力为各位同伴供给更敞开智能的数据库解决方案,后续咱们也会有开源方案,敬请我们期待!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。