每分钟54万多条数据更新，商品系统性能如何优化？

作者 Dmall Talker朱雪刚多点Dmall-OS研发部

背景介绍

2020年6月，商品系统从SAP、中间层等接入的商品数据越来越多且更新频繁，商品数据库主从更新数据量大，约每分钟54application万多条更apple新，约八分钟就会产生大于1G的Binlog文件，在数据库IO能力一定的情况下，发生数据同步延迟，影响写入与读出的及时性，进而影响到商品基础系统的可用性。

如果仅是从翻阅代码缓存视频合并app下载的角度去分析，会花费大量人力。抛开系统本身，当商品多个应用都在读写商品库，并在数据库层起到数据appreciate汇总和集中反馈的情况下，分析这个点是一个较好的方向。

分析模型

把B大数据专业学什么inlog解析成Sql 纯文本，解析出来的Sql文本样例如下：

观察解析出来的文本，判断是否是有效更新，关键在于找到实际更新的是哪些字段。缓存视频怎样转入相册即: WHERE块中和SET块中哪些字段上有值的更新。

通过对缓存文件夹名称比发现：

实际只更新了第 7 和 8 号的时间字段，如果没有刷新其他值，只是刷新了时间，估计这条更新语句没什么意义；又，商品系统接收到下发数据时，估计是我们拿到了数据后，直接用 modified=now()产生了update语句，这样时间有变化，必然产生Binlog。

基于以上逻辑，只要能分析出一条update语句中，哪些字段更新了，这些更新字段本身对业务是否有意义，来判断是否应该产生Binlo大数据技术与应用g。希望分析出的appear结果模型如下：

通过分析表X中，字段组合 以及相应的 更新次数，可以得出：

1. 更新的 字段组合 判断出是否是有效更新；缓存视频变成本地视频

2. 相应的 更新次数 反映出有效和无效缓存视频怎样转入本地视频更新的条数、占比程度等；

组合统计

由于Binlog对应的文本量大，通过脚本把每条 Insert 、Delete、Update语句切到单独的文件中。然后计算每个文件中的S数据库是什么ql 里的字段差异并做归集。流程如下:

统计每张表的每个字段单独更新是否有效：1表示单独更新有效，0表示单独更新无效，如以下统计样例表:

根据以上统计表，计算每种更新语句的“更新是否有效表达式”，计算方法为：

每种更新语句的更新字段组合的单独更新是否有效的数值做加法。

如果更新字段组合中，所有字段的单独更新是否有效的值为0，则加起来的和等于0；

只要更新字段组合中，某一字段的单独更新是否有效的值为1，则加起来的和大于0；

根据 “更新是否有效表达式”缓存视频合并的和是否大于0 得出对应的更新语句是否是有效的更新。

以商品库表以及字段为例，判断更新语句是否有效，统计表参考缓存视频怎样转入相册如下：

根据以上统计表，无效更新的占比为：su缓存视频变成本地视频m(无效更新=0的更新量)/sum(更新量)。结果模型举例如下图：

这样为分析提供：定性与定量缓存文件夹名称的基础，并且知道后续优化的预期效果缓存视频怎样转入本地视频。商品系统经过优化，减少了90%以上的无效更新，并且减少了下游系统订阅商品Binlog的数据更新压力。

代码排查

初步分析是我们拿到数据后，在SqlMapper文件中: 时间字段=now()，触发了apple苹果官网实际更新产生binl大数据是什么意思og，根据实际情况修改排查，确认是否对下游系统有影响，如大数据抽数等情况做优化。

商缓存的视频怎么保存到本地品系统初步的修改方法为：

1.建表时，建议按appointment照以下格式设计：

create_time dateappeartime NOT N数据库系统ULL DEFAULT CURRENT_T缓存视频怎样转入相册IMESTAMP;

update_time datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP;

这样做的好处是:Insert时，created字段不需要设置；update时，modi数据库管理系统fied字数据库系统工程师段不需要设缓存视频怎样转入相册置，让业务代码更纯粹，同时也不用担心数仓拉数据的时候没更新时间；

2. 语句中，update * set * where * ，如果set 块中没有更新数据，set 和 where 直接连在一起，Sql语法会错误，在set 里面加上where 块中的条件字段，如id=#id数据库技术#, 这样让 Sql 语句语法正确。另外也遵循如果没有实际的数据数据库技术更新，不会产生binlog的规律；

其他引申

用以上的结果模型，清晰地展示出一个库的更新情况，不仅能判断出Sql语句是否是有效更新，也能appointment反馈以下些情况：

1. 数据库设计是否合理，比如在分析我们公司的X数据库设计X系统的数据库后，结论是：更大数据行程码新都是有效更新，但更新量最大的一张表有98个字段，且更新量最大的部分，只更新了表的 yn字段，由Binlog解析出来的纯文本可知，即使只更新yn字段，也会在SET和WHERE块中带上这98个字段，合计约200多行的更新语句，也触发了大量Binlog文件产生；后面缓存文件夹名称计划通过拆分表字段，通过归类数据字段、状态字段等方式来解决。

2. 给缓存数据提供定量依据，比如频繁更新字段，是否能用缓存的启发等；

3. 给系统负责同学提供数据库更新字段维度的透视，知道数据库实际数据库原理及应用更新了哪些字段，有无必要，还可以做哪些优化启发等；

以上通用的分析方法，特别适合于数据库更新量大的系统，以及通用的脚本分析工具快速出分析结果。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

每分钟54万多条数据更新，商品系统性能如何优化？

背景介绍

分析模型

组合统计

代码排查

其他引申

评论(0)

提示：请文明发言取消回复

近期文章

近期评论

每分钟54万多条数据更新，商品系统性能如何优化？

背景介绍

分析模型

组合统计

代码排查

其他引申

评论(0)

提示：请文明发言 取消回复

近期文章

近期评论

提示：请文明发言取消回复