内容一览: 近年来,全球气候变化形势严峻,由此引发的蝴蝶效应,正深刻地影响着人类和大自然。在这一布景下,搜集数百乃至数千公里规模内开花模式的数据,了解气候变化如何对开花植物发生影响,成为近年来生态研讨的重要课题之一。但传统的办法通常需要耗费很多经费,且需要较长的时刻进行采样查询,后勤保障作业也面临着重重困难。而近期发布在《Flora》期刊上的研讨,不仅克服了这些问题,一起还提醒出前所未有的细节。

关键词: 时空剖析 才智生态学 SNS 数据

本文首发自 HyperAI 超神经微信大众渠道~

樱花作为日本的国花,在大和文明中有着重要的位置。赏花(Hanami,花见),作为极具特征的民间习俗,已有了数百年的历史。然而日本纵跨纬度约 20 度,全国可分为 6 个气候区,各地气候差异显着, 因而樱花绽放的时刻也各有不同。每值樱花时节,日本的旅行网站也会详细展现各地开花状况,供游客安排赏花时刻。近年来,遭到气候变化的影响,日本樱花的敞开时刻也在不断提早。

为了探究日本樱花的开花模式,了解气候变化对物候学的影响,澳大利亚莫纳什大学的研讨团队,运用 Python API 与*计算机视觉 API,经过社交网站 (SNS) 数据来监测日本的樱花敞开状况,并对试验成果与现实状况进行了比照验证。现在该研讨已宣布在《Flora》期刊,标题为「The spatiotemporal signature of cherry blossom flowering across Japan revealed via analysis of social network site images」。

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

该研讨成果已宣布于《Flora》期刊

论文地址:

www.sciencedirect.com/science/art…

试验进程:数据集的爬取、过滤及剖析

数据集

本次试验搜集樱花敞开数据的进程能够分为两个过程:

1. 从社交网站提取图片数据,包括几个不同的接连阶段

2. 运用计算机视觉 API 及人工核验的办法,对数据进行相关性过滤

考虑到 API 需要一起对时刻、空间、文本进行过滤,研讨人员挑选了 Flickr 作为数据源。首要,运用 Python API 客户端,经过查找关键词「cherry blossom」,在 Flickr 上搜集带有地理坐标的相关图片。

其次,设置 Bounding Box 为 31.186N-46.178N, 129.173E-145.859E,以确保图片是在日本拍照。 时刻规模设定为 2008 年- 2018 年,以排除 COVID-19 导致的全球旅行业下降对数据的影响。

然后,研讨人员凭借从 gadm.org 获取的日本地理边界进行遮罩处理,然后过滤这些数据,终究获得 80,915 张图片。

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

2008 年 1 月 1 日至 2018 年 12 月 31 日

Flickr 上查找定位在日本的「cherry blossom」图片

1、2 月份(蓝色) 表明春季来临前的樱花初放;

3-5 月份(绿色) 表明记载春季首要樱花怒放期的拍照数据会集度;

10-12 月份(粉色) 则表明晰在秋季尤其 11 月到达高峰的风趣现象。

虽然 Flickr 的图片经过查找关键词「cherry blossom」进行了约束,但 SNS 内容仍然可能会与查找词错误关联,因而需要验证。

对此,研讨人员将一切图片提交至 Google Cloud Vision AI, 该 API 能够依据每张图画的视觉内容,为其生成了描述性文本标签,然后对单个数据点相关性,主动进行 double-check。

Google Cloud Vision AI 运用预先训练好的机器学习模型,在预定义类别中为图画分配标签。此外,研讨人员还对样本数据进行了额外的手动核对,如下表所示:

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

表 1:Tokyo-filtered 数据会集,各阶段的图画数据

B 列: 在 Flickr 查找「cherry blossom」回来 28,875 张图片,这些图片地理坐标都坐落东京区域的行政区域内

C 列: 计算机视觉 API 为此数据集回来的文本标签及其相对频率。从文本标签过滤器回来的图画中,有 21,908 张被计算机视觉 API 标记为「cherry blossom」,但由于部分图画也被标记为「autumn」或「maple tree」,因而被剔除后,终究得到 21,633 张图画

D 列: 成果图画随机选出用于人工查看的样本

E 列: 经人工查看确认为樱花的图画数量

F 列: 每月主动处理办法(计算机视觉和标签剖析)的预估精度,计算办法为 E/D

G 列: 运用该精度,计算 2、3、4 月总共拍照到的樱花图片数量,计算办法为 C*F

评价办法

为了估量樱花的怒放日期,研讨人员为数据会集的一切图画生成了以天为单位的时刻序列,然后用 7-day width 的三角移动平均指标 (triangular rolling average) 进行处理,中心点赋 unity weight,其两边紧邻的点赋 0.75 的权重* ,接下来最接近的点分别赋 0.5 和 0.25 的权重,以此来平整由周末(休闲时刻,拍照活动显着增加)和作业日赏花人数不同而带来的拍照行为 (Photographic activity) 波动。

得出的图表中所显现的拍照行为波峰,被确定为是樱花怒放的全盛期(mankai)。

比照验证:猜测成果与实际数据共同

日本对樱花怒放现象的记载最早可追溯到公元 812 年,自 1953 年起开端有了官方正式的观测记载。为了验证团队的剖析办法,试验团队挑选了东京和京都两座热门赏花城市的数据,并与日本气候公司 (JMC)、日本国家旅行安排 (JNTO) 每年发布的樱花全面怒放日期进行比照,计算出试验所得峰值日与官方发布日期之间的差错

经过试验,研讨团队得出了日本全国樱花敞开的可视化时空数据,1 月下旬 (wks 3-4) 至 5 月下旬 (wks 3-4),樱花敞开首要从南部气候温暖的区域逐步向北方推进,最终由南向北逐步退缩。如图所示:

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

图 2: 2008-2018 年日本樱花拍照地址,

每张图的周期对应两周

A-C: 樱花图片出现在日本南部较温暖的区域,图片高度会集出现在本州岛的东京与京都的城市中心

D-F: 樱花图片增加,开端向本州岛北部延伸

G-I: 樱花位置向北扩展,出现在北海道札幌,东京和京都拍照行为仍然活泼,北海道和本州岛北部,樱花拍照行为愈加会集。最终,全国规模内的樱花相片逐步削减,由南到北退去。

试验团队将经过处理的东京与京都区域樱花活动拍照日时刻序列的峰值,与 JMC/JNTO 所发布的日期进行了比较验证。成果显现东京区域的均方根差错为 3.21 日,京都区域为 3.32 日。 如下图:

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

图 3:东京区域二者评价的日期比照

左栏:经过本试验办法所估量的历年东京樱花全盛日期

中栏:JNTO 历年报导的东京樱花全盛日期

右栏:差错,即二者相差天数

爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征

图 4:京都区域二者评价的日期比照

左栏:经过本试验办法所估量的历年京都樱花全盛日期

中栏:JNTO 历年报导的京都樱花全盛日期

右栏:差错,即二者相差天数

在试验团队的数据中,还提醒出了樱花在秋季敞开的现象。这在 JNTO 所发布的数据中并没有正式指出,体现出了 SNS 数据有才能解析小概率事件,提醒反常的物候学现象, 如非时节性敞开时刻,这关于评价一年四季乃至意外状况下可供获取的花粉花蜜等芳香资源极其重要。

SNS 数据:为生态研讨供给新洞见

世界气候安排本年 4 月发布的一篇文章显现,2022 年的全球平均温度比 1850-1900 年的平均值高出了 1.15℃,人类对气候变化的感知较为迟滞,植物则格外敏感。在全球气候变暖的影响下,不仅是日本樱花,我国多地的开花植物也遭到了影响。

依据武汉大学樱花观测数据,从上世纪 60 时代开端,武汉大学樱花的始花期显着提早,2000 年之后更是不断突破记载,一度由 3 月下旬提早至 2 月下旬。

20 世纪 90 时代前,山东菏泽的牡丹开花时刻首要会集在 4 月下旬,2010 年前后提早到 4 月中旬,近几年更是在 4 月上旬便可观测到花开。

油菜开花的时刻也相同有了明显提早的趋势,江西婺源油菜花本年 2 月 22 日就见花了,3 月 13 日进入开花盛期,而在 30 年前,油菜花开花时刻一般在 3 月中旬。

Kepios 发布的一份陈述显现,截止 2023 年 4 月,全球社交媒体用户数量到达 48 亿,占全球总人口的 59.9%,平均每人每天花费 2 小时 24 分钟运用社交媒体使用,发生海量社交网络数据,有望为生态研讨供给新洞见。

作者在本论文中提出的 SNS 剖析技术,能够添补揭露数据中缺失的部分,协助科研人员了解气候变化关于开花植物发生的不同程度的影响,对了解蜜蜂、昆虫等重要传粉者的行为具有积极意义。

参考文章:

[1]www.sciencedirect.com/science/art…

[2]link.springer.com/chapter/10.…

[3]sh.cma.gov.cn/sh/qxkp/qhb…

[4]datareportal.com/social-medi…

本文首发自 HyperAI 超神经微信大众渠道~