持续创作,加快成长!这是我参加「日新计划 10 月更文应战」的第19天,点击检查活动详情

摘要

依据 Wi-Fi 的人群监控经过移动设备播送的 WiFi 勘探恳求来感知人群。这些勘探恳求包含仅有标识设备(例如 MAC 地址)以及或许是携带设备的人的有价值信息。这种危险代表了严峻的隐私问题,移动设备和操作体系制造商针对它的首要对策是MAC地址随机化。跟着通用数据维护条例 (GDPR) 的引入,许多人群监控体系因为存储的隐私敏感信息而被封闭。因而,有必要在考虑人们隐私的状况下开发新的人群监控体系。这样的体系运用各种办法在搜集到的数据被存储之前对其进行匿名化,一起供给从匿名化数据中获取核算计数的办法。这项研讨的重点是 MAC 地址随机化对新一代依据 Wi-Fi 的人群监控体系的影响,该体系发生的仅有输出是人群核算计数。首先,剖析MAC地址随机化的各种特征怎么影响人群监控的核算计数。然后,咱们完结了一个用于处理随机 MAC 地址的模块,并评价它能够在多大程度上削减它们对核算计数的影响。

附加关键词和短语:MAC 地址随机化、人群监控、Wi-Fi、匿名化、客流量

1 简介

近年来,跟着智能移动设备的日益遍及,依据 Wi-Fi 和蓝牙的人群监控体系已成为生成有关人群行为洞察力的标准做法。例如,估量某个方位的人数或人群在给定空间中的移动方式被证明关于剖析大众事情 [2] 或公共交通中的出行形式 [4] 十分有用。人群监控体系运用挨近传感器的人们的移动设备播送的无线电信号。此类无线电信号(也称为“勘探恳求”)包含隐私敏感数据,即设备的 MAC 地址,它答应任何人仅有辨认和盯梢移动设备及其携带者,然后侵略了他们的隐私。因为如此严峻的隐私侵略,现已引入了几种办法和法规来确保人们的安全。

2014 年,操作体系和移动设备制造商引入了 MAC 地址随机化,以使移动设备在播送处于非关联状况的勘探恳求时坚持匿名。这种机制将设备的实在 MAC 地址替换为周期性改变的随机地址。假如布置正确,辨认或盯梢设备将变得愈加困难,尤其是在拥堵的环境中,然后为个人隐私供给更好的维护。不幸的是,没有清晰定义的标准来施行这种随机化进程导致制造商开发独自的进程来随机化 MAC 地址。正因为如此,MAC地址随机化的不同行为和不一致在实践中呈现了。在前期,Martin 等人[8] 标明市场上的一些设备根本没有运用 MAC 地址随机化。运用随机化的那些依然简单遭到攻击或依据作为播送勘探恳求的一部分的其他字段的指纹辨认办法,然后答应窃听者盯梢和辨认移动设备。因为近年来对这个问题的知道不断进步,制造商改进了他们的随机化进程,这对用户的隐私发生了积极的影响 [7] [15]。但是,这些改进并没有使设备指纹辨认成为不或许。这种指纹辨认办法曩昔已被用于人群监控 [14] [13] [10],它们依然有或许对新一代人群监控体系的核算计数发生积极影响。

为了进一步标准人们数据的运用方式,现已引入了各种规矩,例如通用数据维护条例 (GDPR) [1]。因而,许多依据 Wi-Fi 的人群监控体系因为严峻侵略了人们的隐私而被封闭。这导致了新的人群监控体系的开发,该体系实在匿名了被感知的移动设备的信息,一起坚持体系给出的估量的高精度 [12] [11]。此类体系的首要思想是仅供给有关被感测数据的核算计数,而不存储任何或许追溯到特定移动设备或个人的隐私敏感数据或成果。此类核算计数的示例包含客流量,即某个方位存在的人群规模,以及人群流量,即在多个方位之间游览的人流的规模。为了完结这一点,运用了几种数据结构、加密技能和匿名办法来躲藏正在感知的实践数据,一起使体系能够对匿名数据履行核算计数。

这些最先进的体系在人群监控中更广泛地重视个人隐私,这些体系具有某些特殊性,严峻约束了对捕获数据的拜访。其间一些特殊性是:在有限的时刻内捕获数据而不脱离传感器,一旦传感期完毕就丢掉这些数据,以及加密只要受信赖的第三方才干拜访的任何输出。因而,运用 MAC 地址随机化的指纹辨认设备变得愈加困难。因而,本研讨的重点是剖析 MAC 地址随机化对新一代依据 Wi-Fi 的人群监控体系发生的核算计数的影响。此外,咱们完结了一个依据时刻和信息元素(IE)指纹处理随机 MAC 地址的模块,并进行试验以评价这种处理在多大程度上能够削减随机 MAC 地址对核算计数的影响。咱们的成果标明,虽然对感知数据的拜访遭到约束,但这种指纹能够明显下降人流量估量的差错。

这项研讨能够分为两个方针。 方针 1:清楚了解不同 MAC 地址随机化计划怎么影响依据 Wi-Fi 的人群监控体系的核算计数 方针 2:了解怎么处理随机 MAC 地址以协助削减它们对核算计数的影响 为了完结这些方针,以下研讨问题将是 回答: • RQ1:不同的MAC 地址随机化计划怎么影响依据隐私维护的Wi-Fi 人群监控的计数进程? • RQ2:依据 Wi-Fi 的人群监控体系怎么决定随机化 MAC 地址运用何种随机化计划? • RQ3:了解MAC 地址随机化计划在多大程度上能够对核算计数发生积极影响?

本文的其余部分的结构如下。第 2 节介绍了一些与 Wi-Fi 人群监控的匿名技能和 MAC 地址随机化处理相关的作业。然后,在第 3 节中,咱们将评论与 MAC 地址随机化相关的一些最重要的因素怎么影响行人数量。第 4 节描绘了处理随机 MAC 地址的体系模型。接下来是第 5 节,详细介绍了为回答研讨问题而进行的两个试验。试验成果在第 6 节中介绍和评论,研讨在第 7 节完毕。

2 相关作业

假如未正确匿名,则利用移动设备播送的勘探恳求中的数据进行人群监控会对个人隐私构成严重危险。在 2020 年和 2021 年,Stanciu 等人。 [12] [11] 提出了一种依据 Wi-Fi 的人群监控体系,该体系运用 epoch,即传感根底设施搜集勘探恳求的固定周期,供给行人动态的核算计数作为其仅有输出。这些论文专心于在这样的体系中运用的办法,用于对被感知的人的身份进行匿名化。

第一个提出的办法利用了 k-匿名准则,一起处理了这些准则的一些缺点。该体系经过化名化、截断和更正操作来确保被感测移动设备的 MAC 地址匿名性,而不会对核算计数发生负面影响。第二种办法在传感器节点运用依据布隆过滤器和同态加密的匿名化进程,在数据发送到其他任何当地之前躲藏被感测设备的实践标识符。搜集的信息是匿名的,以答应体系在加密的状况下得出核算计数,就像数据一开始没有匿名一样。

虽然这些论文的研讨人员意识到 MAC 地址随机化,但他们并未在作业中处理它,这或许会导致潜在的问题,例如多计客流量和少计人群流量。当设备在同一个传感器邻近多次更改其 MAC 地址时,或许会发生过多的人流量,使体系以为它在只要一个设备时感知到多个设备。当设备将其 MAC 地址从一个传感器更改为另一个传感器时,或许会轻视人群流量。体系会在一个传感器上感应设备,当个人移动到另一个传感器邻近时,体系会感应到同一个设备,但会以为它不同,不会将其计入人群。

为了克服 MAC 地址随机化对人群剖析的负面影响,许多人群监控处理计划专心于经过各种技能将勘探恳求链接到源设备。

Espresso [13] 展现了这种处理计划怎么利用勘探恳求中存在的信息元素、序列号和接收信号强度指示符来估量将勘探恳求与源设备相关联的概率。 Espresso 与 [12] 和 [11] 提出的体系之间的首要差异在于,Espresso 在搜集勘探恳求时没有清晰运用 epochs,它将感知到的数据发送到中心服务器而不彻底匿名,它运用了其间的一些不断练习体系的数据。此外,Espresso 运用概率模型,该模型有必要在 24 小时窗口内搜集的数据上进行练习,然后才干用于体系评价。此外,研讨人员只重视人群的脚步,而不重视人群活动。

Aforos [14] 是另一个类似的人群监控体系,它为每个勘探恳求生成指纹,不只依据 MAC 地址,还依据信息元素。然后,将具有相同指纹的勘探恳求分组并链接到单个设备。与 Espresso 的状况一样,Aforos 因为运用了化名,并没有彻底匿名化感应设备的数据,它只重视客流量。此外,他们的办法需求调整以进步其精确性,而且体系的估量是依据在三个小时的窗口中搜集的数据。此外,与 [12] 和 [11] 中运用多个传感器的体系比较,他们的传感根底设施仅由一个传感器组成。

3 MAC地址随机化对行人计数的影响

将感知数据彻底匿名化的人群监控体系在数据搜集和处理方面遵循一套严格的规矩。首先,数据是分时代感知的。一个时期被定义为体系传感器搜集来自邻近设备的勘探恳求的固定时刻段。一旦一个纪元完毕,传感器就会依据从勘探恳求中提取的 MAC 地址核算所需的计数,然后它们会丢掉在该纪元期间感测到的一切数据。最后,成果计数被加密并发送到中心服务器。出于咱们的目的,咱们区别两种类型的计数: (1) 客流量:在特定时刻段内呈现在一个当地的人数 (2) 人群流量:从一个当地到另一个当地的人数

在这种人群监控体系的背景下,虽然与 MAC 地址随机化没有直接关系,但咱们确定对核算计数影响最大的设备特性是突发抵达时刻 (IBAT)。大多数设备经过不同的 Wi-Fi 通道 [3] 以最多 500 毫秒的极短突发传输勘探恳求。突发间抵达时刻 (IBAT) 定义为来自同一设备的两次接连的勘探恳求突发之间的抵达时刻差。之前现已标明,不论 MAC 地址随机化怎么,设备的 IBAT 都坚持不变 [3]。因而,检查这个特性能够协助咱们更好地了解同一设备播送的随机 MAC 地址的频率。

此外,Martin 等人在 [8] 中发现,运用 MAC 地址随机化的移动设备会在更改随机 MAC 地址之前将其保留至少一次突发。因而,影响行人数量的另一个根本特征是设备 MAC 地址两次更改之间的时刻或随机 MAC 地址寿数。

咱们持续依据人群监控体系的时刻特性剖析这两个设备属性,即一个时期的长度。

3.1 剖析

咱们区别了这些参数的六种装备,如图 3 附录 B 所示。共有八种装备或许。 可是,关于场景 a 和 d,随机 MAC 地址生存期的巨细无关紧要。

在状况 a 中,咱们有一个相对较大的迸发间抵达时刻和一个较长的历元。 咱们调查到,不论随机 MAC 地址的生命周期怎么,每个 epoch 都会有一个具有不同 MAC 地址的突发传输。 这不会影响客流量的计数,因为源设备在每个 epoch 只发送一个脉冲串,该脉冲串被计数一次。 可是,这会影响人群流的计数,因为任何两个接连的突发具有不同的 MAC 地址,这会导致体系将它们视为来自不同的设备。

事例 b 描绘了 IBAT 很短,但随机 MAC 地址寿数和历元很长的场景。咱们看到在同一时期捕获了多个具有相同 MAC 地址的突发。与第一种状况一样,人流量的计数不受影响,因为 MAC 地址只核算一次,但人群流量的计数遭到影响,因为 MAC 地址在不一起期之间发生改变。

关于事例 c,咱们有一个短 IBAT、一个短随机 MAC 地址生命周期和一个长时期。此装备导致源设备在每个时期传输具有不同 MAC 地址的多个突发。因而,体系将一切 MAC 地址视为不同的设备,然后导致高估人流量和轻视人流。

在状况 d 中,咱们考虑一个长 IBAT 和一个短时期。不论随机 MAC 地址的生命周期怎么,咱们注意到假如时期太短,传感根底设施或许无法在某些时期检测到源设备的存在,这会导致对该时期的客流量和人群流量计数不足.可是,虽然 MAC 地址随机化,还是会呈现此问题,因为它是由体系无法控制的外部因素引起的。

运用较短的 epoch 长度和较短的 IBAT 但随机 MAC 地址的寿数较长,事例 e 标明源设备能够在每个 epoch 传输一个突发,在几个接连的 epoch 中坚持相同的 MAC 地址。因而,在这种状况下,客流量不会遭到影响。可是,当设备更改其 MAC 地址时,体系每两个接连 epoch 都会轻视人群流量。

最后,关于事例 f,咱们有一个较短的 IBAT、一个较短的随机 MAC 地址生命周期和一个较短的 epoch。咱们调查到源设备能够在每个时期传输一个突发,但具有不同的 MAC 地址。因而,体系能够正确核算客流量,但因为同一设备在每个时期的 MAC 地址不同,因而轻视了人流。

上述场景是最重要形式的简化版本,有助于了解对核算计数的影响。实践上,有或许遇到不同的边际状况。例如,在任何上述状况下,勘探恳求的突发能够在两个时期之间拆分,因而,设备在两个时期期间都被感应到。可是,依据形式,这种边际状况仍将归于上述状况之一。

此外,仍有许多外部因素或许会影响人群监控体系的核算数量。例如,2015 年,Julien Freudiger 在 [6] 中展现了移动设备的不同装备怎么影响播送勘探恳求的数量以及勘探频率。不论 MAC 地址随机化怎么,这都会对任何依据 Wi-Fi 的人群监控体系发生直接影响,因为假如勘探恳求频率下降,传感根底设施或许无法检测到范围内的移动设备。

鉴于此概述,出于几个原因,咱们提出了一个处理事例 c 的体系模型。 首先,这种状况对核算计数的影响最大,因为在一个时期内来自同一设备的大量随机 MAC 地址。 依据感测设备的 IBAT 有多短,客流量或许会被大大高估。 其次,运用满意长的 epoch 答应体系搜集满意的数据,这些数据能够供给满意的洞察力来减轻随机 MAC 地址的影响。

4 体系模型

人群监控体系通常布置在拥堵的空间中,以深入了解人群的行为。这是经过在所选空间安装传感根底设施来完结的。然后,将各种技能运用于感测数据以得出行人动态的核算计数。本文重点介绍了一个为人群监控体系规划的组件,该体系运用 Wi-Fi 作为传感技能,并在传感器级别对任何搜集的数据进行匿名化。咱们首先描绘这样一个体系的概述。然后,咱们评论在方针人群监控体系的上下文中处理随机 MAC 地址的组件。

4.1 现在的人群监控体系

咱们假设所运用的人群监控体系模型类似于[11]中描绘的模型。该体系的首要组件是从范围内的移动设备搜集勘探恳求的传感根底设施,以及处理传感器与向体系发送查询的消费者之间的通信的中心单元。图 1 描绘了服务的架构

Wi-Fi MAC 地址随机化与人群监控

整个体系经过时代盯梢时刻。假如传感器检测到范围内移动设备发送的勘探恳求,它会提取播送的 MAC 地址,并依据读取的时刻戳将其分配给当时纪元。因为移动设备能够在一个时期内运用相同的 MAC 地址发送多个勘探恳求,因而传感器将始终删除在该时刻段内检测到的任何重复 MAC 地址。此外,在一个 epoch 完毕时,传感器有必要丢掉任何感测到的数据,而且只要在查询针对特定传感器时才会向服务器发送对查询的呼应。图 2 显示了这种传感设备的作业流程。

Wi-Fi MAC 地址随机化与人群监控

4.2 处理随机 MAC 地址

为了检测和处理来自同一设备的随机 MAC 地址,咱们需求拜访传感器搜集的勘探恳求。方针人群监控体系的规划要求传感器在一个时期完毕时丢掉任何搜集到的数据,因而勘探恳求永久不会脱离传感设备。因而,处理随机 MAC 地址的模块只能在传感器级别完结,在数据搜集期完毕之后和查询成果核算之前。

在当时人群监控体系的背景下,减轻 MAC 地址随机化影响的模块有必要满意一些要求:

  • 可靠地辨认随机 MAC 地址
  • 处理可变数量的数据——这是因为一个时期的长度能够从几分钟到几个小时不等,详细取决于人群监控体系的布置方位,因而每个时期可用的勘探恳求量也各不相同。
  • 恪守众包监控体系的隐私要求——这意味着处理模块不能存储或学习任何今后可用于辨认特定设备或设备组的形式。该组件有必要仅从一个时期搜集的数据中搜集见地,让传感器核算接收到的查询的成果,然后丢掉这些见地并重新开始下一个时期。
  • 核算成本低——通常,传感器很小,它们依靠电池运行,而且资源有限。此外,为了尽或许地维护隐私,传感器现已有必要对发送回服务器的任何数据进行加密,并运用各种散列算法来处理匿名数据 [12] [11]。
  • 进步核算计数的精确性——处理组件有必要尽或许削减随机 MAC 地址的影响,使核算计数尽或许挨近实在值。

附录 A 中的图 4 描绘了处理组件的模型。一旦传感器完结搜集在其邻近播送的勘探恳求突发,它会将它们分红具有随机 MAC 地址的突发和具有非随机 MAC 地址的突发。在后一种状况下,体系只需提取一切仅有的 MAC 地址。关于具有随机 MAC 地址的突发,体系运用“处理站”对它们进行聚类。抱负状况下,每个集群将代表一个不同的源设备,能够经过一组签名来辨认。结合这两个输出,传感器能够经过简单地核算仅有的非随机 MAC 地址和处理站构成的集群来核算人流量。为了核算两个传感器之间的人流,体系将履行两组的交集仅有的非随机 MAC 地址,以及两组集群签名的交集。成果集的组合基数表明人群活动。

4.3 评论

在核算人群流量时,主张的体系有必要克服的最大应战是在坚持当时人群监控体系的隐私要求的一起,将具有随机MAC地址的突发集群从一个传感器同享到另一个传感器。很难为这个问题提出一个通用的处理计划,因为每个人群监控体系都运用不同的技能来匿名化和维护传感根底设施同享的数据。例如,[12]中的人群监控体系运用化名化、截断和更正操作使提取的MAC地址成为k-匿名,这确保在某些状况下,新标识符无法精确追溯到相应的感测设备。在咱们的例子中,关于播送随机MAC地址的设备,咱们不只仅运用一个MAC地址来辨认它们,而是运用一组MAC地址和签名来辨认它们。这些地址和签名或许会变得十分大,这取决于设备在一个epoch中更改其MAC地址的频率。因而,这样的操作乃至或许不适用于咱们为设备获得的集群的成果签名。

关于咱们挑选作为处理组件根底的人群监控体系模型 [11],或许的处理计划或许触及挑选每个集群的最佳签名作为由该集群表明的源设备的标识符。这样,体系能够运用选定的哈希函数对签名进行哈希处理,并将其标记在布隆过滤器中,该过滤器能够安全地发送到另一个加密的传感器。可是,因为每个集群同享的签名数量较少,这种处理计划或许会下降精确性。此外,该处理计划假设所选的哈希函数处理了来自同一设备的两个突发的签名或许不同的现实,但依然满意类似,能够被标记为具有相同的来源。研讨在这种状况下运用什么是最好的散列函数,或许是否存在这样的散列函数超出了本文的范围。

5 试验

为了评价所提出体系的功用以及它能够在多大程度上改进行人数量,咱们施行了一个专心于核算人流量的概念验证算法,并进行了两种类型的试验:户外试验和数据集试验.

5.1 施行

施行只重视发生在传感器级别的进程。咱们程序的根底由几个模块组成,这些模块答应咱们在 epoch 中搜集勘探恳求,一旦核算了客流量就丢掉任何感知到的数据,运用它们的 MAC 地址和序列号将勘探恳求分组,并依据它们的MAC 地址类型。 勘探恳求搜集器有两种操作形式: (1) 嗅探器:在此形式下,咱们的程序将其运行的设备的 Wi-Fi 接口设置为监控形式,并开始经过 14 个不同的 2.4 GHz Wi-Fi 通道进行查找。在每个通道上,程序会搜集 5 秒的勘探恳求,然后移动到下一个通道。 (2) 数据集:挑选此形式后,程序将依据一些参数(例如epoch长度或首选设备标签列表)处理数据集文件。

为了运用来自同一源设备的随机 MAC 地址对突发进行分组,咱们运用 DBSCAN [5]、一种众所周知的聚类算法和两种类型的指纹。第一个指纹由信息元素 (IE) 的有序列表和勘探恳求中可用的某些位掩码组成,它们在设备模型之间供给高熵,而在同一源设备的勘探恳求之间供给低熵 [3] [8]。第二个指纹是从 [3] 中借用的,它依据突发长度和该突发内勘探恳求之间的抵达时刻差,或帧间抵达时刻 (IFAT)。这种指纹辨认办法背后的首要假设是移动设备在固定的时刻内定期发送勘探恳求。为了生成这个指纹,关于每个突发,咱们将其长度分红巨细相等的 bin,依据它们的抵达时刻将勘探恳求分配到 bin 中,并核算每个 bin 的均匀 IFAT 和勘探恳求的百分比。一切这些值的列表和突发长度表明突发的时刻签名。

5.2 数据集

因为从户外数据中获取根本现实的艰巨任务,咱们还运用实在世界的数据集 [9] 来评价咱们的概念证明在改进核算计数方面的效果。该数据集于 2021 年发布,由带有随机和实在 MAC 地址的标记勘探恳求组成,由 22 台设备以不同形式播送。勘探恳求是在试验室环境中捕获的,因而能够独自扫描设备。这种最近的数据集为咱们供给了十分挨近实在世界场景的定性数据,咱们能够在试验中将其用作根本现实。

5.3 道德考虑

为了测验所提出的体系,两个试验都触及运用来自实在移动设备的勘探恳求。假如处理不妥,此类数据将对个人隐私构成威胁。源自数据集的勘探恳求已在试验室环境中搜集,并遵循了一组规矩以答应揭露该数据集 [9]。因而,咱们能够放心肠假设这些数据不会构成任何隐私危险。可是,在户外捕获的勘探恳求或许会追溯到某些个人。因为这个问题,咱们的程序不存储任何捕获的数据。搜集到的勘探恳求仅在感知它们的时期内运用,一旦核算了客流量而且时期完毕,它们就会被丢掉。

5.4 方针

所提出体系的首要方针是尽或许地进步行人数量。因而,咱们依据计数的相对差错削减 (RER) 百分比来评价咱们的概念证明怎么改进核算计数。这是运用以下公式核算的:

Wi-Fi MAC 地址随机化与人群监控
其间相对差错核算如下:
Wi-Fi MAC 地址随机化与人群监控

5.5 试验装置

5.5.1 在户外试验中。

为了测验咱们概念验证的功用,咱们在午餐时刻在大学校园的一个食堂安装了一台笔记本电脑,这是一天中最繁忙的时刻之一。 咱们将程序设置为嗅探器形式,并让它在 1 小时内以 5 分钟为周期搜集勘探恳求。

5.5.2 数据库试验。

关于数据库试验,咱们将程序设置为 Dataset 形式,从处于相同状况的一切设备的 pcap 文件中提取勘探恳求。 这使咱们能够更好地调查不同设备状况对客流量的影响。 然后,程序对勘探恳求的时刻戳进行标准化,并依据新的时刻戳将这些数据包分组为 5 分钟。 关于每个时期,咱们的体系都会核算发送勘探恳求的设备的实践数量,然后将这些组中的每一个供给给担任核算客流量的模块。

6 成果

6.1 在户外试验成果

因为咱们无法拜访户外试验的地面实况数据,即每个时期在咱们传感器范围内的实践设备数量,咱们无法评价咱们的客流量估量有多精确。可是,就咱们的概念证明的功用而言,咱们进行了以下调查:

  • 嗅探器的确能够从Wi-Fi 接口设置的每个Wi-Fi 通道搜集勘探恳求。
  • 搜集的数据与数据集中的数据类似。这意味着野勘探恳求包含随机和非随机 MAC 地址,而且在大多数状况下,它们能够在最多 500 毫秒的短脉冲中分组。这是经过在屏幕上打印数据包是否具有随机 MAC 地址以及搜集数据包时的时刻戳来调查的。没有调查到其他数据,例如数据包的源地址。
  • 该程序核算每个时期的客流量,虽然它有必要处理的数据量很大。
  • 一旦一个时期的客流量被核算出来,在那个时期搜集的数据的确被丢掉而且不能再被拜访。

6.2 数据集试验成果

数据集试验的成果如表 2 所示。设备形式列的值在表 1 中进一步解释。关于每种设备形式,咱们能够将可用数据分红 4 个 epoch,每个 5 分钟。

Wi-Fi MAC 地址随机化与人群监控

Wi-Fi MAC 地址随机化与人群监控

能够调查到,咱们的观念证明在核算打开Wi-Fi的设备时,脚印差错削减了90%以上,与未处理随机MAC地址的脚印估量比较,这显示了巨大的改进。关于未敞开Wi-Fi的设备计数,过错削减率坚持在90%以下。但是,在这些状况下,数据量很小,估量值与实践计数仍只要1台设备的间隔。这些成果十分有期望,标明咱们能够明显减轻MAC\mathrm{MAC}地址随机化对脚印计数的影响。

此外,咱们还调查到,咱们的随机MAC地址处理模块没有完美地集合源设备的勘探恳求,这意味着仍有很大的或许性无法辨认这些设备,这供给了一些隐私维护。但是,咱们注意到,即使存在这种聚类过错,脚印估量值仍有明显改进,这是主张体系的实践方针。

7 结论和未来作业

人群监控是一个应战个人隐私的领域,它经过数据类型来发生对人群的洞察力。跟着对数据隐私和运用的忧虑越来越多,有必要施行各种处理计划来处理人群监控中的这些隐私问题。一方面,新的人群监控体系在规划时考虑了人们的隐私。另一方面,移动设备和操作体系制造商引入了 MAC 地址随机化来阻碍设备盯梢。但是,后一种处理计划被证明也会影响人群监控体系计数的精确性。许多研讨企图在人群监控方面打败这种随机化机制,但据咱们所知,在此类体系中考虑个人隐私的并不多。

本文剖析了MAC地址随机化对依据Wi-Fi的新一代人群监控体系的行人数量的影响。此外,在彻底匿名化感测数据的人群监控体系的背景下,提出了一个处理随机MAC地址并改进核算计数(即客流量和人群流量)的体系模型。提出的体系的概念验证侧重于核算流量,企图运用定时和信息元素指纹对来自同一设备的随机MAC地址进行聚类。为了测验咱们完结的功用和精确性,咱们进行了户外试验和数据集试验。成果标明,该体系能够在实在场景中正常运行,而且在核算打开Wi-Fi的设备时,它能够将核算计数的差错削减90%以上。即使关于那些没有打开Wi-Fi的设备,咱们的估量也只要1台设备与实践计数相距。如此明显的过错削减清楚地标明,MAC地址随机化能够在依据Wi-Fi的人群监控体系的环境中得到缓解,该体系发生的仅有输出是行人计数。

虽然这项研讨的成果在核算人流方面十分有期望,但咱们的概念证明尚未处理人流问题。这儿最大的应战是将带有随机MAC地址的勘探恳求集群的信息从一个传感器传递到另一个传感器,一起依然坚持人群监控体系的隐私要求。因而,需求进行进一步的研讨,以确定所提出的体系模型能在多大程度上改进人群流量估量。