我国现在并未出台专门针对网络爬虫技能的法律标准,但在司法实践中,相关判定已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目经过对实在事例的分析,旨在进步广大爬虫工程师的法律意识,知晓如何合法合规运用爬虫技能,警钟长鸣,做一个遵法、护法、有准则的技能人员。
案情介绍
出生于1983年12月的黎某是湖南省浏阳市人,从2012年开端做淘宝客生意,即经过做淘宝推行赚取淘宝客佣钱,其关键便是需求很多的淘宝客户联系方法。
2017年7月,黎某在网上认识了逯某。双方谈起上述生意时,黎某提到,“很难获取很多的淘宝客户联系方法”。为此,逯(l)某为其编了一个“微信加人”软件,而且没收钱。“这个软件运用起来十分方便,也利于淘宝客生意。我觉得他有很好的网络编程技能,于是就承诺逯某,待建立了公司,算逯某技能入股。”黎某供述称。
2019年3月,黎某在湖南省浏阳市建立了浏阳市泰创网络科技有限公司(自然人独资),该公司主要做“淘宝联盟”里的淘宝返利,主要用一些手机号,加对方微信老友进行推行淘宝产品,让用户收取“淘宝联盟”优惠券,对方运用优惠券成功购买产品,该公司会获得返利。逯某受雇于黎某,作为公司技能员,每月薪酬一万元。自2019年11月,逯某自写软件“淘评评”。该软件可以经过淘宝产品详细信息接口和淘宝信息共享接口,爬取淘宝客户的淘宝数字 ID 和淘宝昵称,经过淘宝共享接口爬取淘宝客户手机号信息,并将其间淘宝客户的手机号码提供给黎某,用于浏阳市泰创网络科技有限公司用于运营活动。
黎某称,他在收到淘宝客户手机号码之后,会把这些信息数据导入“微信加人”软件,加微信老友成功后,由浏阳市泰创网络科技有限公司的职工负责发送广告链接,淘宝用户在该公司的广告群里购买产品,该公司获得佣钱。
该公司一位工作人员王某透露,该公司约有 1100 个微信群,每个微信群最多有 200 人,最少约 90 人。其主营业务便是帮淘宝商家带货,从而获得淘宝网佣钱和商家服务费。至于其淘宝客户来历,该人员称“不清楚”。“咱们建好微信群后,将群二维码提供给老板黎某,然后就有人自动进群。”王某称。
逯某盗取数据的方法十分激进:仅在2020年7月6日-7月13日这七天里,平均每天爬取数量 500 万,爬取灵敏字段量巨大,被淘宝公司风控部门发现。
该公司自2019年11月份至2020年7月份运用该信息运营共获利 340187.68 元。
经司法鉴定,逯某经过其开发的软件爬取淘宝客户的数字 ID、淘宝昵称、手机号码等淘宝客户信息共计 1180738048 条(即:11.8 亿条),逯某将其爬取信息中的淘宝客户手机号码经过微信文件的方法发送给黎某运用共计 19712611 条(即:1971 万条)。
法院观点
法律规定:
-
《最高人民法院、最高人民检察院关于办理侵略公民个人信息刑事案子适用法律若干问题的解说》第一条
刑法第二百五十三条之一规定的“公民个人信息”是指以电子或许其他方法记载的可以独自或许与其他信息结合辨认特定自然人身份或许反映特定自然人活动状况的各种信息,包含名字、身份证件号码、通讯通讯联系方法、住址、账号暗码、产业状况、行迹轨道等;
-
《检察机关办理侵略公民个人信息案子指引》
对“公民个人信息”的检查认定根据《解说》的规定,公民个人信息是指以电子或许其他方法记载的可以独自或许与其他信息结合辨认特定自然人身份或许反映特定自然人活动状况的各种信息,包含名字、身份证件号码、通讯通讯联系方法、住址、账号暗码、产业状况、行迹轨道等。经过处理无法辨认特定自然人且不能复原的信息,尽管也可能反映自然人活动状况,但与特定自然人无直接相关,不属于公民个人信息的领域。
最高院法官的论述:
在大数据时代,从理论上而言,任何信息与其他足够多的信息相结合,都可以辨认特定自然人身份或许反映特定自然人活动状况。因此,对于不能独自辨认特定自然人身份或许反映特定自然人活动状况的部分相关信息,究竟哪些可以纳入“公民个人信息”的领域,必然会存在较大的认识分歧。 在司法适用中具体判断部分相关信息是否可以认定为“公民个人信息”,应留意以下几点:
(1)需求结合的其他信息的程度。 假如涉案信息本身与特定自然人的身份、活动状况相关程度高,需求结合的其他信息相对较少,则认定为“公民个人信息”的可能性较大;反之,假如需求结合的其他信息过多,则认定为“公民个人信息”的可能性较小。
(2)信息本身的重要程度。 假如涉案的信息与人身安全产业安全密切相关,灵敏程度较高,则对于此类信息在认定是否属于“公民个人信息”时,可以采取相对从宽的标准。
(3)行为人片面意图。 假如行为人片面上获取涉案信息就不需求辨认特定自然人身份或许反映特定自然人活动状况,则此类部分相关信息准则上不宜认定为“公民个人信息”。
判定状况
逯某受雇于黎某,二人违背国家规定,非法获取公民个人信息,情节特别严重,其行为均已构成侵略公民个人信息罪。公诉机关指控罪名建立。且系共同犯罪,逯某、黎某有率直情节,且认罪认罚,对其均可从轻处罚。
归纳其犯罪情节及社会危害性,按照《中华人民共和国刑法》第二百五十三条之一、第二十五条第一款、第六十七条第三款、第五十二条、第五十三条、第六十四条之规定,判定如下:
一、被告人黎某犯侵略公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币三十五万元;
二、被告人逯某犯侵略公民个人信息罪,判处有期徒刑三年三个月,并处罚金人民币十万元。;
三、被告人黎某、逯某违法所得依法继续予以追缴上缴国库;
四、依法扣押的作案工具逯某电脑主机5台、电脑显示器3台和手机5个,由扣押机关依法处理。
判定文书
(2021)豫1403刑初78号
事例分析
就最高院观点而言,“淘宝昵称”、“淘宝账号”不应该认定为为公民个人信息,尽管账号是不行重复的,但账号并非身份证号码,每个人都可以有多个账号,且并非所有账号都绑定身份信息,仅有账号很难辨认到特定自然人。《解说》第一条中尽管列举了“账号暗码”为公民个人信息,但应当理解为一组账号和暗码,而不是独自的账号或许独自的暗码。就本案而言,应当主张在12亿条信息中心除掉“淘宝账号”、“淘宝昵称”两组信息。
假如逯某所述属实,其是经过淘宝共享接口爬取到的淘宝客户手机号信息,证明彼时淘宝的信息安全维护是做的很不到位的,而且缺乏相关意识。近年来信息走漏问题严重,快递信息、防疫信息等都应该引起有关部门及企业的警觉,这方面的安全防护是重中之重。
关于个人隐私维护,这儿给到以下主张:
-
维护个人账号暗码:设置一个杂乱的暗码,而且不要把暗码告诉任何人。一起,运用暗码办理器来妥善办理暗码;
-
留意公共 Wi-Fi 的运用:在公共场所运用 Wi-Fi 时,要留意安全,不要在不安全的 Wi-Fi 环境下进行灵敏操作,如登录银行账户等;
-
慎重共享个人信息:不要随意把个人信息共享给生疏人,不要在交际媒体上揭露共享个人信息,在网上填写信息的时分,能填虚拟的地方就尽量不要写实在的信息;
-
定时检查账户安全设置:检查并设置账户的安全设置,如两层验证、密保问题等,保证账户安全;
-
不要容易点击生疏链接:不要随意点击来自不明来历的链接,以免被钓鱼网站欺骗;
-
不要随意下载生疏应用程序:不要容易下载不知名的应用程序,以免个人信息被窃取;
-
定时整理浏览器缓存:定时整理浏览器缓存和历史记载,以免个人信息被别人运用。
当处理个人隐私数据时,爬虫工程师们需求特别留意以下几点:
- 遵守相关法律法规:有必要严格遵守国家的法律法规,包含《个人信息维护法》等相关规定;
- 尊重个人隐私:尊重个人隐私是一种品德和职业操守。在爬取个人数据时,有必要保证数据来历合法且现已获得了用户的授权同意,不得擅自窃取、运用、出售或走漏用户的隐私信息;
- 加强数据安全办理:应该加强数据安全办理,包含加密、脱敏、拜访日志记载、定时检查等措施,以保证数据的安全;
- 及时删去个人数据:在用户恳求删去个人数据或许个人数据不再需求的状况下,应及时删去个人数据,以保证用户隐私;
- 检查第三方合作伙伴:在与第三方合作时,应该检查合作伙伴的数据维护政策和安全措施,保证他们的数据处理流程契合法律法规要求,而且可以保证用户的隐私安全。
个人隐私数据不能碰!数据来历是否合法是爬虫活动的前提,不要由于一时的利益,抱有侥幸心理,常在河边走哪有不湿鞋,银手铐戴到手上的那一刻才知道懊悔,就什么都晚了,愿各位警钟长鸣。


