我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
你加过淘宝的神车线报群吗?
我加过
你有领过淘宝优惠券吗?
我领过
你敢和阿里硬碰硬吗?
我不敢
但是!
今天故事的主人公他就碰了!
案情回顾
本案的被告黎某是做淘宝客生意的,早在2012年就入行了。
这里给大家简单介绍一下淘宝客这个行业。
阿里旗下有个平台叫做淘宝联盟。
淘宝联盟是促成生态合作伙伴与广告主生意经营的平台。
简单点说就是一个推广分佣平台。
拥有带货能力的团队或者个人,可以在淘宝联盟注册成为淘宝客。
而淘宝客的工作只有一个,通过链接或者淘口令的形式,把淘宝上边的产品分享出去。
当有人通过这个链接或者淘口令进入淘宝下单购买时,淘宝客就能获得相应的佣金分成。
每个不同的商品淘宝客能获得的佣金都不同。
但通常情况下,大部分淘宝商品都设置有20%左右的推广佣金比例。
即你通过淘宝客的链接进入淘宝下单付款了一件100块钱的商品,那么其中就会有20块钱成为淘宝客的收入。
另外K哥给大家提个醒,网购平台上卖的东西也是良莠不齐,尤其在保健品品类,很多杂牌保健品都设置了极高的推广佣金,甚至能够高达90%。
这意味着如果你花100元买一瓶保健品,这其中的90元都会成为淘宝客的推广佣金。
而那剩下的10块钱,就由电商平台、网店店铺、生产厂家来分,最后还要保证挣钱。
在这种情况下,人家还能给你好果汁儿吃?
先不谈保不保健的问题,吃了不倒沫子就算你运气好了。
所以网上的保健品要千万注意甄别,也别给家里长辈瞎买。
再说回本案,黎某是老淘宝客了,他深知这行想长远稳定的挣着钱,就得有稳定的流量来源。
就是说你推荐的商品得有人看,你发的链接得有人点。
流量嘛,一方面希望它精准,另一方面需要它量大。
互联网上大量获取精准用户的方式一般就是广告投放。
但是烧广告贵呀,即使是以社群的形式来承接用户,这种网购用户的单个获客成本当年基本也在5块钱以上。
而没有大量的用户做支撑,黎某的生意就始终是小打小闹,无法做大……
直到2017年,事情出现了转机。
黎某在网上的一个QQ群里,认识了本案的另一个被告逯某。
逯某是本科毕业,懂计算机,也有点儿爬虫技术。
当时黎某做淘宝客,有微信加人的需求,但手动操作起来比较麻烦。
逯某就帮黎某编了个“微信加人”软件,交个朋友,没收钱。
黎某对逯某是赞不绝口,就承诺逯某算技术入股,等以后成立公司了再跟他分钱。
后来,黎某的业务是蒸蒸日上,于次年在湖南省浏阳市成立了浏阳市泰创网络科技有限公司。
黎某也确实没有食言,在2019年3月特邀逯某成为公司技术员,可以在河南居家远程办公,并每月给逯某1万元的报酬。
但拿了钱,就得办事儿。
这时候就不是写两个自动加人的脚本那么简单了。
上边有说到,黎某的业务需要大量的网购用户,那么从哪儿最容易找到这类用户呢。
当然是在网购平台上。
但是淘宝会把用户白白送给你吗?
那是做梦吃饺子——想得美。
既然常规手段不行,就上点儿非常规的技术手段。
给淘宝来点儿小小的技术震撼。
2019年11月份,逯某开始用自写的软件“淘评评”,通过淘宝商品详细信息接口和淘宝信息分享接口,爬取了淘宝客户的淘宝数字ID和淘宝昵称,同时还通过淘宝分享接口爬取到了淘宝客户手机号信息。
这些信息,逯某会打包成文件定期通过微信发送给黎某。
黎某拿到用户手机号后,交由公司的员工把这些信息数据导入“微信加人”软件,利用话术引导用户添加上好友,并拉入自己的商品群。
进群后就是不断推送产品,引导用户领券点链下单,这样黎某的公司就可以从中挣到佣金。
这一爬,就爬了淘宝整整8个月。
但常在河边走,哪有不湿鞋呢?
2020年7月13日,淘宝的安全风控员发现平台的评价接口存在异常流量行为,经排查后发现有黑产通过mtop订单评价接口绕过平台风控批量爬取加密数据,爬取字段量巨大。
被爬取的内容包括买家用户昵称,用户评价内容,昵称等敏感字段,仅7月6日至7月13日之间平均每天爬取数量500万。
淘宝网经调查后,锁定了有重大作案嫌疑的逯某,并定位到作案地点在河南省商丘市睢阳区新城街道长江路民政局家属院。
遂报警,前往商丘市公安局犯罪侦查支队直属二大队协查调查,随后被立为刑事案件。
再然后就是逯某的落网了,警方通过通过嫌疑人逯某的电脑硬盘信息分析统计,发现了共计超过12亿条手机号、user_nick等加密相关信息。
估计都没审,逯某就给黎某供出来了。
至此,涉案的俩人均已被捉拿归案。
案件后续
经司法鉴定,在送检台式主机中检出MYsq1数据“taobao”,“taobao”数据库中只包含一张数据表“userinfo”,从中提取出淘宝客户的数字ID、淘宝昵称、手机号码等淘宝客户信息共计1180738048条。
告人逯某将其爬取信息中的淘宝客户手机号码通过微信文件的形式发送给被告人黎某使用共计19712611条。
对此,两位被告也做过争辩。
被告人逯某在庭上申辩称:
“我所采集的数据仅限于五千万条,至于十一亿八千万条的数据,并非出自我手,而是我从其他渠道获取的。我收集的信息仅限于电话号码,并未包含任何身份信息,更未与任何用户进行联系或传播。至于利润,我仅获得了六七万元左右的微薄收益。”
被告人黎某则辩解说:
“逯某所提供给我的信息仅为手机号码,我并未利用这些信息进行任何违法犯罪活动。公司返利部门的盈利确实得益于这部分信息,但其他部门的收益与这些信息并无关联,我也愿意退还37万元的违法所得。”
但这些辩解在板上钉钉的犯罪事实面前,只显得多余。
判决情况
鉴于被告人黎某犯有侵犯公民个人信息罪,其行为严重侵害了公民的隐私权,依据相关法律规定,判处其有期徒刑三年六个月,并处罚金人民币三十五万元。
同时,被告人逯某亦因侵犯公民个人信息罪被判处有期徒刑三年三个月,并处罚金人民币十万元。
此外,依法扣押的作案工具,包括逯某电脑主机5台、电脑显示器3台和手机5个,对于被告人黎某、逯某通过非法手段获取的违法所得,将依法继续予以追缴,并上缴国库。
K言K语
本案发生在19年,黎逯二人于20年被捕,逯某于2021年9月23日进入河南省豫北监狱服刑改造,由于服刑期间表现良好,两次获得表扬,被准许减刑4个月。
刑期自20年8月被捕时算起的话,已经于去年出狱。
能够从阿里爬到这么海量的数据,多少还是有点儿本事的,既然法律的惩戒已经结束,那希望他能够早日投入社会,若是还有机会继续搞技术,千万别再违法乱纪了。
至于黎某,原本淘宝客并不是什么黑灰产,很正常的一个行业,偏偏他动了歪心思,好好的公司没了,自己也蹲了三年半。
算起来应该也在今年前不久出狱了,同样希望他能吸取这次的沉痛教训,人生路漫漫,别再走歪路了。
当然,最重要的是屏幕前的爬虫工程师们,要体会到K哥的良苦用心,前人踩过的坑你们可别又掉进去了,千万记好,公民信息,别来沾边!