Skip to content

四火的唠叨

一个纯正程序员的啰嗦

Menu
  • 所有文章
  • About Me
  • 关于四火
  • 旅行映像
  • 独立游戏
  • 资源链接
Menu

大数据时代的隐私安全危机

Posted on 03/17/201306/23/2019 by 四火

big data 315 晚会上,网易销售人员为了强调” 精准营销”,面对央视镜头称:通过 cookies 代码可以追踪用户隐私,甚至能读取网易用户的私人邮件。这件事情引起了轩然大波,网易股价当天就暴跌,但是也引起了无数争论。不可否认通过 cookie 可以获取用户信息,但是在这样做的企业有多少呢,这并不是一件稀奇到值得争论的事情;而推送恶意广告或者获取私人邮件,又成了遭来非议的过分行为。

网易手里掌握了多么海量的用户信息,该怎样用这些信息去谋取利益,却又避免背上 “作恶” 的骂名?这似乎就是薄薄一层窗户纸而已。没有足够的法律法规,也没有足够统一和公开的标准,每个人都会有自己的理解。当 Google 在利用搜索推送关联广告赚钱的时候,百度正承受着广告推广、掩埋数据和制造垃圾信息的骂声。

从人类理解事物的模型来说,是基于因果关系的,比如今天下午我肚子疼,我会想,今天吃了什么不干净的东西,或者是不是睡觉着凉的,才会肚子疼;大数据时代,人们会逐渐习惯更关心关联关系,如果经过大量数据的统计发现,使用了微博超过两小时后,大量出现肚子疼的病例,我大概就会回想是不是微博又使用过度了,虽然我根本不知道为什么这二者会产生相关关系。这些数据也许有不准确,甚至有错误,但是在追求数据量的同时,这是不得不接受的妥协。事实上,有许多事件之间,因果关系是极难观察和分析清楚的,但是获知退而求其次的关联关系,却存在足够的可行性。而要做到这一点的一个充分条件,就是大量的数据。

那好,今天你使用邮箱发送邮件,你在当当上买了一本畅销书,你给老爸老妈打了个电话,甚至你出入了某个商场,你会考虑这些会成为观察你、分析你和猜测你的信息和行为的大量数据中的一员么?

拟想这样一个场景:某一天我受到刺激,厌倦了生活,想自寻短见。我在微博里发布了一首别离的诗,我去商店里买了农药,就在我要寻死的时候,有人找到了我,他可以阻止我过激的行为,凭借的,正是对我属性的分析,以及行为的监控,我写了什么,发布了什么,购买了什么,一切都是数据,一切都在掌握之中。有人在每日监控的大量人里面,根据学习到的某种特征,发现我完全匹配,进而发现了我的企图。

传统上说法官判案、医生诊断、警察破案,依据的都是因果关系。但是现在,大量实例的关联关系也被逐渐接受,例如医生在无法确诊的情况下可行使经验性治疗。也许未来会有一天,一些潜在的犯罪分子,也可以被提前挖掘出来。那么,会不会有一天,我被定罪,我被道德舆论谴责,并不是因为我的所作所为,而仅仅是因为数据得出的我的所想,我的邪恶倾向呢?

足够的数据,可以帮助找到那些有威胁的人,他们想做的事情,完全可以通过掌握的数据挖掘分析出来。也许你已经感到一些隐忧,在这些 “预知” 的背后,可以看到,在数据面前,谁又有隐私可言呢?

通过采集大量的社交数据,可以发现某个人其实是同性恋;采集购买商品的历史数据,可以发现某个人是否有了孩子,男孩还是女孩,孩子大概几岁……这些并非幻想,在不远的将来就可以轻松地普及开来。无论你在哪里,只要有足够的数据,就可以获知你的一切。换句话说,在大数据时代,人是 “透明” 的。

你可以惩罚那些泄露隐私的人和企业,但是人习惯于大量社交的,你不会有足够的精力去关心潜在生活中的那么多能够获取你数据的厂商企业,无论惩罚的执行有多坚决,隐私数据泄露造成的损失是无法挽回的。这些数据可以很容易从互联网上取得,于是受害者惶惶不可终日。

有人把希望寄托在企业的良心上,在人的良心上。靠 “良心” 来保护隐私数据的安全,总是不那么牢靠的。

文章未经特殊标明皆为本人原创,未经许可不得用于任何商业用途,转载请保持完整性并注明来源链接 《四火的唠叨》

×Scan to share with WeChat

你可能也喜欢看:

  1. 不适合 Hadoop 解决的问题
  2. reCAPTCHA 项目
  3. 关于 Jeff Dean 的几个搞笑传言
  4. Dart:JavaScript 的未来
  5. 从“Google 地图八位版” 看国内的抄袭

1 thought on “大数据时代的隐私安全危机”

  1. 大笨兔C语言博客 says:
    03/24/2013 at 2:36 PM

    如果完全了没有隐私,那该多么可怕

    Reply

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

订阅·联系

四火,啰嗦的程序员一枚,现居西雅图

Amazon Google Groovy Hadoop Haskell Java JavaScript LeetCode Oracle Spark 互联网 亚马逊 前端 华为 历史 同步 团队 图解笔记 基础设施 工作 工作流 工具 工程师 应用系统 异步 微博 思考 技术 数据库 曼联 测试 生活 眼界 程序员 管理 系统设计 缓存 编程范型 美股 英语 西雅图 设计 问题 面向对象 面试

分类

  • Algorithm and Data Structure (30)
  • Concurrency and Asynchronization (6)
  • System Architecture and Design (43)
  • Distributed System (18)
  • Tools Frameworks and Libs (13)
  • Storage and Data Access (8)
  • Front-end Development (33)
  • Programming Languages and Paradigms (55)
  • Testing and Quality Assurance (4)
  • Network and Communication (6)
  • Authentication and Authorization (6)
  • Automation and Operation Excellence (13)
  • Machine Learning and Artificial Intelligence (6)
  • Product Design (7)
  • Hiring and Interviews (14)
  • Project and Team Management (14)
  • Engineering Culture (17)
  • Critical Thinking (25)
  • Career Growth (57)
  • Life Experience and Thoughts (45)

推荐文章

  • 聊一聊分布式系统中的时间
  • 谈谈分布式锁
  • 常见分布式系统设计图解(汇总)
  • 系统设计中的快速估算技巧
  • 从链表存在环的问题说起
  • 技术面试中,什么样的问题才是好问题?
  • 从物理时钟到逻辑时钟
  • 近期面试观摩的一些思考
  • RSA 背后的算法
  • 谈谈 Ops(汇总 + 最终篇):工具和实践
  • 不要让业务牵着鼻子走
  • 倔强的程序员
  • 谈谈微信的信息流
  • 评审的艺术——谈谈现实中的代码评审
  • Blog 安全问题小记
  • 求第 K 个数的问题
  • 一些前端框架的比较(下)——Ember.js 和 React
  • 一些前端框架的比较(上)——GWT、AngularJS 和 Backbone.js
  • 工作流系统的设计
  • Spark 的性能调优
  • “残酷” 的事实
  • 七年工作,几个故事
  • 从 Java 和 JavaScript 来学习 Haskell 和 Groovy(汇总)
  • 一道随机数题目的求解
  • 层次
  • Dynamo 的实现技术和去中心化
  • 也谈谈全栈工程师
  • 多重继承的演变
  • 编程范型:工具的选择
  • GWT 初体验
  • java.util.concurrent 并发包诸类概览
  • 从 DCL 的对象安全发布谈起
  • 不同团队的困惑
  • 不适合 Hadoop 解决的问题
  • 留心那些潜在的系统设计问题
  • 再谈大楼扔鸡蛋的问题
  • 几种华丽无比的开发方式
  • 我眼中的工程师文化
  • 观点的碰撞
  • 谈谈盗版软件问题
  • 对几个软件开发传统观点的质疑和反驳
  • MVC 框架的映射和解耦
  • 编程的未来
  • DAO 的演进
  • 致那些自嘲码农的苦逼程序员
  • Java 多线程发展简史
  • 珍爱生命,远离微博
  • 网站性能优化的三重境界
  • OSCache 框架源码解析
  • “ 你不适合做程序员”
  • 画圆画方的故事

近期评论

  • Ticket: TRANSACTION 1.922915 BTC. Go to withdrawal >> https://yandex.com/poll/enter/BXidu5Ewa8hnAFoFznqSi9?hs=20bd550f65c6e03103876b28cabc4da6& on 倔强的程序员
  • panshenlian.com on 初涉 ML Workflow 系统:Kubeflow Pipelines、Flyte 和 Metaflow
  • panzhixiang on 关于近期求职的近况和思考
  • Anonymous on 闲聊投资:亲自体验和护城河
  • 四火 on 关于近期求职的近况和思考
  • YC on 关于近期求职的近况和思考
  • mafulong on 常见分布式基础设施系统设计图解(四):分布式工作流系统
  • 四火 on 常见分布式基础设施系统设计图解(八):分布式键值存储系统
  • Anonymous on 我裸辞了
  • https://umlcn.com on 资源链接
© 2025 四火的唠叨 | Powered by Minimalist Blog WordPress Theme