云计算时代数据自我防卫术-DOIT-数据产业媒体与服务平台

利用云计算服务时担心的是泄露数据，“自己Web的浏览记录会不会被泻?”;“个人信息会不会被曝光?”;“保存在云计算上的数据会不会被第三方看到”等不安会不断困扰你。为了保护重要的个人数据，最为关键的是需要了解处理数据的方法，然后采取切实可行的保护措施。

云计算时代你的烦恼

目前，IT技术进入云计算全盛时代，很多电脑用户享受着Web和SNS(社交网络媒体)以及在线存储等云计算服务的便利。

与此同时，很多用户对于利用云计算服务也充满忧虑。烦心事之一是担心泄露和自己相关的信息(图1)。由于网络是一个开放的空间，你会担心在你不知道时泄露重要的个人信息。

例如，你在网上的行为记录被泄。由于每天浏览的网站记录被获取，你会担心自己的兴趣爱好暴露给第三者。这方面明显的例子就是网站显示的广告，即虽然你访问不同的网站，有时会显现相同的广告。

此外，你会担心网上的个人信息被泄露，因为SNS上不断出现“网上人身攻击(Flaming)”，就是通过互联网针对某用户个人发送大量责难或辱骂等信息。

图1 利用网络随之产生云计算时代的烦心事

很多网民的担心诸如“网上的个人行为记录”;“自己的个人信息”;“网上保存的文件”等数据会被泄露。

信息泄露的不安

一旦遭遇“Flaming”，很多用户详细的个人信息就会暴露在网络留言板(BBS，bulletin board system或者MB，message board)上。而这一类事情每天都会出现在网上，每当这时我们肯定会担心自己也成为网上被攻击的靶子。此外，担心保存在网络存储器上的数据是否安全。因为一旦保存的数据被随意访问，数据就有被窃取的危险。

目前，利用Web和云计算服务已日常化，因此以上的烦心事，随时有可能出现在任何网民身上。

但是大可不必过于担心，因为只要你了解网上的个人信息是如何处理，并采取相应的防范措施，就可以避免出现上述的情况。下面，将分别讲述不同的防范对策。

首先，我们谈一谈访问记录的问题。笔者将详细说明为什么访问不同的网站，会出现相同的广告。然后，再说一下SNS的“Flaming”问题。在这里将一一说明“怎样的言论会引发Flaming”以及“很多社交网站和博客是匿名，但为什么能够辨别出个人”。最后，谈谈在线存储器的信息泄露问题。讲解在线存储有哪些风险以及规避风险的方法。

[担心-1]总会出现相同的广告…难道有人在看我的记录?

相信你会遇到这样的情况，即访问不同的网站竟会出现相同的广告(图1)。比如，经常浏览软件的网站用户，就会显示和软件相关的广告。而另一个用户访问这个网站时，就会显示完全不同的广告。这种情况会让你怀疑广告商似乎是在迎合自己的兴趣发布广告。实际上，你的估计并没有错，也就是说，不同的网站会通过收集用户的访问记录，选择显示相应的广告。通常，将这种网络广告的行为营销称之为“ 行为定向(behavioral targeting)”，这是一种挖掘用户在网站上的行为模式，找出潜在需求，从而有针对性地投放广告的方式。

图1 为何会显示相同的广告?

上图显示相同的广告的事例。即便访问不同的网站，有时也会显示相同的广告。而且，其他人访问相同的网站时，就会显示不同的广告。

针对不同的用户发布不同的广告

而实现以上目的的就是Cookie结构，它是指某些网站为了辨别用户身份，进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。

图2 通过“Cookie”功能识别用户进而发送相应的广告

这是根据用户的情况发送广告的概略图，这就是为什么不同的网站会出现相同的广告即通过“Cookie”功能跟踪网上访问情况，但它只辨别网络浏览器，并不辨别个人。

当用户访问网站时，保存在电脑内的Cookie将会被发送到发布广告的网站(图2的1)。这是因为Cookie内保存着用户访问的网页的种类以及用户的ID等数据，因此能够根据用户发送不同的广告(图2的2)。也就是说，即便访问不同的网站，如果发送广告的网站相同，就会显示相同的广告。

但确切地说，被识别的是网络浏览器而不是个人，这是因为Cookie会分别保存在不同的网络浏览器。

虽然有些网民会觉得“使用Cookie结构可以显示适合自己的广告”因而便利，但同时有些网民想避免出现这种情况。对于后一种网民，可以通过设置网络浏览器等方法规避这种情况。

而避免出现这种情况重要的是需要了解Cookie的结构。下面，首先对Cookie的结构进行说明，然后介绍具体的规避对策。

Web浏览器和Web网站互通时使用HTTP协议

Web浏览器和Web网站互通时会使用HTTP(HTTP-Hypertexttransferprotocol)协议即HTTP超文本传输协议，而很多网站网址从“http”开始也是这个原因。HTTP这种通信协议的特点是比较简单，安装也便利且可减少通信量。但同时它的功能很少，例如，它没有识别访问网站用户(网络浏览器)的功能(图3)。也就是来自网络浏览器的通信有两次时，它无法辨别两次通信是来自同一个网络浏览器，还是来自不同的网络浏览器。

图3 识别用户Cookie不可或缺

上图显示有无Cookie的不同情况。网络通信协议HTTP本身单纯，因而安装非常简单，而且会减少通信量。但同时它无法辨别访问的用户User-Agent(一般是浏览器 )，因此就采用Cookie这种结构。

通过HTTP则无法识别访问的网络浏览器

由于上述原因采用了Cookie结构，它作为文本数据被收发。网络浏览器收到的Cookie，作为文本文件保存在网络浏览器所管理的特定的文件夹内(图4)。

一般的Cookie也称之为“固定Cookie”，这些固定Cookie作为文件保存下来，并设置有效期限，一旦超过期限就会从硬盘驱动器(HDD)删除掉。

图4 Cookie实际上是文本文件

Cookie作为文本文件被保存在电脑中。IE浏览器会将来自相同网站的多个Cookie保存在一个文件中(右)，而Windows 7则会保存在用户文件夹以下的“AppDataRoamingMicrosoftWindowsCookiesLow”中(左)。初期设置没有显示保存Cookie的文件夹。

此外还有Session Cookie，它不作为文件保存在硬盘驱动器内

与此同时，还有不作为文件保存下来的“Session Cookie”(图5)，这种Cookie没有有效期限。虽然其功能和上面的固定Cookie相同，但它不会保存在硬盘驱动器内，它只在网络浏览器运行时才会被保存下来，一旦运行终止就会被删除掉。

图5 固定Cookie和Session Cookie两者的区别

固定Cookie在设置的有效期内，会保存在电脑的硬盘驱动器中，每当其网络浏览器被访问时才会发送信息。通常所说的Cookie很多是指固定Cookie，而Session Cookie则会保存下来。只在网络浏览器运行时才被使用。

此外，Cookie也有根据发送的对象进行分类的方法，即“first-party cookie(第一方cookie)”及“third-party cookie(第三方cookie)”图6。

所谓“第一方Cookies”，指的是来自当前正在访问的网站，储存了一定信息的Cookies。由于它在移动网页和管理购买的商品等时不可或缺，几乎所有的会员制网站会使用这种分类方法。

而第三方Cookie”，指的是来自当前访问网站以外的站点，最常见的就是那些在被访问站点放置广告的第三方站点。

图6 “第一方cookie”和“第三方cookie” 的差异

来自当前正在访问的网站(网络浏览器的地址一栏会显示域名)的是第一方cookie。而第三方cookie则来自当前访问网站以外的站点，最常见的就是那些在被访问站点放置广告的第三方站点，这第三方站点可能正在使用Cookies。

第三方cookie用来跟踪用户的访问记录

第三方cookie用来跟踪用户的访问记录。此外，Cookie不仅包括用户ID，而且包括辨别正在访问的网页的信息(URL和独自分配的ID等内容)。网络浏览器一旦访问网页，这些Cookie被转发到发布广告的网站。因此，广告发布网站可以推测用户的兴趣和属性，显示最适合于用户的广告。例如，谷歌公司提供的“AdSense(相关广告)”，就是针对网站主(在线发布商)的一个互联网广告发布服务，Google 通过程序来分析网站的内容，并且投放与网站内容相关的广告(图7)。

图7 你就这样被审视

谷歌在官方网站提供的「Ads Preferences Manager」()页面显示画面。谷歌从用户的web访问记录等数据，推测出这个用户的兴趣和属性，显示其会感兴趣的广告。在这个网页上，用户可以了解谷歌推测的用户兴趣和属性。

不愿自己的访问记录被跟踪的用户，可采用的对策就是管理Cookie。用户可以让浏览器拒绝网站存放Cookie到你的计算机，只要改变网络浏览器的设置，即可阻拦第三方Cookie(图8)。

图8 通过变更设置拒绝Cookie

上图是IE9的Cookie设置画面。工具(Tool)→Internet选项("(Internet Options))的隐私(Privacy)单击Tab键即可拒绝Cookie。例如，在“详细设置”点击“覆盖自动处理Cookie(Override automatic cookie handling)”确认(ok)，即可设置阻拦第三方Cookie。在“site”可设置允许或阻止来自特定的网站的Cookie。

但是，根据访问网页的状况和网络浏览器，即便设置阻止Cookie，有时还会出现发送第三方Cookie的情况。例如，虽然会拒绝新发送的第三方Cookie，但是以前发送的第三方Cookie则有时会发送到广告发送网站。

对策就是管理Cookie

由于Cookie是由不同网络浏览器进行管理，使用不同的网络浏览器也是一个办法。访问后，只要删除网站的Cookie，就不会让对方知道你的访问记录。

另一个更简便的方法是使用不保存Cookie命令(图9 、图10)。使用这个命令，即便通过经常用的网络浏览器访问网站，也不会在 Internet Explorer 中留下任何痕跡，可预防其他人使用你的电脑来查看你曾浏览过的，以及你在网页上观看过的内容。

图9 通过不保存Cookie命令进行浏览(IE)

IE9的“InPrivate 浏览(browse )”的画面一例。通过这个命令浏览网页，浏览结束后Cookie和访问记录会删除，不会保存在电脑里。“工具(tool)”→“安全(safety)”→“InPrivate浏览 ”即可。

图10 通过不保存Cookie命令进行浏览(Chrome)

Chrome的“select mode”的画面一例。它具有和IE9的InPrivate 浏览相同的功能。“Google Chrome的设置”→“打开select window”即可。此外，Firefox等也有同样的命令功能。

此外，不愿网络访问被跟踪时，用户可使用“Do Not Track(DNT，请勿追踪)”功能向网站表示意向(图11)。

图11通知不想被跟踪

通知不愿网络访问被跟踪的“Do Not Track”功能的概要。要求网页时，通知HTTP header(是HTTP请求和相应的核心，它承载了关于客户端浏览器，请求页面，服务器等相关的信息。)开通Do Not Track。支持Do Not Track的网站就不会使用Cookie等进行跟踪。

不想访问记录被跟踪的用户，使用网络浏览器将其通知网站。具体做法和Cookie相同，即针对网站要求网页的数据时，发送「DNT：1」数据即可。

目前，很多主要的网络浏览器支持DNT。用户只要改变设置，DNT即可生效(图12)。

另一方面，支持DNT的网站还很少。但是，已有大型网站表明支持DNT。例如，美国的Twitter就在2012年5月宣布支持DNT。

图12 IE和Firefox支持「Do Not Track」

IE9(左)和Firefox 13(右)设置“Do Not Track”的画面。IE9浏览器通过「工具」→「安全」→「防止跟踪」显示对方窗口，点击“个人用list”，点击“有效”。Firefox则通过「工具」或者「Firefox」按钮→「option」→「Private」确认「将请勿追踪通知网站」。

[担心-2]网上人身攻击不断为何个人信息会被曝光

目前，用户的个人信息不断出现在网上(图1)。在网络留言板和博客上暴露的不仅仅是姓名，还包括住址和电话号码以及工作单位等详细的个人信息，而且还夹杂着侮辱和谩骂。

由于个人信息被公开，恶作剧电话会打到家里。有些工作单位和学校知道后，甚至会核实这些攻击的真伪。

一旦亲身遭遇这些事情，难免会让一些网民害怕利用网络。但大可不必如此恐慌，从过去发生的实例来看，个人信息被泄露几乎都是因为在SNS等上发布不妥当言论所致(图2)。只要没有无礼的言论，一般的网民不会成为攻击的对象。

图1 个人信息暴露事件频发。

在本人不知情的情况下，个人信息泄露到网上事件频发。第三方(恶意网民)会针对某个网民，发布诸如“太郎这家伙不是东西”言论，同时公开此人的个人信息(住所、电话号码以及工作单位等)。这些信息一旦扩散开来就无法恢复原状。泄露的这些信息会被滥用，有时恶作剧电话会打到家里、工作单位和学校。

图2 某个网民发布过分不妥的言论，诱使第三方人泄露其个人信息

由于某网民发表不适当的言论，使第三方产生兴趣，不断发生个人信息被泄事件。而这些信息(包括家族成员和照片等)会被公开在留言板上，致使工作单位和学校知晓此事。

起因是犯罪炫耀

导致个人信被暴露的典型情况是某网民粗暴无礼的言论。例如，网上谈某人无票乘车和无证驾驶等事，也有一些就是通过业务关系获取名人信息后，再在网上予以曝光。还有一些则是违反常识的话题和藐视他人的言论，以及毫无根据的责难和谩骂也会成为被攻击的靶子。

也许有人会说，“反正自己不是名人，而且自己发布的留言除了朋友不会看到”，这种想法大错特错，因为目前就有专门四处寻找不恰当的言论的“故意暴露个人信息进行攻击”的网民(所谓想让人“flaming”的网民)。这些人通过社交网络媒体等搜索功能，寻找过激的言论，发现后再在留言板予以曝光。

而“完全出于兴趣爱好的网民们”在留言板看到不恰当言论，蜂拥而至使其“flaming”。

然后，这些恶作剧的人会从网上各种信息中有意寻找发布不当言论的用户。一旦拿到手后就通过留言板等予以曝光。甚至这些人会给单位和学校打电话，告知网上的发布的内容。

很多发布不适当言论的社交网络和博客是匿名，用户名和个人资料都极少使用真名。那么，为何能够特定个人?这是因为那些专门喜欢干这种事情的网民，想尽办法进行调查，查出其真名。

为何能够特定个人?

原因之一是详细寻找无礼言论之外的信息。即便每个言论本身没有什么特征，但是积累一些后就会发现可以辨别特定个人的信息(图3)。

图3 即便是匿名信息，积累一定量后也成为可特定个人证据

虽然通过单个言论无法识别个人，但是整合多个言论后就会成为可特定个人的信息。

此外，还会收集导致网上攻击的SNS之外的信息，例如，使用搜索网站专门收集与个人相关的信息(图4)。

图4 在网上搜索并收集相关信息。

通过搜索网站辨别个人的事例。虽然通过网上服务，例如社交网络上发表的言论等，无法特定个人，但是通过收集网站登载的个人信息，有时就能够识别个人身份。

这种情况通常搜索的关键字–用户名。使用用户名进行搜索，就极有可能发现正寻找的网民使用的其他网上服务，因为由此发现的新网上服务极有可能登载其个人信息。

此外，还会通过填写的内容，寻找到个人信息。比如如果填写的内容中包含可特定时日的活动，他们就会通过详细调查此项活动，发现该用户的真正身份。

还有，就是朋友的博客等也会成为有利的线索。通过填写中的链接和SNS的功能，了解其朋友发布的言论。

此外，其他知道发布问题言论网民的网民也会寄送相关的个人信息。那些有意专门收集个人信息予以曝光的网民，会公开登载该网民信息以及募集相关信息的网站。一旦收到新的信息就会将其添加到网站上。

由于登载的几乎都是真伪未加确认的信息，如此一来搞错的信息就很多。而毫无干系的人的信息被登载后，有时灾难就会落到这些人身上。

很多专门收集特定用户的网站都是由专门爱好攻击个人的网民运营。这一类网站针对浏览网站的用户，募集某网民的相关个人信息(诸如目前知道太郎的公司名以及地址，请告知更多此人的情况等)。而了解此人信息的人(邻居、同僚以及同学等)会上传更详细的个人信息(公寓门牌号、所属部门以及毕业照等信息)。

网上公开的照片是信息宝库

此外，网民在社交网站和博客上公开的照片也被用于识别个人身份。因为使用具有GPS功能的设备拍摄照片会显示拍摄照片的位置。例如，如果是在自己家里拍的照片，通过这些照片你家的地址就会被暴露出去。

这种照片内置的位置信息叫Geocoding(地址匹配，address-matching)，上面记录着通过GPS获取的拍摄地点的纬度和经度。

这种信息通过使用专用的软件和服务，就可以简单地提取出来。例如，Windows 7就显示在照片文件的“属性 (property)”中。

如果使用智能手机等具有GPS功能的设备进行拍照时，照片上就会内存拍摄地点的信息，而这些位置信息可以使用专用软件或是服务就可以轻而易举地提取出来。

从Twitter上发表的言论中也可以辨别其住所，因为Twitter软件具有通知填写言论的地理位置的功能。

根据Twitter软件，通知所推特场所的位置信息。初期设置无效。点击位置信息的推特，就会显示出推特的场所的地图和经纬度。

防止个人信息泄露所需的心态

防止暴露个人信息最为重要的是要有思想准备。总之，不要在网上发布过激的言论，因为看到你言论的不仅仅是你的朋友，这些言论有可能被充满恶意的网民看到并进行人身攻击。

意识到自己网上发布的言论任何人都有可能看到;

铭记一旦个人信息泄露出去，就永远无法恢复原状;

公开个人信息和照片时需谨慎;

利用通知位置信息的功能需小心注意。

应当铭记一旦信息传播出去就无法恢复原状。成为网上关注的话题后就无法删除其言论。此外，还有可能被转载到其他网站上。

此外，公开个人信息和照片时也要倍加小心。公开的照片应当是没有地址匹配功能。如果想公开的照片包含这种功能，就可以利用谷歌的免费图片管理工具“Picasa ”和擦除信息软件“ExifEraser ”即可删除掉。

最后一点，利用通知位置信息的功能也需谨慎。如前所述，从具有GPS功能的智能手机等设备进行投稿时，你的位置信息会被他人获取。

没有特别的理由就应将通知位置信息的功能设置为无效。如果暂时设定为有效，切记不要忘记恢复到无效的状态。

[担心-3]云计算上的数据是否安全

利用在线云存储服务可以将保存并共享文件，但是同时也会担心数据被泄露。很多用户担心第三方会随意访问这些数据。实际上，目前有很多保存重要的个人信息的文件，在本人不知情的情况下被任意公开。

在某在线云存储服务上公开的文件(个人信息部分本编辑部已经做了修改)。虽然看似是名单，但任何人都可以访问。

这种情况几乎都是源于用户本人设置错误所造成。很多在线云存储在初期设置时，只有上传文件的用户本人才能阅览。但是改变这一设置后，通过搜索网站等途径，这些重要的文件会被第三方访问的风险很大.

GoogleDrive(左)和SkyDrive(右)的设置画面。这两种服务都在初期设置就设定为只有上传的用户本人可以阅览这些文件。但一旦改变设置，那么任何人都可以搜索和浏览。

信息有可能会被第三方知晓

因此，如果想和其他人共享保存在云存储的文件，也绝对不能只是简单地公开文件。建议设置指定可以访问的用户，或者设定为只有知道文件链接(URL)的用户才能访问。

选择可信度高的服务

信息泄露的情况除个人的不注意外，还存在着被黑客盗取的风险。这种情况是黑客侵入在线云存储的服务器内，盗取保存的文件。但是大供应商被盗的可能性较小，因为毕竟大型厂商针对服务器具有充分的防范措施，致使黑客无法轻易侵入。

即便成功侵入服务器内，但是想要盗取文件非常难，因为大型供应商采用分布式文件系统(DFS，Distributed File System)(图3)，这种系统可将由多个服务器连接在一起的硬盘驱动器(存储器)整合为一个硬盘驱动器。

为提升处理性能和容错性能(fault-tolerance)分布式文件系统，将文件分割为多个文件，分别保存在多个服务器内，因此很难盗取信息。这是因为即便是特定的服务器的硬盘驱动被盗，也无法将原来的文件进行复原。

与此同时，在线存储用户还担心在线存储服务商会随意使用用户保存的文件。

例如，谷歌公司云存储服务Google Drive等利用规定就有一项规定“该公司拥有使用用户上传文件的权力”，而这项成为热议的话题。关于这一点，谷歌日本法人的答复是“本公司不会随意使用用户非公开的数据(公关部)”。

由于这个系统通过将一个文件分布在多个服务器内进行分布式处理，提高了处理性能和容错性能。由于文件是分布在多个服务器内，因此即便某个特定的服务器内的整个数据被盗，也无法恢复原文件。

不仅仅是谷歌公司，相信其他大型服务商应当不会任意使用用户的数据。如果担心可以选择可以信赖的在线云存储服务商。

保护数据的对策除了“设置文件公开的范围”和“利用可信赖的服务商”之外，另一项对策是对文件进行加密(encryption)处理

将文件加密后保存在云计算上，万一文件泄露也无需担心文件被读取。

将文件加密处理后，即便文件泄露，也无需担心文件被读取。实际上，如果不知道加密密钥(cipher key)，想要恢复原来的文件非常难。如果和多个用户共享文件，那么事先将解码用的密码通知用户即可。

此外，目前有很多加密文件的软件。例如，Office和压缩软件等就具有加密功能。利用这些软件进行加密处理后，会进一步降低文件被泄的危险。

但是，即便是将文件加密处理也无法保证100%的安全，因为攻击者有可能会破译密码。因此，又出现了很多解码工具。为防止解码被破译，重要的是尽量将加密钥的密码设置为复杂的文字。

「Excel」和「Word」等办公软件具有文件的加密密钥功能(左)。Windows XP则支持ZIP文件的加密密钥。此外，Windows 7等可以使用「Lhaplus」()具有加密密钥功能的压缩软件(右)。

云计算时代数据自我防卫术

wangxueyang

相关推荐

近期文章

热门标签