论通信元数据的重要性
最后更新: July 22, 2024
顾名思义,元数据是关于数据的数据。元数据用在多种环境中,通常用于对信息进行编目,例如在视频中标记关键字,以便以后能轻松找到。提到计算机,人们通常首先想到的是“文件元数据”,它包含关于文件何时创建、由谁创建、文件类型等方面的详细信息。您可能在某些时候遇到过此类元数据,例如在电脑上尝试弄清楚某个文件的创建时间,或者在手机上查看您拍摄的某张照片的信息,包括照片使用的光圈和快门速度等无害信息,或者照片拍摄地点等信息。
如果您想更具体地了解文件元数据的原理,新闻自由基金会 (Freedom of the Press Foundation) 深入研究了几个具体示例。
在通信方面,元数据透露的信息尤其多,可能会让第三方(例如执法部门或其他政府实体)即使无法访问该通信也能推断出关于通信内容的详情。本指南讨论的正是这类元数据。
通信元数据基本上是除了通信内容之外的所有数据。可以将元数据想象成电子版的信封。就像信封包含有关寄信人、收信人、消息目的地的信息一样,元数据也是如此。元数据是关于您发送和接收的数字通信的信息。元数据的例子包括:
- 电子邮件的标题行
- 对话的长度
- 对话发生的时间框架
- 通信时您所在的位置(以及和谁通信)

曾经,一些国家(包括美国)的法律对元数据的隐私保护不及通信内容。在很多国家,也许警方通过监听您的通话线路来了解您实际上说了什么并不容易,但如果是获取您上个月给哪些人打过电话的记录就轻松多了。或者,政府机关不需要清除(读取内容可能需要清除的)各种技术或法律障碍,就能购买元数据。
收集或要求访问元数据的一方(例如政府或电信公司)辩称披露(和收集)元数据无关紧要。很不幸,这些说法并非事实。就算是很小的元数据样本也能窥探到一个人的隐私。我们来看看披露元数据实际上对收集它们的政府和企业意味着什么:
- 他们知道您在金门大桥拨打了预防自杀热线。但电话的主题不得而知。
- 他们知道您收到了来自 HIV 检测服务的电子邮件,然后您打电话给医生,然后在不到一个小时的时间里您还访问了一个 HIV 互助团体网站。但他们不知道电子邮件的内容,也不知道您在电话里说了什么。
- 他们知道您收到了来自一个数字权利行动者组织的电子邮件,主题行写着:“告诉国会:KOSA 审查互联网,却不帮助儿童”,然后您马上打电话给您的民意代表。但是这些通信的内容是政府看不到的。
- 他们知道您打电话给妇科医生,聊了半个小时,之后还在当天拨打了当地堕胎诊所的电话。
我们不可能完全拒绝外部收集元数据,因为第三方通常需要元数据来成功连接您的通信。就像邮递员需要看到信封上的内容,才能给您送信,数字通信通常也要标记上来源和目的地。移动通信公司需要大体知道您的手机所处的位置,才能为您接通电话。有些软件(例如 Tor 和 Signal)在尽力减少它们收集的元数据量,但大部分软件并非如此。在网页浏览方面,Encrypted Client Hello 等协议可以隐藏您访问的网站,不让 ISP 或其他偷窥者看到,可能对加强隐私有所帮助。
在法律能对元数据保护以及限制元数据的工具有所作为之前,您能做的就是注意自己通信时传输了哪些元数据、谁可以访问这些信息以及它们可能被用来做什么。