1. 数据的识别
综合《数据安全法》第3条与国家标准《信息技术 词汇 第1部分:基础术语》(GB/T 5271.1-2000)中对数据的定义,数据是指信息的可再解释的形式化表示,以适用于通信、解释或处理,是以电子或者其他方式对信息的记录。
区别于我们常说的“大数据”,后者是规模大大超出传统数据库软件工具能力范围的数据集合,具有数据规模海量、流转快速、类型多样、价值巨大的特征[3],实际其中并非所有数据都属于有价值的“黄金数据”。“数据”和“大数据”概念存在差别,我们在数据合规这一话题中所关注的“数据”,并非专注于大数据的海量与多样,而仍是从数据资源、资产、资本的价值特点出发的, 与此等价值观相结合,再进一步去讨论“大数据”“数据产权”“数据治理”,以及“数据的开放、共享与交易”等等。
企业在这一步识别中起到关键作用,需要研发、业务、技术、档案等各部门配合,主要应整理企业自身控制的、即将处理的“信息”集合,要判断其是否具有价值特点,是否可被视作企业的一种资源、资产以及其价值位阶。现行法律规定对此价值属性方面的界定得尚不够明确,相信未来在数据确权与价值释放阶段的立法会进一步予以落实。对企业来说,在自识别切勿因“信息”集合的量小就忽视,仍需对其有价值者进行分类整理,充分与中介服务机构进行沟通。
2. 重要数据的识别
基础定义识别方面,参照最新的《数据出境安全评估办法》的规定,重要数据指一旦遭到篡改、破坏、泄露或者非法获取、非法利用等,可能危害国家安全、经济运行、社会稳定、公共健康和安全等的数据。
【建议识别依据】目前现行法律对重要数据的识别仅规定至原则层面,更具体的识别判断标准尚需持续关注目前征求意见中的《网络数据安全管理条例(征求意见稿)》和全国信息安全标准委员会的《信息安全技术 重要数据识别指南(征求意见稿)》等重要法规与文件的正式版发布情况。
补充识别依据方面,如涉及一些特殊领域则需要在上述对重要数据的识别基础上再加一层识别标准,如汽车领域可关注2021年10月1日生效的《汽车数据安全管理若干规定(试行)》;金融领域可关注《个人金融信息保护技术规范》(JR/T0171-2020)和《金融数据安全 数据安全分级指南》(JRT 0197-2020);工业和信息化领域,可关注工业和信息化部对《工业和信息化领域数据安全管理办法(试行)(征求意见稿)》征求意见及后续发布内容。此外,还可参照中国网络安全产业联盟(CCIA)数据安全工作委员会2022年5月发布的《数据分类分级实施参考案例集》,对政务、金融、典型、能源、医疗健康、互联网(网络直播和短视频)以及智能网联汽车领域的重要数据及其分级分类思路均有介绍。
3. 个人信息的识别
个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,如姓名、出生日期、身份证件号码、个人生物识别信息、住址、通信通讯联系方式、通信记录和内容、账号密码、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息、交易信息等。《信息安全技术-个人信息安全规范(GB/T 35273-2020)》以列举的方式确定了个人基本资料、个人身份信息、网络身份标识信息、个人通信信息、联系人信息、个人上网信息、个人常用设备信息、个人位置信息等均属于个人信息。
我们可以通过可识别性、关联性两个角度来对个人信息进行识别:从可识别性角度来看,从信息到个人,由信息本身的特殊性能够识别出特定自然人,个人信息应有助于识别出特定个人,则该信息属于个人信息;从关联性角度来看,从个人到信息,如已知特定自然人,由该特定自然人在其活动中产生的信息(如个人位置信息、个人通话记录、个人浏览记录等)即为个人信息。
【建议识别依据】可参考《信息安全技术 个人信息安全规范》(GB/T 35273—2020)及其附录,同时可结合行业同步参考重要数据识别中的“补充识别依据”。
4. 敏感个人信息的识别
敏感个人信息(或称“个人敏感信息”)是指一旦泄露或者非法使用,容易导致自然人的人格尊严受到侵害或者人身、财产安全受到危害的个人信息,包括生物识别、宗教信仰、特定身份、医疗健康、金融账户、行踪轨迹等信息,以及不满十四周岁未成年人的个人信息。
从信息主体和信息性质角度来看,通常情况下14岁以下(含)儿童的个人信息和自然人的隐私信息属于敏感个人信息;从信息泄露、非法提供或滥用可能导致的后果角度来看,为了便于识别,可以区分不同情形判定:
(1)泄露:一旦泄露将导致个人信息主体及收集、使用个人信息的组织和机构丧失对个人信息的控制能力,造成个人信息扩散范围和用途的不可控的信息,和被以违背个人信息主体意愿的方式直接使用或与其他信息进行关联分析,可能对个人信息主体权益带来重大风险的信息,属于敏感个人信息。
(2)非法提供:超出个人信息主体授权同意的范围外扩散,可对该主体权益带来重大风险,属于敏感个人信息。例如,性取向、存款信息、传染病史等。
(3)滥用:被超出授权合理界限时使用(如变更处理目的、扩大处理范围等),可能对个人信息主体权益带来重大风险,应判定为敏感个人信息。例如,在未取得个人信息主体授权时,将健康信息用于保险公司营销和确定个体保费高低。
【建议识别依据】可参考《信息安全技术 个人信息安全规范》(GB/T 35273—2020)第3.2条及其附录B的示例,同时可结合行业同步参考重要数据识别中的“补充识别依据”。
5. 必要个人信息的识别
考虑到个人信息收集需遵循最小必要原则,从个人信息收集者是否有必要收集相应个人信息的角度,仍需要区分出必要个人信息、非必要个人信息。这一分类目前适用较为广泛的属App相关的场景。
必要个人信息,是指保障App基本功能服务正常运行所必需的个人信息,缺少该信息App即无法实现基本功能服务,具体是指消费侧用户个人信息,不包括服务供给侧用户个人信息。App不得因为用户不同意提供非必要个人信息,而拒绝用户使用其基本功能服务。
对必要个人信息的区分要求及对应的主要识别依据均出自App适用的规定及国家标准,但《移动互联网应用程序APP收集个人信息基本要求》(GB/T 41391-2022)中将小程序也定义为移动互联网应用程序的一种,《移动互联网应用程序信息服务管理规定(2022)》中将移动互联网应用程序定义为是指运行在移动智能终端上向用户提供信息服务的应用软件。基于当前定义实质范围较大,笔者认为非基于App提供服务的网站、软件、小程序等,对App适用的通行规定仍有参考借鉴的意义,仍有必要按照产品/服务的功能逐项区分所需的“必要个人信息”与“非必要个人信息”。
【建议识别依据】可参考国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合制定的《常见类型移动互联网应用程序必要个人信息范围规定》、全国信息安全标准委员会发布的《网络安全实践指南——移动互联网应用基本业务功能必要信息规范V1.0-201906(TC260-PG-20191A)》。