下面是小编为大家整理的关于大数据知识产权司法保护的调研报告(法院),供大家参考。
关于大数据知识产权司法保护的调研报告(法院)
一、大数据知识产权司法保护概述
1、引言
随着智能信息技术的不断发展,数据已经成为一种新的商业资本和一项重要的经济投入,可以为人类创造出新的经济利益和商业价值。大数据(Bigdata)作为无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要通过新处理模式才能成为具有更强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,俨然成为了人类历史上的又一次信息革命,人类的生活方式、价值体系与社会模式也因此发生了重大的改变。xxxx年,美国麦肯锡公司发布的报告中显示,各国政府已经逐渐将大数据的发展上升到了国家战略的层面,包括美国政府的“大数据研究发展创新计划”(BigDataR&DInitiative)、欧盟“欧盟数字化议程和挑战”(TheDigitalAgendaforEuropeandChallengesforxxxx)、日本发布的“活跃ICT日本”综合战略以及澳大利亚和韩国发布的“公共服务大数据战略”等各种大数据国家战略,这标志着大数据的研发及产业应用已经引起了各国政府的重视,全球的“大数据”时代已经到来。全球领先的咨询分析机构Wikibon于xxxx年x月发布的《大数据企业营收和市场预测(xxxx-xxxx)》报告显示,xxxx年全球大数据企业(软件、硬件及服务)营业收入为xxx亿美元,同比增长xx%;xxxx年全球大数据市场增长速度达到xx%,总体规模为xxx亿美元;到xxxx年,全球大数据市场收入将达到xxx亿美元,这意味着从xxxx年起连续x年年复合增长率达xx%。中国市场情报中心有关统计显示,xxxx年中国大数据市场规模为x.x亿元,同比增长xx.x%。到xxxx年,中国大数据市场规模将达到xx.x亿元。
xxxx年x月,我国国务院印发《促进大数据发展行动纲要》,力图全面推进大数据的发展和应用,将我国建设成为数据强国。xxxx年x月xx日,工业和信息化部发布《大数据产业发展规划(xxxx-xxxx年)》,该规划以强化大数据产业创新发展能力为核心,明确了强化大数据技术产品研发、深化工业大数据创新应用、促进行业大数据应用发展、加快大数据产业主体培育、推进大数据标准体系建设、完善大数据产业支撑体系、提升大数据安全保障能力等x项任务,明确了“十三五”时期大数据产业的发展思路、原则和目标,将引导我国大数据产业持续健康发展。
大数据系统和大数据产业给人类生活带来了诸多的益处,但随着智能信息技术的不断深入和创新,数据也呈现出日益庞大、类型愈加复杂的趋势。知识产权领域呈现资源急速增长且数据量庞大的特点,在此种情境下,为保障数据产业的发展,保护大数据集合表现形式及其实质内容的价值,究竟该如何基于法自身的价值追求扮演社会规范的角色,运用知识产权相关法律制度来为大数据提供恰当的司法保护,实现大数据与知识产权法律制度的平衡,探究出新的数据知识产权保护模式,是一个值得探讨的问题。
2、大数据与知识产权法律制度的交叉
基于数据本身的可复制传播性和可重复利用性等特点,致使其客观上与知识产权有着千丝万缕的联系。在知识产权法域内而言,其应当是具有财产价值的排他性权利而产生的法律关系。虽然有些大数据产业中的原始数据并是否知识产权法律制度中保护的客体有待厘清,但是如经过相关主体利用技术开发或智力创造加工后转化成为一种新的分析数据或者汇编集合,赋予其一定的独创性,应当视为可以受到法律保护的知识产品。具体而言,与大数据相关的主要知识产权应当包括数据信息的著作权、相关商业模式及操控分析数据的专利权、经由数据转化成为数据产品的商标权以及含有技术信息或经营信息中的商业秘密等。因此,我国知识产权法律体系中的著作权法、专利法和反不正当竞争法均可在一定程度上为大数据信息和大数据产业提供相关的法律保护。在适应新技术革命的基础之上,充分发挥司法保护知识产权的主导作用,从而真正地做到协调与平衡技术创新激励与个人权利的保护之间的关系。
3、知识产权制度对大数据信息和产业的司法保护概况
鉴于大数据集合的复制成本低廉的特征,围绕着大数据的产生和取得方式以及运用和维护的过程,现行知识产权司法保护制度充分发挥着其明确创新权属、协调大数据创新成果各主体利益分配机制的作用。
就数据本身而言,因其难以满足著作权法中关于“具有独创性并能以某种有形形式复制的智力成果”的规定,而难以通过著作权法进行保护。但“数据”的集合往往在其选择或者编排中具有独创性,由此可以通过著作权法中的汇编作品予以保护。世界贸易组织、世界知识产权组织、《伯尔尼公约》以及TRIPS协议都已经明确规定可以将数据信息作为汇编作品予以保护,我国《著作权法》也做出了类似规定。对于大数据信息而言,不为公众所知悉且能为经营者获得利益或者竞争优势、具有潜在商业利益的信息可以归入属于该公司的技术信息或经营信息,可以作为商业秘密通过反不正当竞争法予以保护。我国《反不正当竞争法》第二章第十条明确规定了三种不得采用的手段侵犯商业秘密的行为。由于我国对不正当竞争行为的界定是以举例加概括的形式,因此有些难以成为商业秘密的数据信息还可以通过反不正当竞争法中的一般性条例进行保护。
大数据产业和技术的意义和价值不仅仅在于掌握庞大的数据信息本身,更体现在对具有意义的数据进行专业化的处理,从而实现数据的赋值、增值和价值显现。大数据通过挖掘、整理、计算等方式进行加工之后形成的特定算法或是计算机软件工具,以及通过软硬件与网络结合的系统解决一定的技术问题,此类具备鲜明技术属性的可以通过申请方法专利的方式进行保护。
4、知识产权司法保护对大数据的促进意义
虽然我国现行的知识产权制度实行的是“双轨制”保护模式,即权利人可以通过知识产权行政主管机关主张权益保护,同时也可以通过法院诉讼的方式来维护自身合法权益,但由于知识产权保护的客体作为一种私权以及司法制度本身的制度优势,决定了司法保护知识产权是维护相关权益重要的的方式。
随着互联网、物联网等现代网络技术的发展,大数据作为能够广泛带动各行业向信息化、智能化、网络化发展的力量,已然成了企业,乃至国家的核心竞争力。将符合知识产权特征的数据纳入知识产权体系,建立相关完善的知识产权数据保护模式,运用知识产权司法保护为大数据产业的发展保驾护航,保障数据产业的发展,能够形成一个良性的产业生态圈,促进社会经济的发展。
二、大数据司法实践中的现状
我国司法实践中有关大数据的案例按照案由来分类主要有以下几种类型:
1、民事案件
(1)隐私权纠纷
①原告xx与被告xx奇虎科技有限公司隐私权纠纷案。本案中,原告的手机号被被告的xxx手机卫士安卓版标记为“xx网络信息有限公司(xx分公)”,被人怀疑为骗子。法院经审理认为,被告出示的证据可以证明原告所使用的号码已经在企业黄页被公开披露,原告在工商行政管理机关登记企业信息时亦将该手机号码予以登记,以备信息查阅,被告通过大数据比对功能,确定该手机号码与浙江维特网络信息有限公司合肥分公司相对应并进行标记,其信息并无错误,且软件标记的企业信息,而非公民个人信息,且庭审过程中显示原告手机号已再无此标记,法院最终认定被告不构成侵权。
②原告xx被告xx百度网讯科技有限公司隐私权纠纷案。原告认为被告利用网络技术,未经原告的知情和选择记录和跟踪了原告所搜索的关键词,将原告的兴趣爱好、生活学习工作特点等显露在相关网站上,并利用记录的关键词,对原告浏览的网页进行广告投放,侵害了原告的隐私权。一审法院经审理认为,被告未经原告同意通过cookie技术收集和利用原告搜索信息,并根据原告的上网信息在被告合作网站上展示与原告上网信息有一定关联的推广内容,进一步利用了他人隐私进行商业活动,且该利用并非cookie技术使用的必然结果,已经构成侵犯他人的隐私权。二审法院经审理认为,网络用户通过使用搜索引擎形成的检索关键词记录,虽然反映了网络用户的网络活动轨迹及上网偏好,具有隐私属性,但这种网络活动轨迹及上网偏好一旦与网络用户身份相分离,便无法确定具体的信息归属主体,不再属于个人信息范畴;被告利用网络技术通过百度联盟合作网站提供个性化推荐服务,其检索关键词海量数据库以及大数据算法均在计算机系统内部操作,并未直接将被告因提供搜索引擎服务而产生的海量数据库和cookie信息向第三方或公众展示,没有任何的公开行为,不构成侵权。
(2)名誉权纠纷
原告xx携银在线网络科技有限公司诉被告大公信用数据有限公司、大公国际资信评估有限公司名誉权纠纷案。本案中,被告根据其收集整理的PxP网络借贷企业信用数据在大公资信上发布有关原告携银网的相关不利信息,原告认为构成侵权。法院经审理认为,根据被告大公数据对原告平台的持续跟踪监测,发布的报告涉及的事实基本属实,不构成侵权。
1、知产案件
(1)著作权纠纷
①原告xx网数据有限公司诉被告xx网国际网络传讯有限公司侵犯著作权纠纷。法院经审理认为,只要图表所表达的内容能体现制表人员独自的判断则该图表就具有独创性。本案中,正是因为原告带有主观性的差值填补、季节调整才使图表中某些“点&”的位置的安排体现了与其他公司所制作的图表的区别。横纵坐标轴刻度的选择,虽然受制于此类图表的特点,无论何人绘制,曲线走势图的大体走向可能会相似,但是因为坐标轴刻度选择上的主观性,使整个图表的形态会因绘制者不同的判断而呈现出区别。颜色背景的选择,虽与数据无关,但却亦属于绘图者针对其所绘制图表的美感所做的选择。因而本案所争议的曲线走势图图表具有独创性。故而被告在其网页上使用了原告网页上的“xx宏观经济预警信号&”图表xx幅,“xx景气动向&”、“xx先行合成指数&”等曲线走势图xx幅,构成著作权侵权。
②原告xxxx信息咨询有限公司诉被告xx搜狐互联网信息服务有限公司侵犯著作权纠纷案。法院经审理认为,原告大众点评网以及《xx餐馆指南》、《xx餐馆指南》二书所载涉案xx家餐馆商户简介中的引号内文字系由原告选摘自网友上传于大众点评网的关于各地餐馆的评论,引号内文字均系简单的日常用语,因并非具有独创性的文字表达而不能成为著作权法所保护之作品,因而原告将该些文字融入到对餐馆的简介中不需要获得用户的许可,原告对涉案餐馆所做的商户简介具有独创性,可以成为著作权法所保护的作品,原告对涉案xx家餐馆商户简介享有著作权。
③原告xx信息有限公司诉被告xx软件科技有限公司著作权纠纷案。法院经审理认为,原告对国家商标局商标公告中的商标信息内容进行提取、分类和整理,并对商标标志中所含的文字、数字等进行进一步提取和整理,同时还对商标信息后续的变更情况进行汇总,加入自定义的字段信息等。原告对商标数据的编排和整理体现出独创性,涉案数据库构成汇编作品原告对此享有著作权,可受著作权法保护。由于被告数据库中存在多个含有原告暗记的商标标志,在被告不能证明前述数据来源于其他地方的情况下,可以认定被告实施了复制原告数据库多个商标的数据的行为。
(2)不正当竞争纠纷
①原告xx阳光数据公司与被告xx霸才数据信息有限公司技术合同、不正当竞争纠纷一案。法院经审理认为,《SIC实时金融》信息作为一种新型的电子信息产品,应属电子数据库,在本质上是特定金融数据的汇编,这种汇编在数据的编排和选择上并无著作权法所要求的独创性,不构成著作权法意义上的作品,不受著作权法的保护。但原告作为特定金融数据的汇编者,对数据的收集、编排,即对《SIC实时金融》信息电子数据库的开发制作付出了投资,承担了投资风险。该电子数据库的经济价值在于数据信息的即时性,原告正是通过向公众实时传输该电子数据库的全部或部分内容而获取收益,原告对于该电子数据库的投资及由此而产生的正当利益,应当受到法律保护。被告未经原告许可,其行为违反了经营者在市场交易中应当遵循的诚实信用原则和公认的商业道德,损害了原告的合法权益,已构成不正当竞争。
②原告xx汉涛公司诉被告xx爱帮公司不正当竞争案。法院经审理认为,大众点评网的商户简介和用户点评,是原告搜集、整理和运用商业方法吸引用户注册而来。原告为此付出了人力、财力、物力和时间等经营成本,由此产生的利益应受法律保护。对于大众点评网的商户简介和用户点评,虽然被告爱帮网注有“在大众点评发表”字样和链接标识,但爱帮网已对全部商户简介内容和绝大部分点评内容进行了充分展示,网络用户一般不会再选择点击大众点评链接标识。因此,爱帮网的商户简介和用户点评已经构成对大众点评网相应内容的实质性替代,必将不合理的损害汉涛公司的商业利益。被告的这一经营模式违反公平原则和诚实信用原则,违反公认的商业道德,构成不正当竞争。
③原告xx集奥聚合科技有限公司诉被告xx、xx青稞厚成科技有限公司不正当竞争纠纷案。法院经审理认为,大数据系互联网技术高速发展的产物,表现为通过网络技术无差异地收集网络用户上网信息,根据需要对数据进行整理、挖掘和分析,形成一定的数据库,用以投放广告或者其他用途。原告与青稞公司均从事大数据服务,向客户提供精准广告服务,二者间具有竞争关系,刘国清将其技术资历作为公司的业绩向投资人进行广告宣传,故刘国清的行为显然违背了其对原告应负的竞业禁止义务,损害了原告的权益。青稞公司在知晓刘国清的竞业禁止义务情况下,接受刘国清出资并聘任其担任公司的首席技术官,从事与原告相同业务,该行为违反了公认的商业道德及诚实信用原则,损害了原告的合法权益,应承担赔偿责任。
④原告xxxx天下技术有限公司等与被告xx微梦创科网络技术有限公司不正当竞争纠纷案。法院经审理认为,xx技术公司、xx科技公司并没有基于《开发者协议》在取得用户同意的情况下读取非脉脉用户的新浪微博信息,其获取前述信息的行为没有充分尊重《开发者协议》的内容,未能尊重用户的知情权及自由选择权,一定程度上破坏了OpenAPI合作开发模式,违背了在OpenAPI开发合作模式中,第三方通过OpenAPI获取用户信息时应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则,违反了诚实信用原则和互联网中的商业道德;同时xx技术公司、xx科技公司未经新浪微博用户的同意及新浪微博的授权,获取、使用脉脉用户手机通讯录中非脉脉用户联系人与新浪微博用户对应关系的行为,违反了诚实信用原则及公认的商业道德,破坏了OpenAPI的运行规则,构成不正当竞争行为。
⑤原告xx钢联电子商务股份有限公司与被告xx钢铁电子商务有限公司不正当竞争纠纷案。法院经审理认为,原告通过组建资讯团队形成的钢铁行业内完整的钢材、特钢、炉料等各项数据库的数据信息系原告付出大量劳动所获得,该数据信息能够为原告带来利益,体现了原告的竞争优势,故原告对其数据信息享有合法权益。两被告关于原告的数据信息是市场公开的信息,不具有独创性的抗辩意见缺乏事实和法律依据,不予采信。
⑥原告xx万联网络技术有限公司诉被告xx等侵害商业秘密纠纷案。法院经审理认为,原告主张保护的“BOX网络游戏社区”网站数据库中的用户信息,能为原告带来经济利益且具有实用性,且该xx多万个注册用户名、注册密码和注册时间等信息不易为相关领域人员普遍知悉和容易获得,且原告对上述信息采取了保密措施,故上述信息符合商业秘密的构成要件,是原告拥有的商业秘密,依法应受法律保护。
(3)技术服务合同纠纷
原告xxx信息网络有限公司与被告xx指数有限公司合同纠纷案。法院经审理认为,被告未经原告许可与新加坡交易所共同开发上市了中国Axx指数期货,在此过程中被告虽未将xx证券交易所实时股票行情直接提供给他人使用,但中国Axx指数期货的基础即是其编制的中国Axx指数,其成份股包含了在xx证券交易所上市的xx种股票,被告根据这些实时股票行情和xx证券交易所的xx种实时股票行情编制了动态的、即时的中国Axx指数,故被告开发、上市中国Axx指数期货的行为,实质就是利用原告按约提供的上证所实时股票行情开发了衍生产品,该种行为显属违反合同约定。
表一:涉大数据案件的类型分布图
上述案件涉及到民事和知识产权领域,我们之所以将民事案件纳入到案例中,是因为这类案件对我们研究大数据企业的商业模式存在重要作用,有助于理清行业存在的一些问题。大数据目前仍属于一种新兴事物,IBM对大数据给出了xV特征即:大数据量(Volume)、快速变化(Velocity)、内容庞杂(Variety)和(不)精确性(Veracity)。也正因为大数据拥有的该些属性,导致大数据作为一个事物目前在我国法上找不到对应的权利类型。大数据从其产生、收集到整合、利用,各个阶段都有可能产生法律纠纷。目前司法实践中涉及到大数据的案例除却隐私权、名誉权等民事案件外,知产领域主要是著作权、不正当竞争、技术服务合同领域。
三、现有知识产权法律框架下对大数据的保护
大数据的基本处理流程包括采集、存储、分析和结果呈现等环节。采集到的数据对存在语义模糊、数据缺失等问题而无法直接使用,所以该环节还应包括数据的预处理。存储数据的同时亦进行着数据管理,经分析和处理所得数据成果需通过应用而发挥其最终价值。因此,可以将数据的处理流程大概划分为数据采集与预处理、数据存储和管理、数据处理与分析、数据成果呈现与应用四个阶段。在当下现实语境下谈及大数据并非仅是数据本身,而是指数据和大数据技术的综合。
在现有知识产权法律法规框架内,可以通过著作权法、专利法以及反不正当竞争法对大数据及其成果进行保护。根据数据处理流程和阶段的不同,对数据以及数据成果的保护路径又各有所偏重。
1、数据采集与预处理阶段的保护
该阶段涉及数据的取得、汇总以及初步的筛选工作,该阶段中采集到的数据内容大多可以通过著作权法予以保护,但是其中包含的一些来源于客观的信息或是用户的网络留痕数据不符合著作权法所要求的独创性要件,因难以通过著作权法进行保护。
该阶段数据中的以文字、图片和视频等形态呈现的内容可以通过著作权法予以保护。司法实践中较为常见的有以下三类:第一类,软硬件服务商自行收集、整理后上传至自有平台的数据,比如某门户网站房产频道中关于某楼盘的介绍性文字和图片;第二类,网络媒体自行或委托创作以及经授权可以使用的资讯类内容,比如新闻资讯类网站中资讯新闻;第三类,网络用户自行制作和提供的内容,比如社交平台中用户发布的文字、图片以及视频、电商网站中的用户评价、旅游网站中旅友的游记。受著作权保护的前提条件是具有一定的独创性能够构成著作权法意义上的作品。在这三类数据内容具有一定的独创性能够构成著作权法意义上的作品的情况下,即可以通过著作权法予以保护。
在司法实践中,第二类的资讯类内容通过著作权法进行保护的难度不大,但是第一类和第三类数据类型想要通过著作权法进行保护,不仅要满足构成作品的前提条件,还需要确认其权利归属情况。尤其是在第三种数据类型中,数据内容的产生基于用户自行制作和提供,平台商对该部分数据享有何种权利或者权益,在数据赋权仍未在法律层面进行确认的情况下,平台商以何种身份维权、主张对该种数据内容享有何种权利,仍是司法实务中的一个难点问题。从另一方面而言,采集数据同样不能侵犯他人的权利,不仅包括不侵犯他人的著作权,同样包括不侵犯他人的商业秘密以及不违反网络爬虫类“君子协定”。其中商业秘密以及“君子协定”所涉及的诚实信用以及商业道德原则将在下文加以详细阐述。
2、数据存储和管理阶段的保护
对于收集来的海量的结构化和非结构化数据,需要运用手段和技术对其进行存储和管理,在该阶段中多涉及数据的集合和汇总,比如数据库、数据仓库、云数据库等。该部分内容也可以通过著作权法予以保护。
《伯尔尼公约》明确将数据信息作为汇编作品予以保护,《与贸易有关的知识产权协议》第xx条第x款规定:“数据或者其他材料的汇编,无论采用机器可读形式还是其他形式,只要其内容的选择或安排构成智力创作,就应该给予保护。”我国《著作权法》第十四条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”在数据的存储和管理阶段中形成的数据库如果在内容的选择或者编排上体现出了一定的独创性,即可以将该数据库作为汇编作品通过著作权法予以保护。前述xx信息有限公司诉xx软件科技有限公司著作权纠纷案法院即认定了原告对商标数据的编排构成汇编作品。
大数据要在著作权法上获得保护,首先需要满足独创性的要求,但现实中多数数据来源于客观事实,数据的收集也多来自公开领域,基于某些用户的使用习惯或是行业惯例,收集到的数据信息可能无法给予数据采集者太多的个人创作空间,对于那些缺乏独创性的数据集合则无法通过著作权给予保护。由此,如何界定某一数据集合是否具有一定的独创性也成为通过著作权对其进行保护的一个难点。需要着重指出的是,著作权保护的是数据的选择或编排方法,而非数据选择或编排的内容,对于大数据而言他人可轻易改变编排方法,但实质性内容可能一致,该种情况下对于大数据本身的保护也是一个难题。
3、数据处理与分析阶段的保护
对庞大数据集合进行处理和分析从而得到具有应用价值的数据或者数据产品。在此阶段数据的价值得到了巨大程度的提升,具有商业价值的数据可以通过商业秘密予以保护,为分析处理数据所使用的方法可以通过方法专利予以保护。
通过数据处理和分析获得的数据成果一般都具有相当的经济价值,由此该类数据成果的实用性要件不难满足,在司法实践中该类数据成果的秘密性和保密性是论证其构成商业秘密的难点。前述xx阳光数据公司与xx霸才数据信息有限公司技术合同、不正当竞争纠纷案中法院认定原告阳光公司的《SIC实时金融》数据分析格式符合商业秘密的构成要件。本案中涉及了两种常见的与数据资产相关的商业模式——租售数据模式与租售信息模式。租售数据模式是指售卖或者出租广泛收集、精心过滤、时效性强的数据。。而信息与数据不同,是指经过加工处理,承载一定行业特征数据集合。
上述案例中,阳光公司的上游权利人——向其有偿出售行情数据的商品交易所和证券公司采用的就是租售数据的模式。该种模式中,经营者通常掌握大量的客户数据,而这类数据最为显著的特征是实时性,经营者在租售数据前通常已经完成对数据的预处理。租售数据模式的另一种形式表现为掌握数据的公司利用数据为客户提供增值服务,如销售导航仪的公司,同时为客户提供即时交通信息服务。租售数据的商业模式同时催生出专业的数据交易平台,如贵阳大数据交易所等。由于经营者尚未对这些数据进行分析处理,权利人也通常不会对其采取保密措施,所以此时的数据无法通过商业秘密予以保护,且若数据本身无法构成著作权法意义上的作品,权利人也不能通过著作权法寻求保护。故而,对此类数据往往只能通过双方之间的合同条款加以保护,或通过《反不正当竞争法》第二条所规定的一般的诚实信用或商业道德加以约束。与实时性的数据不同,法院认定阳光公司将从交易所处获取的单个的、分散的行情信息源进行统一编排、加工整理,形成了再生信息源性质的综合行情信息,并认为此类信息具有较强的实用性和价值性。阳光公司所采用的即为租售信息模式,其特点是权利人对收集而来的数据进行深度整合萃取,并通过庞大的数据中心及专用渠道加以传播。与原始数据不同,此时的信息往往经过深入的整合和处理,因而更容易满足商业秘密的构成要件,进而通过商业秘密的方式加以保护。
专业化处理实现使数据“赋值”和“增值”,专业化处理过程中所使用的挖掘、整理、计算等方式方法可以形成特定的算法,甚至是计算机软件工具,再通过软硬件以及与互联网的结合可以解决一定的技术问题,这些都具备鲜明的技术属性,可以将其划归到计算机程序的发明专利之列,通过申请方法专利予以保护。但是,专利权产生不同于著作权的自动产生,要求具有相当的新颖性且需要通过行政机关的审查才能取得,所以作为专利权进行保护的前提即为专利权的获得。目前,我国关于专利权的审查标准相对严格,是否能够顺利通过审查取得专利权亦成为是否能够获得知识产权保护先决性条件。
4、数据成果呈现与应用阶段的保护
数据成果呈现与应用是数据处理流程中的最后一个环节,也是数据“赋值”后数据价值的变现阶段,该阶段不仅会将较为抽象的数据转化为相对具象的成果,更会将该具象成果与具体的商业活动相结合,促使数据成果商业利益的最大化。
从数据处理与分析到数据成果呈现与应用,这一过程不仅需要投入大量的时间,更需要投入大量的人力和物力,这其中离不开开发人员的大量智力性投入。从现有情况来看,数据成果的具象化多以应用软件的形式出现,而该种类型软件的开发和运行均依托于大量相关数据的收集和分析,这一点有别于传统的应用软件。现阶段开发的一些具有人机交互功能的软件即属于这种类型,比如微软公司开发的人工智能软硬件“小冰”、亚马逊开发的智能音箱以 当前隐藏内容免费查看及还在研发完善阶段的无人驾驶技术。该类数据成果的具象化如果以软件的形式存在则可以通过软件著作权予以保护。涉软件案件的审理过程中,关于软件的比对往往是案件审理的重点和难点,加之大量开源软件的存在,如何在软件开发过程中的自由再发布原则与软件著作权作为一种绝对性权利予以保护之间进行平衡,这对通过软件著作权保护数据成果提出了挑战、增加了难度。
在数据呈现与应用阶段还可能将数据成果通过构架运营某种商业模式的方式进行应用。在现有法律法规框架下,商业模式暂时还无法在整体上通过知识产权进行保护,但这并不影响将该商业模式内的某些构成要素通过知识产权进行保护。
在四个数据处理阶段中还会产生一些无法通过特别法进行保护的内容,例如违反爬虫协议的君子协定或者开放接口协议等采集数据等行为,该部分内容的保护可以通过《反不正当竞争法》第二条的遵循诚实信用和公认的商业道德原则予以保护。前述xx汉涛公司诉被告爱帮公司不正当竞争纠纷案中,即通过认定爱帮公司的经营模式有违公平和诚实信用原则,有违公认的商业道德构成不正当竞争,对大众点评网中的内容予以知识产权法意义上的保护。
四、大数据类知识产权案件疑难问题分析
大数据类知识产权案件中可能涉及知识产权问题相对其他案件更加全面,在大数据采集、应用、交易、保护等多个阶段均可能涉及个人信息保护、著作权保护(含软件著作权保护)、方法专利的保护、商业秘密保护及不正当竞争的保护,还有可能受到《反垄断法》的调整等,有时更是多个问题的融合。其中个人信息由于属于《网络安全法》、《侵权责任法》的调整范围,不在本章关于知识产权的讨论内进行探讨。
(一)著作权的保护
依据著作权法基本理论,思想与表达二分法是区分某一客体能否成为著作权法上保护客体的方法,因此,有观点认为UGC(UserGeneratedContent)即用户提供的内容,如某些评价等可以作为著作权法中的“作品”而受到著作权法的保护,但某一用户提供的单一内容并不能构成“大数据”,认识此类数据时,应全面考虑用户提供的内容,因在平台获取相关数据时无法确认其创作者的真实性,故整体去认知相关内容能否成为大数据还应有所区分。此类问题在实践中较易区分,基本的著作权法理论即可成为指导。因此,从著作权法角度保护的大数据内容,疑难问题体现在一是对数据库的保护,二是对使用软件进行数据采集时,软件著作权法的保护。
1、数据库的著作权法保护
著作权法保护与反不正当竞争法保护是目前两种主要的数据库保护模式。司法实践中选择著作权法进行保护的案例相对较多,数据库的保护在国际上法律依据已经明确:《Trips协议》第xx条第x款规定“数据或其他材料的汇编,无论采用机器可读形式还是其他形式,只要其内容的选择或安排构成智力创作,即应予以保护。这类不延及数据或材料本身的保护,不得损害数据或材料本身已有的版权。”《世界知识产权组织版权条约》第x条也明确规定“数据或其他资料的汇编,无论采用任何形式,只要由于其内容的选择或排列构成智力创作,其本身即受到保护。这种保护不延及数据或资料本身,亦不损害汇编中的数据或资料已存在的任何版权。”因此,数据库的著作权法保护是基于汇编作品产生的,其独创性体现应在于数据的选择、编排,数据库的体系和结构等,而不是对数据本身的保护。
2、大数据软件的著作权法保护
大数据软件可能遭受的侵权行为表现为:一是抄袭行为,即大数据软件作品源代码直接雷同,二是第三方恶意修改大数据软件作品,对大数据软件服务进行屏蔽、修改界面等。此类案件中,通常涉及如下问题:
一是技术中立抗辩,即软件提供了某种技术,技术不侵权,从而软件不侵权的抗辩逻辑。而该问题的实质是软件是提供数据还是提供技术,目前,多数情况下,提供行为指向的客体是混同的,因此能够使用技术中立进行抗辩的情况愈来愈少,只有单纯的技术才可能不被苛责。
二是实质性相似的判断,司法实践中两款软件的比对常成为案件难点。从我国法院关于软件作品实质性相似的侵权判决,包括其他类型作品的实质性相似的侵权判决,基本上是参照作品架构、语言风格、表达形式等要素,综合性地考虑是否构成实质性相似。具体操作方法借鉴了美国法院三步检验法:即抽象——过滤——对比法。
(二)方法专利在大数据保护的构成要素分析
方法专利对于大数据的保护体现在两方面,一种是数据挖掘中,数据挖掘专利就是指对数据挖掘开发者或委托开发人对数据挖掘技术,或对数据挖掘获取的信息向国家审批机关申请专利,经依法审查合格后获取的专有权;或者说,数据挖掘专利是指对数据进行处理,并获取有益知识的计算机技术的专用权。其本质是一种计算机程序的方法发明,对于涉及计算机程序的专利能否获得专利权的授权在实践中存在较大争议,其实质是对于算法能否受到专利法保护的争论。美国法院在判例中认为:即使申请涉及的系统包含了计算机程序,只要该程序通过一系列数学计算产生了实用和有形的技术效果,仍然可被授予专利权。我国目前对此区分两种情况予以处理:如果仅仅利用计算机程序实现了某种数学计算方法和规则,无法被授予专利权,也就是说在对数据进行挖掘之时,只是利用数据编写了一套体现某种智力活动的规则和方法的程序,不能构成方法发明;如果计算机程序的执行是一种正确利用自然规律的技术手段,并且能够解决具体的技术问题,例如通过数据规律的概括使某种程序可以自然读取某人的身份信息,则该程序属于技术方案或其组成部分,应当受到专利法的保护。
另一种方法专利是涉及商业方法的专利,例如收集、统计用户信息的方法、金融机构交易数据分析方法等等,此类方法究竟属于“智力活动的规则和方法”还是属于可授权的专利,存在较大争议,美国等国家已承认商业方法在一定条件下可以被授予专利权,但判断标准尚未统一。今年x月x日起实施的《专利审查指南》将专利保护范围扩展至含有技术特征的商业模式、商业方法,对于随着网络发展不断创新出的商业模式和商业方法的维权具有重要意义。
(三)《反不正当竞争法》在大数据类案件中的保护
1、数据库的反不正当竞争法保护
上文讨论了对数据库的著作权法保护,但著作权法理论仅仅对独创性的选择和编排进行保护,并非针对数据库中的具体内容,而数据库中的内容确是真正具有经济价值的产物,因此作为著作权法的补充,反不正当竞争法对数据库进行了进一步的保护。同时,对于难以成为“汇编作品”的数据库,《反不正当竞争法》也可达到使“智力投入”得到保护的效果。制作人对数据库投入了大量资金、劳动,只要竞争者利用了数据库中的数据,可认定竞争者的行为违反了《反不正当竞争法》规定的诚实信用、公平等基本竞争原则,构成第x条第x款意义上的不正当竞争行为。同时,如数据库符合商业秘密的条件,也可作为商业秘密进行保护。
2、商业秘密的保护
我国《反不正当竞争法》中对商业秘密的定义为不为公众知悉、能为权利人带来经济利益、具有实用性并经过权利人采取保密措施的技术信息和经营信息。因此,能够受到反不正当竞争法保护的商业秘密类数据不包含为公众可见的用户点评等数据信息。调研中多数企业对自己的数据采取了技术措施以商业秘密的形式予以保护,而第三方以不正当手段获取、使用商业秘密的行为大量存在,在寻求法律保护此类数据时难点是举证,原告不仅要对哪些数据构成其商业秘密进行举证,还应对其使用了某种技术保护措施进行保护进行举证,同时要对侵权方的不当手段进行举证。
上述对于数据的不正当竞争法角度的保护,主要来源于反不正当竞争法的基本原则,即维护竞争者之间地位平等,遵循公平、诚实信用的基本原则,从知识产权促进竞争的反面为限制不当竞争提供了法律保障。
(四)数据的垄断和排他
对于无形的数据进行权利界定,其规制对象智力成果均属于无形资产的范畴,单个数据本身的价值难以通过知识产权相关规定予以保护和规制,但是数据的分析和挖掘价值却可以通过知识产权的保护进行方方面面的规制。那么某一数据主体通过数据采集得到的数据能否成为其垄断资源。调研中,我们发现,目前已经出现的数据寡头与数据联盟之间的矛盾已渐现端倪。数据寡头利用其多平台的特点,收集大量数据进行相应的分析,在数据的采集、运用上享有了当然的话语权,但这种垄断地位不应是数据本身的性质,大数据的技术本身应当具有非排他性,即任何一个经过投入的主体,在对数据的采集和利用过程中均可以通过大数据的技术手段对数据加以一定形式的利用。
五、大数据司法保护的价值性判断
由于海量数据的存储和复制,多借助于互联网的分发和获得,在此过程中存在包括提供电信接入服务、支付服务、浏览器服务,内容服务和平台服务等多个环节,围绕不同时期和环节形成多维数据,企业间争夺产权将会形成争议,而且企业的商业模式和广告分成也将受到影响,甚至可能存在假造数据的情况。对大数据知识产权保护,应当遵循如下原则:
1、应当遵循人本原则
人本法律观是相对于神本法律观发展起来的,马克思曾指出“人是法律的出发点”,“全部人类历史的第一个前提无疑是有生命的个人的存在”。无论是科技还是法律,其发展和完善都应当为人类服务,脱离了这个本质,就会损害到人类自身整体的利益。
(1)法律是因人而生,因人而存的。大数据的发展和完善应当遵循保护基本人类的自由、平等、安全、尊严价值,促进社会的福祉发展,在数据采集和使用过过程中,对于涉及到个人隐私、信息安全方面信息的数据应当采取一定的保护措施,必要时可以对大数据行业进行立法规范,设置一定的行业准入门槛,防止数据采集和交易过程中损害个人自由、尊严、隐私等信息。
(2)一种观念认为,基于大数据行业发展前景,使用人工智能制作出各种形式的图文,充其量只能是一种逻辑的表达,其表达方式是非常有限的,不应当被视为作品,如果我们能够设置人工智能让他像人类一样“思考”,也只是在感官上更甚于常人,而不会产生感觉,这样的工作成果一般不应视为作品,不能通过作品的形式去获得保护,可以视为一种财产,人类使用工具劳动获得收益。还有一种观念认为,人工智能根据预置在程序架构中的逻辑以及使用人工智能的命令,随机组合各种图文创作了作品,作品著作权应当归属于程序开发者及使用者,但双方已经根据协议进行约定除外。我们倾向于前者。
2、应当遵循适度采集,隔离使用原则
(1)适度采集
大数据企业存在不同的样态,不同的主体对于数据的兴趣和癖好也不一样,初始采集过程中,企业对于原始数据收集往往是兼收并蓄,尽可能多的收集各类数据,但是往往有些数据涉及到敏感信息,如个人的账户、密码、身份等等,如果这类数据被买卖,将会造成难以估量的后果,对于这类涉及到特定的信息,应当慎重采集,采集后还应对数据信息进行脱敏处理。将个人信息进行大规模交易,可能会涉及到刑事责任。
2)隔离使用
从法律层面来说,应当加大对数据采集的必要性管理,对于特定信息禁止收集、存储和使用。采集和使用的环节应当进行隔离,在企业间,企业各个部门之间对信息进行必要的分离管理,采集和使用应当分开进行,这样有利于明确责任主体。建立采集和使用行为分离机制,一方面有利于保护特定的主体的隐私、商业秘密等利益,另外一方面能够有效地预防犯罪,防止信息外泄的恶性事件。
3、应当遵循合理避让的原则
大数据基本形成或存储于服务器或者云端上,有些企业的数据是原始状态存储的,有些企业则是采取模型式存储,传输和存储环节存在不完善的地方,可以为其他企业抓取。在互联网环境下,即便数据保护已经逐步完善,如通过https的方式加密传输,但是由于分享和传播的需要,他人仍然可以接触到并加以破解,会导致数据外泄。
(1)通过爬虫或者其他方式,对于企业数据的抓取会损害企业的正当权益,不仅会导致数据财产的丢失,泄密,还有可能引起服务器运行的紊乱。通过这种不劳而获的方式获得他人的财产进而进行售卖,会存在恶性竞争的问题。
(2)在企业竞争过程中,可能存在各种矛盾,但竞争对手之间应当避免对于大数据的计算结果采取过度解读,从而形成对某一特定企业的恶意解读,损害企业的合法权益,即便这种解读是客观真实的,竞争企业间也应当避免类似情形。
(3)企业之间通过网络开放协议,或者通过线下方式单独订立协议,对于加密或者开放的数据及数据统计结论,应当采取合理避让的方式,在竞争对手之间避免出现恶性竞争,防止利用大数据做出对竞争对手的侵权。
4、应当遵循利益平衡原则
在数据采集、收据挖掘和数据交易等环节,数据本身并不产生价值,而是基于其二次开发和深度加工形成的分析报告存在显著价值,虽然有些公司开放了数据接口,但并不意味着可以任意取用,需遵守一定的协议。整个数据加工的流程产业链中,存在多种情况,数据采集和挖掘以及交易都有可能被第三方干扰,甚至可能人员流失导致技术和客户资源外泄,基于大数据产业链的整体比较复杂的情况,对于数据的保护应当遵守利益平衡的原则,特别是公共利益的保护,以有效的制度救济作为补充手段,在知识产品的生产和流转的动态过程中,始终使知识产权人的利益和社会公众的利益保持一种平衡。在数据的生产交易环节加强保护,通过适当的知识产权方式方法保护创新。
(1)在采集时,应当平衡用户利益和平台利益。数据采集者和用户之间是对立统一体,用户可以基于大数据获得更多的有用信息或服务,而采集者可以获得一定的利润回报,但如果用户是否有权禁止他人对自己进行数据进行收集,为自己“画像”,目前还存在争议,理论上来说数据采集者可以根据用户行为进行客观记录,但应当保证这种记录不被用于非法用途。而采集者也可以根据用户的癖好和习惯,向用户推荐更多关心的信息,方便用户快捷精准获得资源。
(2)在加工时,应当平衡数据采集者和数据中介服务机构之间的利益,对于数据的整理、存储、挖掘,也应该平衡各方利益,对于安全的需求、统一性的需求和便利性的需求,各方应当在数据加工时遵循一定的规范,按照行业或者国家标准来进行,目前上缺乏有效的规范。
(3)在数据交易中,还应当防止各种敏感数据,包括涉及到商业秘密、个人隐私或者其他涉及到法律权益的数据在市面流通,为交易双方提供合法公平的市场环境。
5、鼓励数据流动、分享原则
大数据本质上是一个数据拼图,尽管他是多维的,如果企业将大数据作为企业经营的版图,引起行业恶性竞争或者数据垄断,必然损害整体的数据行业发展,进而损害到社会公共利益。大数据的垄断与大数据的本质背道而驰,最终毁掉的是大数据的价值。
(1)鼓励企业将其经营的数据在脱敏以后加工进行交易,则会促进行业的整体发展,甚至于可以免费进行分享,但是这种机制必须在一定的安全机制下进行。
(2)对于传统企业来说,大量的运营信息可数据化,及数据化成果采集、挖掘和使用将会是未来的行业发展的重点,有价值的数据将会被逐步垄断,导致需方和售方博弈,在一定时期内,完成数据化将会导致技术、人才竞争的加剧。
(3)数据版图之争成为下一个纠纷的热点,围绕传统行业数据加工和挖掘,和新兴市场主体的数据采集都会引发激烈的竞争。整体互联网法依赖于分享机制的形成,公开的技术分享将会大大促进行业整体进步。
6、遵守法律伦理的原则
人工智能(AI)是使用计算机科学的概念、程序和方法从事认知过程的科学,实际上就是一种机器模仿人智力活动的技术。人工智能研究的创始人之一的明斯基(MarvinMinsky)在xxxx年说过一句话,集中概括了人工智能研究的实质:“让机器从事需要人的智能的工作的科学”。人工智能容易引发伦理困境,如前文所述,技术虽然具有中立性,但是使用技术的人却具有一定的意图,对于人工智能模仿人类的活动所产生的法律效果缺乏评估的情况下,还是应当慎重认定法律行为和法律责任。从本质上来说,人工智能所遵循的是设备预先内置的逻辑思维能力,也就意味着这种规则的是由人类创作的,而人类使用人工智能进行二次学习的过程中会产生下一阶段的活动,但由于无法预先评估机器在学习后会具备哪些能力,如果不加以评估,将会导致产生法律问题。例如高速行驶的无人智能汽车,在极端情况下,可能要面临着杀死乘车人还是行人的问题,具体决策都是根据计算机自动识别和评估来完成的,如果通过事先预置的智能系统进行决策,将会导致灾难性后果,甚至开发者需承担刑事责任,但如果将这种情形下的决策权移交给驾驶者,就能相对缓解法律伦理困境。
大数据案件近年来逐步增多,与以往的涉互联网案件存在显著不同,以往案件的多以“信息”为载体,而大数据模式下以“全息”为载体。采用全息的多维度,多样态来解读数据,在数据采集、数据分析和数据产权、数据成果等问题上争议非常复杂,我们通过提炼一定规则方法,希望能够在大数据产业起步阶段,有助于产业健康发展,培育和净化市场环境,促进社会创新的氛围。