当前位置: 庄子 >> 庄子简介 >> 剽窃抄袭的含义抄袭判定规则及技术
版权保护之
剽窃/抄袭的含义、抄袭判定规则和技术
一、“剽窃”的违法性基础
(一)我国法律对“剽窃”行为的规定
《著作权法》第五十二条:“有下列侵权行为的,应当根据情况,承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任:......(五)剽窃他人作品的;”
(二)著作权法的原则是“根据受控行为界定权利内容”或者叫做“专有权利控制特定行为”。反过来,如果行为人未经著作权人许可实施了特定行为,那就可能侵犯了专有权利。
(三)剽窃构成侵权的基础,在于剽窃者侵犯了复制权、改编等权利,或者说剽窃者未经许可实施了复制作品/创作演绎作品的行为——
1.剽窃的方式有很多,有直接照抄的,有“融梗”的,有“洗稿”的,有冒充作者等等。按照唐代诗人皎然在《诗式》中的说法,唐人剽窃诗歌有三种模式,分别是“偷语”(抄袭原文词句),“偷意”和“偷势”。其中“偷语”水平最低,并且行为之恶劣不亚于“公行劫掠”。(由此可见,古代即便没有著作权的概念,“剽窃”也令人不齿)
2.剽窃方式的多样性,意味着剽窃行为侵害的不是单一权利,可能侵犯复制权、也可能侵害改编权等权利。这并不违反“专有权利控制特定行为”原则,只不过是一种行为对应了多种权利而已。
3.“复制”不是指单纯的原文照抄,著作权法对复制行为的定义是半开放式的,即复制行为既包括“印刷、复印、拓印、录音、录像、翻录、数字化等方式”。演绎的法律定义则是封闭式列举,仅包括”改编、翻译、注释、整理、汇编”五种行为。
(四)“剽窃”在道德上具有可谴责性,因为创作的过程很艰辛,剽窃他人作品无异于盗窃别人的智力成果。而在法律层面,法律并没有明确规定“剽窃”的构成要件。使用他人作品的行为也未必都构成侵权,法律允许“合理使用”的存在。
通常来讲,在“剽窃”这个问题上缺乏客观的判断标准,依赖于主观判断,合法和非法的边界也就随着社会观念变动而变动的。比如古体诗词创作里常见的手法“化用”,过去看来是一种高超的技巧,但是以今天的眼光看却难免“洗稿”的争议。再举一例,技术进步也会导致判断规则变化,比如网络传输中的“临时缓存”,是否涉及侵犯复制权,英美法国家和大陆法系国家的观点就大相径庭。
知识的进步必然要建立在前人成就基础上的,不可能完全不使用已有成果凭空创造。但是“剽窃”行为的定义又过于模糊,如果范围太大则不利于知识进步、范围太小又不利于版权保护。为了解决这种冲突,法律技术层面发展出来了内容抄袭的判定规则和判定技术。
在介绍内容抄袭判定规则前,我们再谈几个词语和典故
剽窃抄袭
infringement和plagiarism
Ifyoudidnotwrite
ityourself,you
mustgivecredit.
二、剽窃或抄袭,infringement和plagiarism
(一)在中文语境下“剽窃”和“抄袭”是同一概念
1.剽窃和抄袭在中文里是近义词,尽管正式的法律条文用了“剽窃”一词,但是日常生活中“抄袭”更常用——
柳宗元《辩文子》:“然考其书盖駮书也,其浑而类者少,窃取他书以合之者多,凡孟子辈数家,皆见剽窃,峣然而出其类。”
《红楼梦.第八十四回》:「那些童生都读过前人这篇,不能自出心裁,每多抄袭。」
2.剽窃他人作品的历史典故
《世说新语·文学》:初,注庄子者数十家,莫能究其旨要。向秀于旧注外为解义,妙析奇致,大畅玄风。唯秋水、至乐二篇未竟而秀卒。秀子幼,义遂零落,然犹有别本。郭象者,为人薄行,有俊才。见秀义不传于世,遂窃以为己注。乃自注秋水、至乐二篇,又易马蹄一篇,其余众篇,或定点文句而已。后秀义别本出,故今有向、郭二庄,其义一也。
顾炎武讲得更直白
《日知录·卷十八》:晋以下人则有以他人之书而窃为己作,郭象《庄子注》、何法盛《晋中兴书》之类是也。若有明一代之人,其所著书无非窃盗而已。
(二)英美法中的infringement和plagiarism是不同概念
在法律英语中,infrigement泛指所有知识产权侵权行为,即著作权侵权、专利侵权、商标侵权均可以使用infringement。
例如copyrightinfringement,patentinfringement,trademarkinfringement。
具体到著作权领域,以美国版权法为例——根据美国法典第17章第条(a)规定:任何人,当其侵犯《美国版权法》第条至条为作者或者权利人规定的任何排他性权利,或者违反该法第条的规定时,就构成“infringementofcopyright”。
plagiarism的含义是剽窃,只是infringement的类型之一,二者是包含和被包含的关系。在英美法中,“plagiarism”也没有客观标准和固定的内容,理查德·波斯纳大法官在其著作权《论剽窃》就提到,剽窃不是一成不变的概念,具体构成要按照特定的法律规则经过法律推理后才能下结论。
值得一提的是,与唐代诗人皎然类似,波斯纳大法官也把剽窃分为三种类型——逐字逐句的抄袭、述而不作的编辑、创造性的模仿。
内容抄袭判定规则和检测技术
(一)“实质性相似+接触”规则
1.实质性相似(substantiallysimilarity)
实质性相似,是指“侵权作品中体现创作者个性的部分与原作的独创性部分实质性相似,系一种把他人作品据为己有,仅将个别部分略作变动,没有创造性劳动的侵权行为。
判断实质性相似,一般要将被诉侵权的作品与原作品进行比对,比对的方法可以是人工比对,也可以利用技术(即我们下文要提及的内容抄袭检测软件)。对于词句抄袭的比对,人工的效率和准确度远不如软件,但是如果是针对故事情节、剧情、内涵等非表达性元素的抄袭,软件不一定能够比对出结果。
在《宫锁连城》侵权案中,法院认为——
文学作品中,情节的前后衔接、逻辑顺序将全部情节紧密贯穿为完整的个性化表达,这种足够具体的人物设置、情节结构、内在逻辑关系的有机结合体可以成为著作权法保护的表达。如果被诉侵权作品中包含足够具体的表达,且这种紧密贯穿的情节设置在被诉侵权作品中达到一定数量、比例,可以认定为构成实质性相似;或者被诉侵权作品中包含的紧密贯穿的情节设置已经占到了权利作品足够的比例,即使其在被诉侵权作品中所占比例不大,也足以使受众感知到来源于特定作品时,可以认定为构成实质性相似。
在《武侠Q传》侵权一案中,法院认为——
一般来讲,对于一部由主题、故事脉络、情节设计、人物关系等要素组成的作品而言,故事的主题、单纯的人物关系应归于“思想”的范畴;但围绕故事主题展开的特定情节、人物关系的具体化,则可能因其具体到一定程度而应归为“表达”。
2.证明性相似(probativesimilarity)
国外对于“实质性相似”原则的运用则分为两个步骤,根据Arnsteinv.Porter,F.2d(2dCir.)判例确立的规则,实质性相似的证明过程分为两个步骤:
步骤一:对于两件作品进行分析比较,包括听取专家证词。如果两件作品经过比较,为表达上的相似提供了证明结论(即证明性相似),就进入第二步。步骤一的比较是形式比较或者叫“外部比较”,即对作品的外在表达形式(例如词语、句子、线条)进行客观分析,比较人员一般是具有专门知识的人。
步骤二:由事实判定者通过主观判断两部作品在内在上是否相似,此处的内在不是指作品的思想内涵(思想不受著作权法保护),而是指“复制行为大量存在以至于这些作品如此相似,从而使在后作品表现出对前作品的非法借用”。
步骤二中的事实判定者一般是不具有专业知识的普通人(ordinaryObserver),所谓的“主观”也就是我们熟知的“一般社会观念”。
3.接触
两部作品之间构成了实质性相似还不足以单独说明剽窃行为存在,被告需要能够“接触”到原作品才有剽窃的可能性,否则就是“如有雷同,纯属巧合”的独立创作。
“接触”的主体是指被诉侵权的行为人(即被告),但具体方式和主观意志没有限制。可以是合法的接触,比如通过公开文献、公开报道等渠道接触原作品;也可以是非法接触,比如非法获取商业秘密。主观上是否具有抄袭的故意不影响接触的认定,因为接触是一种事实,与意志无关。
“接触”可以直接证明,也可以间接证明。直接证明,比如原告曾经将原作品发送给被告、被告曾经下载过原作品。而间接证明是通过“高度盖然性标准”证明被告具有“接触的可能性”,比如原作品曾在有影响力的期刊、网站上发表过,被告获取原作品没有难度。需要指出的是,在间接证明的场合,被告如果有能证明独立创作的明确证明,可能会推翻侵权指控。在美国年的LaResolanaArchitects,PAv.Reno,Inc.,F.3d,案件中,法院认为“虽然原告不必证明被告对其作品的实际接触,‘仅仅勉强证明被告有可能接触作品的证据则是不充分的’”。
Justiceisthesetandconstantpurposewhichgivestoeverymanhisdue.
(二)内容抄袭检测技术(此部分内容的完成,由衷感谢知名微博主
bookthing提供的研究方向)我们在《软件开源许可和作品CC协议——知识产权公共许可的背景知识简介》这篇文章中讲过信息技术的发展对版权许可使用的影响。同样,在“剽窃”问题上,信息技术一方面降低了剽窃的难度,但反过来也发展出很多反剽窃技术和内容抄袭检测技术。
以下是Wikipedia上介绍的几种常见内容抄袭检测技术
1.文本指纹比对(即”文章指纹识别”)
该技术原理是模仿人类指纹唯一性的特点,通过算法给每一个文本构造一个唯一的字符串标识(即“指纹”),两个文本指纹相似度越高,文本本身的相似度也越高。
文本指纹比对技术运用广泛,但是存在严重缺陷,首先是算法决定了识别的准确率,其次是效率低下。因为很多算法的原理是要先将文本转化成特定字符,如果遇到海量文献检索时,算法就无法一一转化大量文献,因此该技术一般用于“两两相似”的判断。
2.Stylometry(计量文体学)
文体学的古已有之,通过研究书面文献的文本语言、风格、创作手法等特征确定作者身份。早在年,意大利学者洛伦佐·瓦拉(LorenzoValla)就用文体学技术证明了罗马帝国法令《君士坦丁献土》(DonatioConstantini)是一份伪造的文献。
现代文体学(计量文体学)的核心其实是统计学,在计算机条件下,将海量的数据库进行文本聚合和文本归类,通过统计学进行抄袭鉴定。计量文体学可以判断文本中最诘屈聱牙的部分,在AI技术下甚至能对演讲中的口头抄袭进行鉴定。一个知名的案例是在年,学者通过计量文体学证明了《DoubleFalsehood》作者不止莎士比亚一人,另一名作者是JohnFletcher(约翰·弗莱切)。另外,计量文体学也常被用于音乐作品的鉴定之中。
不过这种技术也有缺点,一方面是数据库,另一方面是需要掌握精湛的数学和统计学知识。
如果一篇作品混合了多种抄袭方法,那么软件的检测准确度就会下降,根据Wiki的介绍,各种软件的检测准确度与检测难度之间的关系如下——
因篇幅有限,其他技术我们就不一一介绍了。
需要说明的是,内容抄袭检测技术也只是判断“实质性相似”这个大原则之下的具体方法之一,每种技术都有其优缺点,不能单独作为认定抄袭的依据。具体在司法实践和反抄袭的运用中也要注意听取和鉴别“有专门知识的人”或者“专家证人(amicuscuriae)”的意见。
Thepreceptsofthelawarethese:
tolivehonestly,
toinjurenoone,
andtogiveeverymanhisdue.
『Deiustitiaetiure』
法学是关于人和神的学说,
是正义与非正义的科学。
关于“实质性相似+接触”原则的参考链接:
转载请注明:http://www.dihaoqc.com/zzjj/20726.html