【热议】翟天临博士论文作假事件,查重率真的有效吗?能被普通人所采用吗?



  • 顶楼先放事件背景。精彩讨论从2楼开始~~


    事件背景:

    “近日,有网友公开演员翟天临在北京电影学院博士研究生在读期间,发表的一篇学术性质文章查重率达40%,存在抄袭的嫌疑,引发社会关注。”

    0_1549958443076_637110fc-773c-40d0-b08b-36030aa606ba-image.png

    重要论据

    查重率达40%,存在抄袭的嫌疑

    下述图片来自微博曝光:

    0_1549961040647_11.jpg

    0_1549961048583_22.jpg

    0_1549961056353_33.jpg



  • 议题:查重率用来判断抄袭or洗稿,是否靠谱?

    观点:查重率这个数据指标可以通过各种特定手段修改完善;从而导致即便查重率低,也无法代表原创。

    引申观点:

    1. 修改论文降低查重率的手段,和洗稿有异曲同工之处。

    2. 查重率低的论文,并不一定表示是原创,有可能只是高级洗稿或经过掩饰的抄袭。

    3. 查重率只能成为论文是否原创的参考依据,而无法成为决定性依据。


    讨论是在PRESSone产品技术交流群首先开始的。该观点并提供观点佐证的有以下数位:

    论据1:由刘娟娟发现并提供:

    我特地上知乎搜了一个反例: 采用某种手段,让查重率直接从68%降低到 8%,见截图:

    0_1549959251172_c9477c02-8087-4b7c-ad84-62640ac4b879-image.png

    论据2:由 提供并授权分享

    查重率是可以反映抄袭的,但是他40%的重复率,稍微花点钱请专业人士修改下,就可以降到10%以下

    规避这个指标有方法,最常见的就是修改词句,颠倒顺序。

    中国的大学生,研究生大部分都用过这个方法。



  • 议题:查重率这个数据指标,能否被普通人所采用?

    观点:查重率服务常有付费门槛,并不能被普通民众大量地、免费使用,也较难用作普通文章的抄袭或洗稿的界定参考。

    引申观点:

    1. 论文查重率在国内面向特定群体是巨大付费市场,且是个相对封闭,根深蒂固的市场。

    2. 学术作假事件频出,需要改变。但改变的阻力也很大。

    3. 支撑查重率有效性的关键,在于比对的数据库是否有充分的数据。


    讨论是在PRESSone产品技术交流群首先开始的。该观点并提供观点佐证的有以下数位:

    论据1:由 远山 提供并授权分享:

    我们上学那会好多个类似知网的查重网站,但最后基本都还是用的知网数据,查重和论文最权威最好用的还是知网。

    以知网来说,并非任意两篇文稿都可以使用这个查重功能,需要被它收录的才行。


    论据2:由 詹大鹏 提供并授权分享:

    毕业论文查重是刚需,每篇论文都要查好几遍。我毕业当年就查了好多遍。知网好像好几十块一次。

    大学毕业生,论文查重每人按200元算,每年毕业生1000万,光是大学生就有每年20亿市场。


    论据3:由 常张锋 提供并授权分享:

    淘宝可以买知网论文查重服务。2017年的行情,我记得淘宝价100多还是200多。

    卖点就是和高校里的查重系统一样,帮助毕业生规避论文查重率过高。

    为了安全,学生都会先在淘宝上查一遍。


    论据4:由 提供并授权分享:

    论文查重费用几块钱的也有,但是学校指定用paperpass查重,查一次200元左右。

    因为论文要不断地查重,修改,才能最终定稿。一般的做法是先用便宜的软件查重,最后再用paperpass查。


    论据5:由 刘创新 提供并授权分享:

    知网我充了八百元,不过研究生毕业后就好少用了,剩了五百多元。一些好的论文(学术大咖论文、高校优秀论文、名校论文)是要收费才能看、下载的,而且很贵,按页计价,每单面A4页0.5元,一篇论文下来十元左右很常见,以我学当时的研究生论文为例,要三万五到五万字。为了写毕业论文综术,我下载了大约一百元版费。据我所知,论文提交时需签订版权协议,即学生论文版权免费归学校 (这对论文生产者是最大的不公平,不过为了论文通关、毕业,没人敢与学校计较,闭眼签了),学校可以卖给类似知网的数据库,既有版权,又扩充了数据库。 查重方面,我当时的学校仅配备每个学生一次免费查重机会,一般学生会在送学校查重之前会自行到市场上购买查重服务,各种价格及查重质量不一样,应该是查重的数据库不一样,有时在外面的查重通过了,在学校的通不过,学校使用的应该是全国统一的、最全、最权威的数据库,这个官方渠道也对外服务,只是收费最贵,所以才衍生市场上的其他渠道。 总的来说是块大肥肉版权市场,但是毕业论文查重、学术论文方面有行政权壁垒(如教育局指定、学术委员会指定),非学术认定、学位论文认定需要的市场有空间,只是感觉不如前两者大及稳定。 存在版权来源不公,但不容易改革。




  • 翟天临博士论文涉嫌作假事件,在PRESSone社区产生的讨论议题:

    • 查重率用来判断抄袭or洗稿,是否靠谱?

    • 查重率这个数据指标,能否被普通人所采用?

    在群友们热烈讨论之下已形成共识。如果你有不同的见解,或补充更多支撑论据,欢迎留言回复。


    我们从具体事件暂时抽离,视线放到整个内容产业上,讨论的要点也放在发现问题并解决问题之上。


    内容产业,抄袭从来都是一个重要议题。常常引发热议,又常常再次因各类事件重新进入大家的视线。

    热点事件常常五花八门,但当我们面对内容产业的“抄袭”话题时,想要解决的问题,无外乎都在追求以下三种结果:

    • 甄别事实真相:到底有没有抄袭
    • 让抄袭更少发生
    • 削弱抄袭带来的恶果

    解决问题的思路不同,所能带来的效果也不同。

    我们希望与您一起共建这个集体认知。也欢迎您常常参与到我们的讨论或完善之中。加入PRESSone的产品技术群,请微信联络qiaoanlu


    最后顺便放一个悬而未决的疑问,邀请你打开思路,发表看法:

    无论是查重率,在某些场合被称作“比对文本重复率”,都仅仅是用于甄别事实真相:到底有没有抄袭的参考依据。但是否能成为决定性依据呢?比如:以查重率作为抄袭参考指标,查重率越高,抄袭的可能性就一定越大吗?