返回
快速导航关闭
当前搜索
网站分类
栏目推荐
实用工具
热门标签
子分类:
创奇学院 >引流 >引流平台 >豆瓣引流 » 正文

豆瓣收藏,讨论下,现在洗稿伪原创的那些事

豆瓣引流 更新时间: 发布时间: 豆瓣引流归档 最新发布 网站地图


洗稿和洗钱相似。

韩寒的小说里提到过洗钱的来历,古代的银票做出来后,需要由专司银监的官员来签名,签名后才能有效。于是有人仿制银票,苦练签名做到和银监的官员丝毫不差,再把假银票放进水里洗一洗再晾干,这样看上去假银票和真银票几乎一模一样,整个过程叫做“洗钱”。

上面那段是春秋笔法,历史上洗钱活动最早出现在20世纪20年代,芝加哥的一名黑手党开了家洗衣店,每晚计算当天洗衣收入时,把非法收入混入洗衣收入中,再正常纳税,扣去应缴的税款后,剩下的非法所得成了合法收入。这是“洗钱”一词的由来。

洗钱这种事情绝大多数人干不了,但是洗稿可以啊。把别人的文章抄过来,加点H2O,再用破壁机打碎重新组织,变成自己的文章。

几个月前的“差评洗稿“事件,将洗稿这一件事在大众面前曝光。


写作界与自媒体最为人不耻的莫过于抄袭和洗稿。抄袭属于法律可以界定的犯罪行为,通常由实质性相似来判定。而洗稿则是抄袭的高级版,高级到法律难以界定。

任何行业一旦有利益驱动,必然有人打主意。洗稿已经成为一条庞大的产业链,从小规模的个人手工洗稿,到团伙利用人工智能AI工具洗稿,再到大V利用团队洗稿。淘金潮中最赚钱的,往往是制作淘金工具的商人。提供洗稿工具、洗稿服务、洗稿培训已成为黑产的一条龙服务。

抄袭,一般指未经著作权人同意,又无法律上的依据,擅自将他人作品或者作品的片段照抄、照搬或套用的侵犯他人著作权的行为。“洗稿”,一般指采用同义词更换、语序转换、段落变换、增删非关键词语等手法生产内容,导致与他人作品主题、观点、大纲、素材、逻辑、结构、表达、描述高度相似,违反平台运营规范的行为。——来自于微信公众平台的定义

1.稿是如何洗出来的

1.1. 为什么判断洗稿有难度

洗稿不同于抄袭,抄袭容易界定,洗稿不容易鉴定和判断。

这么说你也许能理解——二手知识都可以理解为知识源头的解读和延伸,三手知识或者N手知识就和洗稿很接近,怎么判断是原创还是洗稿。

下面从洗稿的层次和操作手段来介绍。

1.1.1.洗稿的层次和操作手段

洗稿层次和水平也反映了个人逻辑思维能力的高低。

越高级的洗稿判断难度越高。

1)初级洗稿

利用信息不对称来实现洗稿。

信息不对称指的是不从国内网络上抄,而是从实体出版物,如书籍、杂志上抄。在移动时代,大多数人碎片化阅读,极少阅读实体书籍和杂志,给了洗稿者可乘之机。

洗稿者利用OCR工具扫描实体书上的文字——例如OCR笔,整段进行复制。大段抄袭文字,中间夹杂一些自己的内容,或者是两头加上自己的内容——前面一段多是自己对复制内容的介绍,后面一段多是加几句总结。

将音频、视频内容转文字。

这是一种笨办法,边放边写文字,通常雇一些网络闲人就可以干这事情。把付费平台的音频、视频教程转成文字,然后比原创平台低很多的价格出售。买这些内容的,其中不乏洗稿者,用来做洗稿素材。

利用人工智能工具来洗稿。

有些贼懂得工欲善其事必先利其器的道理,会先找来NLP洗稿工具,俗称的自然语言处理工具。NLP是(Natural Language Processing)的缩写,属于人工智能AI的子集,通过语义分析、文本发掘来帮助洗稿。NLP工具可以进行相似词语替换,将句子换成意思相近但表达方式不一样。

目前已有这样的工具被开发出来,从各大自媒体平台包括公众号、头条、百家号、简书、豆瓣等采集原创文章,可以根据阅读量、点击量等自动排序,最后生成伪原创文章,最后还可以帮洗稿者审核后一键发表在多个平台上。技术本是无罪,有罪的是利用技术来助纣为虐获取非法收入的人。

不用担心,道高一尺魔高一丈,洗稿者用NLP来洗稿,平台或维权机构用NLP来判断洗稿。两者之间谁高谁低,无非是看利益多大。平台如果没有触动切身利益,不会花太多资源和精力在上面。流量平台为了利益睁一只眼闭一只眼,广告主也开心。

初级洗稿者还停留在体力劳动阶段。

这些初级洗稿尤其是工具洗稿的文章大多有些共同的特征,标题党、口语化、文笔极差。通常存在于流量号中。

据说那些要你花钱购买的人工智能伪原创写稿软件,弄不好是将你的稿件通过谷歌翻译成英语,然后再用百度翻译成中文——这让我想起了智商税。

2)中级洗稿

将一篇文章的中心思想和大纲整理出来,换一种文字描述,按自己的顺序和理解补充内容。

中级比初级高一些,毕竟工具仿写的还是有迹可循。

中级洗稿就像将一个人整容成另外一个人。光是换发型、衣服、外饰、贴个假面具必然不行,这属于易容,人脸识别这一关都过不去——你总不能改变双眼瞳孔间距吧。

改变身高,改变胖瘦,改变双眼距离和五官特征,这样看上去就像两个人。

3)高级洗稿

将数篇相同事件的文章,按自己的逻辑结构来个大乱炖,组合在一起。

光洗一篇文章,还是容易被发现。多洗一些类似主题或事件的文章,难度会大大增加,可以博众家之长为己用。

某些大V(大V通常都有团队),采用这种模式较多。

判断洗稿的难度在于,你无法判断作者的主观意愿是否有意或无意。在有些作者看来,经过我的加工就是我的原创。

这里存在一个撞题的可能,这时就需要看被投诉者的历史信用来辅助判断。

4)判断的基数太大、审稿效率有限

大平台由于每天发布的文章属于海量,靠人工审核不现实,所以都是靠机器AI算法来审核。

而机器算法依靠深度学习和NLP算法来进行语义分析,受限于平台投入的资源和精力,以及算法水平,对于初级洗稿目前还仍有大量漏网之鱼。

一旦遇上用户投诉,人工客服才会介入其中。

对于一些内容粗浅的流量文,尚且相对容易分辨,但一旦遇上有一定思想深度或者技术性的文章,人工客服也不一定能判断出来,这对客服的水平和能力要求很高。

最后:无论是洗稿还是伪原创固然能盗取别人的知识来获得利益,不过最终劣币会驱逐良币,打击原创作者的热情,没有人愿意再写原创文章,网络上充满各种内容雷同、质量低下的文章。

你希望看到这种情况吗?

转载请注明:文章转载自 http://www.320g.com/
本文地址:http://www.320g.com/dbyl/184.html
考高分网交流群

扫一扫加入QQ交流群

和更多志同道合朋友一起交流,分享干货资料!
创奇学院客服

扫一扫加客服微信

有疑问请咨询创奇学院微信号,在线为您解答!
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 Copyright 320g.com Rights Reserved. Powered · 创奇学院

ICP备案号:陇ICP备2020003353号