(转载)中文互联网的产出在渐渐枯萎吗?-知乎
# (转载)中文互联网的产出在渐渐枯萎吗? - 知乎
转载一个知乎高赞回答,原文已被删除,联系不上作者,侵删。原文地址:中文互联网的产出在渐渐枯萎吗? - 知乎 (opens new window)
简中互联网已经成为垃圾堆。
首先是不可描述的原因,微信为首的,开始封闭化,公众号不就是 RSS 订阅吗,朋友圈不就是社交网络吗,小程序不就是 H5 网页吗,但完全独立于开放互联网。
第二还是不可描述的原因,百度一家独大且对小站点收录缓慢或不收录。未备案的网站也更难,个人小站备案了放里面,百度给你收录个首页;不备案放外面,百度都不搭理你。
第三还是不可描述的原因,国内能发言的地方少有没被整顿过的,站点的生存也成了问题。
接下来就是对内容的官方导向。
一是全平台都有浓重的商业气息,你想问一下哪个洗面奶比较好,发现前几名都是带货回答,无形之中捧一个完全没有名气的垃圾品牌;去网购,底下评论都是机器人或好评返现;去看评论,全是刷榜;软广水军泛滥,难以分辨。
什么带货、网赚、私域流量这些词汇,天生就是为了榨干流量换金钱而诞生的。平台是应该把握住优质内容,还是弄成看似“双赢”,其实“全输”。浑水来了又去,留下一片狼藉。
二是各种不规范转载,低水平文章泛滥,尤其是 CSDN,复制粘贴先不说,都是程序员了,发的代码连格式化都没有,就纯文本啊。
这里就不得不提一个经典的例子,当你在谷歌搜索“python 四舍五入”的时候,第一个帖子是这里: https://blog.csdn.net/qq_392347/article/details/82817703,进去一看:
写了一个错误的示范,并亲自给出了一个不通过的测试,完成了自我否定,然后说“无法理解”,就这样,起了个标题叫“Python 四舍五入的正确打开方式”,并常年占据此关键字榜首。
写初级内容的人多了,虽然千篇一律但好歹能用,对自己一知半解的知识瞎写还要起一个“正确”的标题就有点过分了。
反观英文搜索这边:
其实英文的初级问题的第一个搜索结果大部分都是 Stack Overflow,点进去 https://stackoverflow.com/questions/33019698/how-to-properly-round-up-half-float-numbers (opens new window) 一看就明白了,第一个回答告诉了我们为什么 round
不好使,第二个回答三行示例代码极速解决实质问题。
最后大的来了,SEO 污染。
编程、游戏攻略、健康养生等作为重灾区,一大堆垃圾网站在为其注入垃圾。
内容农场、采集站、机翻站、克隆站充斥着搜索引擎的搜索结果。
去年的“小 X 知识网”以采集站集群的架势向 Google 展开了猖狂的进攻,几周的时间就占据了前几页七八成的搜索结果。
这个“小 X 知识网”当时有多牛逼呢,我将搜索结果设定为每页 50 个,并配置了 uBlacklist 屏蔽“小 X 知识网”,搜“C 语言二进制输出”,首页就他妈剩俩了。
英文区也不是净土,比如 newbedev(看域名“牛逼开发”很像国人搞的。。。)搬运了 Stack Overflow。
谷个歌和鸭鸭走也不是净土,Google 为 newbedev、pretagteam 等采集站收录了几百万条,排名还十分靠前。我不了解搜索引擎技术,我对此十分不解,这是人工肉眼可发现的很明显的采集行为,不知道为何其 SEO 如此突出。包括“小 X 知识网”,据说是迫于压力自动退出的,而不是搜索引擎惩罚的。
有人会说英文一样有这些内容农场采集站,但很明显是屎里淘金和金里去屎的区别。
接下来呢,国内这些有头有脸的厂子是怎么干的。
内容封闭,再封闭,无论是为了生存还是商业考虑,总之就是封闭。
百家号作为百度官方指定内容农场,一边当厨师一边给菜里放屎。
CSDN 曾经还搬运过 GitHub,这都是小操作了,技术博客见得多了,但”登录后才能复制代码“还是第一次见。古今中外的技术博客恐怕也只有 CSDN 有这种气派。再者来说,能看到这种文章哪个不是程序员,谁还不会看个 HTML,改个 CSS,挂个油猴脚本,下个插件,开个 OCR,这不就是纯恶心人。
像阿里云、腾讯云的帮助文档,以极低的质量疯狂的入侵搜索引擎,搜阿里云的问题还得加上 -aliyun.com
屏蔽阿里云才能找到解决办法,简直可笑。
搜新闻,那就是几十上百个一样的标题,且大多数新闻缺乏要素,特别是个媒体的胡编乱造。——“网传,据相关报道,扎布多德雷教授近日表示。。。”(“网传”是哪个网?“相关报道”是哪个报道?“扎布多德雷”是谁?“近日”是哪日?)
在移动端浏览器搜新闻,进去就是一大堆无用的按钮和内容占据了 50% 左右的板块,点开就要你下 App,还得展开全文,展开的时候又问你要不要下 App。
”登录以查看。。。“、”下载 App 以查看。。。“之类的也是屡见不鲜。
还有很多近些年因为移动端强势而淡化、不做甚至砍掉 Web 端、PC 端的。
普遍的存在搞关键词采集展示的,就是你搜索“XXX”,点击结果后,跳转到内站的“搜索 XXX”,且相关度变得更低,还可能是采集内容,浪费生命。一般为 /s/*
/so/*
?s=*
等 URL 路径,还有阿里云的 /sswd
。
优秀项目展示:
某大厂的 SEO 污染——这大约应该是中文第一内容农场了。
连别人 N 年前的网站公告都一字不差的采集过来——
插播:被人为控制的的搜索引擎公平机制——
无名小站恶心人的就更多了,一般都是有组织的集群站,那天看到一个帖子,标题是要架起中西方程序员之间的技术桥梁,进去一看是他妈的机翻采集站。
胡编乱造的人也不在少数,如果复制已有的垃圾还不满足,还要创造新的垃圾。
经典案例——“三大医德名人”。
一句话来说,就是没有这种称号,是百度百科用户瞎编的,现在已经被修正了。
但这个案例很经典,在搜索引擎搜索时加上引号,可以看到包括网络文章、各处的人物介绍、书籍、gov 网站、大学网站、甚至学术论文都进行了引用。
当然优质内容还是有的,虽然其中有被淹没在洪流之中的,有被采集站采集并排名更高的,有因为关站消失的,有被和谐的。。。
和编程比较相关的,GitHub 上还有一个“中文独立博客列表”项目,里面都是原创的个人独立博客;还有一个“十年之约”的网站,博客写十年。搜索技术问题时不乏遇到“XXX 的博客””XXX's blog“等干货满满优秀的独立博客,但更多的是遇到“XX 网”“XX 家园”“程序员 XXX”“XX 知识网”“XX 百科网”等采集站。
我相信优质内容一直都在产生,但作为一个搜寻者,在这种环境下,获取优质内容的途径变得越来越曲折。
最后,中文互联网产出在渐渐枯萎是怎么回事呢?中文互联网相信大家都很熟悉,但是产出在渐渐枯萎是怎么回事呢?下面就让小编带大家一起了解吧。
中文互联网产出在渐渐枯萎,那么中文互联网为什么会产出在渐渐枯萎,相信大家都很好奇。大家可能会感到很惊讶,中文互联网怎么会产出在渐渐枯萎呢?但事实就是这样,小编也感到非常惊讶。那么这就是关于中文互联网产出在渐渐枯萎的事情了,大家有没有觉得很神奇呢?
看了今天的内容,大家有什么想法呢?欢迎在评论区告诉小编一起讨论哦。
编辑于 2022-01-16 18:40