从 01 开始 从 01 开始
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机相关技巧
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • 最全面的 RSS 教程
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金
  • 职场规划
  • 关于离职
  • 杂谈
  • 自媒体
  • 📖 读书

    • 读书工具
    • 走进科学
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 新闻合订本
    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
    • 读书笔记
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档

晓林

程序猿,自由职业者,博主,英语爱好者,健身达人
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机相关技巧
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • 最全面的 RSS 教程
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金
  • 职场规划
  • 关于离职
  • 杂谈
  • 自媒体
  • 📖 读书

    • 读书工具
    • 走进科学
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 新闻合订本
    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
    • 读书笔记
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档
  • 新闻合订本

  • 反腐

  • GFW

  • 404 内容

  • 审查与自我审查

  • 互联网

    • 互联网越来越孤岛化了
    • 孙宇晨:从三本到北大再到币圈风云人物
    • 中文互联网的产出在渐渐枯萎吗?-知乎
  • 读书笔记

  • 战争

  • 政治
  • 互联网
2024-01-30

中文互联网的产出在渐渐枯萎吗?-知乎转载

# 中文互联网的产出在渐渐枯萎吗? - 知乎

转载一个知乎高赞回答,原文已被删除,联系不上作者,侵删。

原文地址:中文互联网的产出在渐渐枯萎吗? - 知乎 (opens new window)

以下是正文:


简中互联网已经成为垃圾堆。

首先是不可描述的原因,微信为首的,开始封闭化,公众号不就是 RSS 订阅吗,朋友圈不就是社交网络吗,小程序不就是 H5 网页吗,但完全独立于开放互联网。

第二还是不可描述的原因,百度一家独大且对小站点收录缓慢或不收录。未备案的网站也更难,个人小站备案了放里面,百度给你收录个首页;不备案放外面,百度都不搭理你。

第三还是不可描述的原因,国内能发言的地方少有没被整顿过的,站点的生存也成了问题。

接下来就是对内容的官方导向。

一是全平台都有浓重的商业气息,你想问一下哪个洗面奶比较好,发现前几名都是带货回答,无形之中捧一个完全没有名气的垃圾品牌;去网购,底下评论都是机器人或好评返现;去看评论,全是刷榜;软广水军泛滥,难以分辨。

什么带货、网赚、私域流量这些词汇,天生就是为了榨干流量换金钱而诞生的。平台是应该把握住优质内容,还是弄成看似“双赢”,其实“全输”。浑水来了又去,留下一片狼藉。

二是各种不规范转载,低水平文章泛滥,尤其是 CSDN,复制粘贴先不说,都是程序员了,发的代码连格式化都没有,就纯文本啊。

这里就不得不提一个经典的例子,当你在谷歌搜索“python 四舍五入”的时候,第一个帖子是这里: https://blog.csdn.net/qq_392347/article/details/82817703,进去一看:

​

写了一个错误的示范,并亲自给出了一个不通过的测试,完成了自我否定,然后说“无法理解”,就这样,起了个标题叫“Python 四舍五入的正确打开方式”,并常年占据此关键字榜首。

写初级内容的人多了,虽然千篇一律但好歹能用,对自己一知半解的知识瞎写还要起一个“正确”的标题就有点过分了。

反观英文搜索这边:

​

其实英文的初级问题的第一个搜索结果大部分都是 Stack Overflow,点进去 https://stackoverflow.com/questions/33019698/how-to-properly-round-up-half-float-numbers (opens new window) 一看就明白了,第一个回答告诉了我们为什么 round​ 不好使,第二个回答三行示例代码极速解决实质问题。

最后大的来了,SEO 污染。

编程、游戏攻略、健康养生等作为重灾区,一大堆垃圾网站在为其注入垃圾。

内容农场、采集站、机翻站、克隆站充斥着搜索引擎的搜索结果。

去年的“小 X 知识网”以采集站集群的架势向 Google 展开了猖狂的进攻,几周的时间就占据了前几页七八成的搜索结果。

这个“小 X 知识网”当时有多牛逼呢,我将搜索结果设定为每页 50 个,并配置了 uBlacklist 屏蔽“小 X 知识网”,搜“C 语言二进制输出”,首页就他妈剩俩了。

英文区也不是净土,比如 newbedev(看域名“牛逼开发”很像国人搞的。。。)搬运了 Stack Overflow。

谷个歌和鸭鸭走也不是净土,Google 为 newbedev、pretagteam 等采集站收录了几百万条,排名还十分靠前。我不了解搜索引擎技术,我对此十分不解,这是人工肉眼可发现的很明显的采集行为,不知道为何其 SEO 如此突出。包括“小 X 知识网”,据说是迫于压力自动退出的,而不是搜索引擎惩罚的。

有人会说英文一样有这些内容农场采集站,但很明显是屎里淘金和金里去屎的区别。

接下来呢,国内这些有头有脸的厂子是怎么干的。

内容封闭,再封闭,无论是为了生存还是商业考虑,总之就是封闭。

百家号作为百度官方指定内容农场,一边当厨师一边给菜里放屎。

CSDN 曾经还搬运过 GitHub,这都是小操作了,技术博客见得多了,但”登录后才能复制代码“还是第一次见。古今中外的技术博客恐怕也只有 CSDN 有这种气派。再者来说,能看到这种文章哪个不是程序员,谁还不会看个 HTML,改个 CSS,挂个油猴脚本,下个插件,开个 OCR,这不就是纯恶心人。

像阿里云、腾讯云的帮助文档,以极低的质量疯狂的入侵搜索引擎,搜阿里云的问题还得加上 -aliyun.com​ 屏蔽阿里云才能找到解决办法,简直可笑。

搜新闻,那就是几十上百个一样的标题,且大多数新闻缺乏要素,特别是个媒体的胡编乱造。——“网传,据相关报道,扎布多德雷教授近日表示。。。”(“网传”是哪个网?“相关报道”是哪个报道?“扎布多德雷”是谁?“近日”是哪日?)

在移动端浏览器搜新闻,进去就是一大堆无用的按钮和内容占据了 50% 左右的板块,点开就要你下 App,还得展开全文,展开的时候又问你要不要下 App。

”登录以查看。。。“、”下载 App 以查看。。。“之类的也是屡见不鲜。

还有很多近些年因为移动端强势而淡化、不做甚至砍掉 Web 端、PC 端的。

普遍的存在搞关键词采集展示的,就是你搜索“XXX”,点击结果后,跳转到内站的“搜索 XXX”,且相关度变得更低,还可能是采集内容,浪费生命。一般为 /s/* /so/* ?s=* 等 URL 路径,还有阿里云的 /sswd。

优秀项目展示:

某大厂的 SEO 污染——这大约应该是中文第一内容农场了。

​

连别人 N 年前的网站公告都一字不差的采集过来——

​

插播:被人为控制的的搜索引擎公平机制——

​

无名小站恶心人的就更多了,一般都是有组织的集群站,那天看到一个帖子,标题是要架起中西方程序员之间的技术桥梁,进去一看是他妈的机翻采集站。

胡编乱造的人也不在少数,如果复制已有的垃圾还不满足,还要创造新的垃圾。

经典案例——“三大医德名人”。

一句话来说,就是没有这种称号,是百度百科用户瞎编的,现在已经被修正了。

但这个案例很经典,在搜索引擎搜索时加上引号,可以看到包括网络文章、各处的人物介绍、书籍、gov 网站、大学网站、甚至学术论文都进行了引用。

当然优质内容还是有的,虽然其中有被淹没在洪流之中的,有被采集站采集并排名更高的,有因为关站消失的,有被和谐的。。。

和编程比较相关的,GitHub 上还有一个“中文独立博客列表”项目,里面都是原创的个人独立博客;还有一个“十年之约”的网站,博客写十年。搜索技术问题时不乏遇到“XXX 的博客””XXX's blog“等干货满满优秀的独立博客,但更多的是遇到“XX 网”“XX 家园”“程序员 XXX”“XX 知识网”“XX 百科网”等采集站。

我相信优质内容一直都在产生,但作为一个搜寻者,在这种环境下,获取优质内容的途径变得越来越曲折。

最后,中文互联网产出在渐渐枯萎是怎么回事呢?中文互联网相信大家都很熟悉,但是产出在渐渐枯萎是怎么回事呢?下面就让小编带大家一起了解吧。

中文互联网产出在渐渐枯萎,那么中文互联网为什么会产出在渐渐枯萎,相信大家都很好奇。大家可能会感到很惊讶,中文互联网怎么会产出在渐渐枯萎呢?但事实就是这样,小编也感到非常惊讶。那么这就是关于中文互联网产出在渐渐枯萎的事情了,大家有没有觉得很神奇呢?

看了今天的内容,大家有什么想法呢?欢迎在评论区告诉小编一起讨论哦。

编辑于 2022-01-16 18:40

上次更新: 2025/5/3 18:05:06
孙宇晨:从三本到北大再到币圈风云人物
在喧嚣中,照见你我:一个乡镇的政治与人情浮世绘

← 孙宇晨:从三本到北大再到币圈风云人物 在喧嚣中,照见你我:一个乡镇的政治与人情浮世绘→

最近更新
01
新闻合订本 2025-10
10-31
02
2025 年 10 月记
10-30
03
用 AI 批量优化思源笔记排版
10-15
更多文章>
Theme by Vdoing | Copyright © 2022-2025 | 粤 ICP 备 2022067627 号 -1 | 粤公网安备 44011302003646 号 | 点击查看十年之约
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式