从 01 开始 从 01 开始
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机相关技巧
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • 最全面的 RSS 教程
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金
  • 职场规划
  • 关于离职
  • 杂谈
  • 自媒体
  • 📖 读书

    • 读书工具
    • 走进科学
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 新闻合订本
    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
    • 读书笔记
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档

晓林

程序猿,自由职业者,博主,英语爱好者,健身达人
首页
  • 📚 计算机基础

    • 计算机简史
    • 数字电路
    • 计算机组成原理
    • 操作系统
    • Linux
    • 计算机网络
    • 数据库
    • 编程工具
    • 装机
  • 🎨 前端

    • Node
  • JavaSE
  • Java 高级
  • JavaEE

    • 构建、依赖管理
    • Ant
    • Maven
    • 日志框架
    • Junit
    • JDBC
    • XML-JSON
  • JavaWeb

    • 服务器软件
    • 环境管理和配置管理-科普篇
    • Servlet
  • Spring

    • Spring基础
  • 主流框架

    • Redis
    • Mybatis
    • Lucene
    • Elasticsearch
    • RabbitMQ
    • MyCat
    • Lombok
  • SpringMVC

    • SpringMVC 基础
  • SpringBoot

    • SpringBoot 基础
  • Windows 使用技巧
  • 手机相关技巧
  • 最全面的输入法教程
  • 最全面的浏览器教程
  • Office
  • 图片类工具
  • 效率类工具
  • 最全面的 RSS 教程
  • 码字工具
  • 各大平台
  • 校招
  • 五险一金
  • 职场规划
  • 关于离职
  • 杂谈
  • 自媒体
  • 📖 读书

    • 读书工具
    • 走进科学
  • 🌍 英语

    • 从零开始学英语
    • 英语兔的相关视频
    • Larry 想做技术大佬的相关视频
  • 🏛️ 政治

    • 新闻合订本
    • 反腐
    • GFW
    • 404 内容
    • 审查与自我审查
    • 互联网
    • 战争
    • 读书笔记
  • 💰 经济

    • 关于税
    • 理财
  • 💪 健身

    • 睡眠
    • 皮肤
    • 口腔健康
    • 学会呼吸
    • 健身日志
  • 🏠 其他

    • 驾驶技能
    • 租房与买房
    • 厨艺
  • 电影

    • 电影推荐
  • 电视剧
  • 漫画

    • 漫画软件
    • 漫画推荐
  • 游戏

    • Steam
    • 三国杀
    • 求生之路
  • 小说
  • 关于本站
  • 关于博主
  • 打赏
  • 网站动态
  • 友人帐
  • 从零开始搭建博客
  • 搭建邮件服务器
  • 本站分享
  • 🌈 生活

    • 2022
    • 2023
    • 2024
    • 2025
  • 📇 文章索引

    • 文章分类
    • 文章归档
  • 计算机简史

  • 数字电路

  • 计算机组成原理

    • 计算机组成原理(北大-陆俊林)

    • 字符编码入门

      • 简单聊聊计算机之中的时间
      • 简单聊聊字符编码
      • ASCII 字符表和说明
      • ASCII 的 SOH 的用处
      • 回车和换行
      • 汉字是怎么编码的
      • 简单聊聊 Unicode
      • 手持两把锟斤拷,口中疾呼烫烫烫
      • 数据库与编码
      • 编程语言与字符编码
      • URL 编码
        • 为什么需要 URL 编码
        • URLEncoder
        • URLDecoder
        • 完整代码
        • 小结
      • Base64 编码
      • 字符编码小结
      • 一些有趣的代码注释
  • 操作系统

  • Linux

  • 计算机网络

  • 数据库

  • 编程工具

  • 装机

  • 计算机基础
  • 计算机组成原理
  • 字符编码入门
2023-02-06
目录

URL 编码

# 21.URL编码

URL 编码是浏览器发送数据给服务器时使用的编码,它通常附加在 URL 的参数部分。

‍

# 为什么需要 URL 编码

举个例子,我们在百度里搜索“中文”这两个字,其发送给后台服务器的网址类似这样的:https://www.baidu.com/s?wd=%E4%B8%AD%E6%96%87 (opens new window)

我们可以打开浏览器控制台查看:

​​

这些字符串是怎么来的呢?是通过 URL 编码的方式得出的。以前很多服务器只识别 ASCII 字符。但如果 URL 中包含中文、日文这些非 ASCII 字符怎么办?就得 URL 编码规则来转换了:

  • 如果字符是 A ~ Z​,a ~z​,0 ~ 9​ 以及 -​、_​、.​、*​,则保持不变
  • 如果是其他字符,先转换为 UTF-8 编码,然后对每个字节以 %XX​表示
  • URL 编码总是大写

例如:字符 中​​的 UTF-8 编码是 0xe4b8ad​​,因此,它的 URL 编码是 %E4%B8%AD​​。 ‍

# URLEncoder

很多语言都提供了对 URL 进行编码的工具类。例如在 Java 中,提供了 URLEncoder 来对字符进行编码,我们来试试对“中文!” 这个词进行编码:

import java.net.URLEncoder;

public class TestURL{
    public static void main(String[] args) throws Exception{
        String encoded = URLEncoder.encode("中文!", "UTF-8");
        System.out.println(encoded);
    }
}

1
2
3
4
5
6
7
8
9

上述代码的运行结果是 %E4%B8%AD%E6%96%87%21​,中 ​的 URL 编码是 %E4%B8%AD​,文 ​的 URL 编码是 %E6%96%87​,! ​虽然是 ASCII 字符(这里用更多是半角符号),也要对其编码为 %21​。

和标准的 URL 编码稍有不同,URLEncoder 把空格字符编码成 +​,而现在的 URL 编码标准要求空格被编码为 %20​,不过,服务器都可以处理这两种情况。 ‍

# URLDecoder

如果服务器收到 URL 编码的字符串,就可以对其进行解码,还原成原始字符串。Java 标准库的 URLDecoder ​就可以解码:

import java.net.URLDecoder;
import java.nio.charset.StandardCharsets;
public class TestURL {
    public static void main(String[] args) {
        String decoded = URLDecoder.decode("%E4%B8%AD%E6%96%87%21", StandardCharsets.UTF_8);
        System.out.println(decoded);
    }
}
1
2
3
4
5
6
7
8

# 完整代码

import java.net.URLDecoder;
import java.net.URLEncoder;

public class TestURL {
  public static void main(String[] args) throws Exception{
    String encoded = URLEncoder.encode("中文!", "UTF-8");
    System.out.println(encoded);  //%E4%B8%AD%E6%96%87%21


    String decoString = URLDecoder.decode("%E4%B8%AD%E6%96%87%21", "UTF-8");
    System.out.println(decoString);    //中文
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13

‍

# 小结

URL 编码的目的是把任意文本数据编码为 %​ 前缀表示的文本,编码后的文本仅包含 A ~ Z​,a ~ z​,0 ~ 9​,-​,_​,.​,*​ 和 %​,便于浏览器和服务器处理。 ‍

上次更新: 2025/6/3 17:50:46
编程语言与字符编码
Base64 编码

← 编程语言与字符编码 Base64 编码→

最近更新
01
新闻合订本 2025-10
10-31
02
2025 年 10 月记
10-30
03
用 AI 批量优化思源笔记排版
10-15
更多文章>
Theme by Vdoing | Copyright © 2022-2025 | 粤 ICP 备 2022067627 号 -1 | 粤公网安备 44011302003646 号 | 点击查看十年之约
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式