通常含むことのできない特殊記号や予約文字をただの文字としてURL内で使いたいという場合、ASCIIのURLエンコード(パーセントエンコーディング)を行って置換する必要があります。
予約文字とはディレクトリの区切りを表すスラッシュ(/)や、GETリクエスト時などに使われるURLパラメータの区切り文字であるアンパサンド(&)といった、URLで役割を与えられた記号のことです。
これらを正しくエンコードしないと意味のある記号として認識されてしまい、意図しないURLになってしまいます。
URLエンコード対応表
よく使う記号と、そのURLエンコード後の文字列の対応表を以下に記載します。
| 記号 | 記号の読み方 | エンコード後の文字列 |
|---|---|---|
| = | イコール | %3D |
| @ | アットマーク | %40 |
| % | パーセント | %25 |
| # | ハッシュ | %23 |
| $ | ドル | %24 |
| ! | エクスクラメーション | %21 |
| スペース | %20 | |
| “ | ダブルクォーテーション | %22 |
| \ | バックスラッシュ | %5C |
| & | アンパサンド(アンド) | %26 |
今は自動変換してくれるサービスなどもありますが、以上の記号との対応を覚えておけば、解析などを行う際にパッと見てどういう記号が含まれているかがわかるようになり捗ります。
