IT・プログラミング雑学

URLとURIの違いとは?アドレス?識別子?定義から意味までプログラマーがわかりやすく解説

どこまで知ってる?URIの豆知識

image by iStockphoto

URIがどういうものかについては大体説明したので、知っていると自慢できるかもしれない豆知識をご紹介します。いくつご存知でしょうか。

Webだけじゃない、さまざまな場所で使うURI

URLで圧倒的に使われているのがWebアドレスですが、他にもいろいろなものがあります。その種類を示すがのが先頭にある「https://」という部分、これが「スキーム」です。

「http://」や「https://」ならばWebアドレスになります。他に先ほど説明したファイルを示すのが「file://」です。この他に見かけるのは「mailto:」でしょう。問い合わせ先のメールアドレスを掲載するのに使います。

このスキームで、IANA(インターネット番号割当機関、アイアナ)で管理しているものが公式スキーム広く使われているが管理されていないものが非公式スキームです。例えば、Webページで使う「javascript:」というスキームがありますが、これは非公式。スキームの後の書き方はスキームごとに決まっています。

正しく理解している?URLに関する誤った知識

他のWebサイトでもURIやURLを解説した記事があります。そこでよく出てくる間違い「https://XXX/YYY」がURIで、スキームを除いた「XXX/YYY」がURLである、というものです。最近のブラウザではいちいち「https://」を打たなくてもURLを認識してくれますし、そもそも表示されなくなってきています。そう言うことから誤解が広がったのかもしれませんね。

ただ、これは明確な誤りです。スキームも含めてURLになります。もし、上のような解説を見かけて誰かがそれを見ていたら、「それはちがう」と教えてあげてください。参考までにURLの定義を引用します。URLがスキームとスキームごとのパートからできていることが明白です。

2.1. The main parts of URLs

A full BNF description of the URL syntax is given in Section 5.
In general, URLs are written as follows:
<scheme>:<scheme-specific-part>

RFC1738より抜粋

URIに使ってよい文字、悪い文字

URIには使ってよい文字と悪い文字があります。例えば「:」や「/」はURLの区切りに使うものですので使えません英数字は使えますが、そのままでは漢字などは使えません。ブラウザによってはアドレス欄に日本語を表示しますが、ユーザの利便性のためにそのように表示してくれているだけです。そのような文字はどうするかと言えば「%XX」という表現に置き換えます。例えば「https://ja.wikipedia.org/wiki/%E3%83%89%E3%83%A9%E3%82%B4%E3%83%B3%E6%A1%9C」です。

また、当初長さについては決まっていませんでしたが、今は最大255文字と決まっています。これは上のような「%XX」というものを含めたものです。上のURLならば75文字とカウントします。

\次のページで「一般的に使うのはURL、URNやURIは存在だけ記憶の片隅に」を解説!/

次のページを読む
1 2 3 4
Share: