htmlソースには文字列として書いてはいけない(または書かない方がいい)文字が幾つかあります。 有名なところではタグで使用される「<」と「>」など。これらはそのままソースに書くと ブラウザがプログラムコードとして認識するためバグが出ます。それを避けるために 実体参照があります。文字を「意味」としてではなく単なる「形」として表示するのです。
実際には、日本は2バイト文字圏なので「半角」と呼ばれる1バイト文字を使わず、2バイトで「<」 (←区別が付きませんが2バイトで入力しています。)などと入力すれば 通常何の問題もないのですが、ソースコードのコピペなどを前提にしたページを作ろうとしたりすれば 「実体参照」を使わざるを得ません。
< | < | タグの開始 |
> | > | タグの閉じ |
& | & | 実体参照開始文字 |
" | " | 属性値を挟む二重引用符 |
¥ | ¥ | DOS(WIN)用ディレクトリの区切り |
© | © | 著作権表示 |
他にも幾らでもあります(通常文字を含め文字の分だけあるらしいです)しかしwebサイトで使うとなるとこのくらいでしょうか。 なお、XMLでは「'」(アポストロフィ)も「'」と実体参照しなくてはいけませんが、XHTMLでは参照できません。 バグでしょうか。