re: 続々XHTML Media Types
閲覧者側の XHTML の利点って、text/html にしただけですべてふっとんでしまいましたっけ。
text/html
として受信した文書はHTMLとして処理し、XMLとして処理しないのがデフォルトだと思っています。例えば、HTML4.01の文書をtext/plain
として受信した場合、テキストとして処理し、HTMLとして処理しないように。
text/htmlとして送信されたXHTMLはXMLとして処理されないので、XMLとしての利点は得られません。
逆に言えば、text/plain
として受信したHTML4.01の文書も、HTMLとして処理すればHTMLの利点が得られる程度には、text/html
として受信したXHTML1.0も、XMLとして処理すればXMLの利点が得られるとは思いますが。
DOCTYPE を見れば XHTML だとわかるので、XHTML として処理すればエラー処理は必要ないのではないでしょうか。
XHTMLを処理できないHTML用の処理機向けにXHTMLをtext/html
で送信するわけですから、そもそもXHTMLとしての処理を期待できません。
また、XHTMLとしての処理を期待するならMIMEをtext/html
にするべきではありません。
繰り返しになりますが、XMLであるHTMLとしてXHTMLで文書を作るのですから、text/html
としてのみXHTML文書を送信するというのは、XMLとしての利点がなく、HTML処理機にはエラー処理を要求することになるため、エラーのないHTML4.01に劣ります。
また、一般に、XHTMLを含むXMLを扱える人にとって、XHTML文書をapplication/xml
やtext/xml
、application/xhtml+xml
としても送信することがそんなに困難であるとは思えません (使っているサービスによっては送信するMIMEの設定を含め、各種設定変更ができなかったり、非常に高い技術が要求されるかもしれませんが)。
影響範囲は広いように見えるのですが、HTMLを扱う処理系ならば、広告挿入がなくてももとから HTML として不正な文書なども実際問題としては処理しないといけないわけで、XHTML の事情がなくてもエラー処理は入ってるのでは。
広告の例は、前回指摘いただいたように例そのものが不適切でした。が、それはそれとして、木俣がこの例で想定していたのは、XML専用のUAです (よって強制空要素の記述があると解釈できなくなるから問題としていました)。