re: 続 XHTML Media Types

id:nurseさんの記事を読んで気づいたのですが、元記事は見出しの不正なという単語により、valid、invalidについて書いているように読めますが、木俣としては利点に関する記事として書いているつもりでした。そのように読んだ方は、木俣の言葉不足が原因ですのでお詫びします。

「text/html として送信すると XHTML 文書であるメリットが失われてしまう」の方が同意できますかねぇ。そのような XHTML 文書でも、XHTML としてはやっぱり valid なわけで、それをもって HTML 4.01 に劣るとするのは若干の飛躍を感じます。

もし、text/html として送信すると XHTML 文書であるメリットが失われてしまうことで合意が得られれば、XML専用の処理機にとってはMIME型がtext/htmlなので処理対象外X/HTML処理機にとっては、XHTMLの利点が得られずHTML相当HTML処理機にとってはエラー処理必須となるので、結果として利点としては不正なHTML相当になる認識しております。

XML 文書としての信頼性」を考えた瞬間、それは XML 文書とみなされ、あとは中身でのみ議論されるのでもはや MIME Type は関係なくなる気がします。(つまり、MIME Type はあくまで受け手がどう扱うべきを提示しているものなので、受け手の処理が決めうち (この場合 XML 決めうち) な場合は効果がないように感じる)

予め、text/htmlとして送信されたHTML互換のXHTML文書であることを知っていれば上記のとおりと思いますが、未知のURLへ接続した結果text/htmlとしてXMLかもしれない文書を受信した場合、そもそもXML文書かという話があります。このため、結果XMLだったとしても、XMLとしてみなせるかどうかわからない分だけtext/xmlapplication/xmlapplication/xhtml+xmlとして受信したXHTML文書よりtext/htmlとして取得したXHTMLXMLとして劣ると考えます。

それはそもそもイレギュラーというか、1.広告挿入は XHTML 対応になるべき 2.そういう場合はたしかに HTML 4.01 の方がいいけど一般には影響しないね でしょうな。

2については、極めて稀であってもUA (XSLTや、XHTMLを処理するJavaScriptなど広い範囲でのUA) は対応しなければいけないので、影響範囲は広いと思うのですが……それはそれとして、1に関しては完全にそのとおりで、XHTML1.0策定直後ならいざ知らず、XHTML Media TypesによってHTML互換のXHTMLtext/htmlで送信してもよい (RFC2119のMAY) と明記されて6年以上経った現在妥当な話ではなく、今読み返せば結論のためにこじつけた例でした。これについては後で元記事のほうも訂正します。