适用于XML、HTML和XHTML文档的有效内容类型

17 浏览
0 Comments

适用于XML、HTML和XHTML文档的有效内容类型

XML、HTML和XHTML文档的正确的内容类型是什么?

我需要编写一个简单的爬虫程序,只获取这些类型的文件。

现在,由于mod_rewrite的原因,例如http://example.net/index.html可以充当JPEG文件,因此我需要检查响应头中的内容类型并将其与允许的内容类型列表进行比较。

我可以从哪里获取这样的列表?

admin 更改状态以发布 2023年5月21日
0
0 Comments

HTML: text/html,句点。

XHTML: application/xhtml+xml,如果遵循HTML兼容性指南,则为text/html。请参阅W3媒体类型注释

XML: text/xmlapplication/xmlRFC 2376)。

还有许多以XML为基础的其他媒体类型,例如application/rss+xmlimage/svg+xml。可以肯定的是,任何未被识别但以+xml结尾的注册媒体类型都是基于XML的。请参阅IANA列表以了解以+xml结尾的注册媒体类型。

(对于未注册的x-类型,一切都不确定,但您希望+xml会受到尊重。)

0