html
--- 超文本标记语言支持¶
该模块定义了操作HTML的工具。
- html.escape(s, quote=True)¶
将字符串 s 中的字符
&
、<
和>
转换为安全的HTML序列。 如果需要在 HTML 中显示可能包含此类字符的文本,请使用此选项。 如果可选的标志 quote 为真值,则字符 ("
) 和 ('
) 也被转换;这有助于包含在由引号分隔的 HTML 属性中,如<a href="...">
。在 3.2 版本加入.
- html.unescape(s)¶
将字符串 s 中的所有命名和数字字符引用 (例如
>
,>
,>
) 转换为相应的Unicode字符。 此函数使用HTML 5标准为有效和无效字符引用定义的规则,以及HTML 5 命名字符引用列表
。在 3.4 版本加入.
html
包中的子模块是:
html.parser
—— 具有宽松解析模式的HTML / XHTML解析器html.entities
-- HTML 实体定义