htmlentities 将字符转换为 HTML 转义字符
发表日期:2021-07-01 10:23:21 | 来源: | | 浏览(1431) 分类:字符串 函数
htmlentities
(PHP 4, PHP 5, PHP 7, PHP 8)
htmlentities — 将字符转换为 HTML 转义字符
说明
string
$string
,int
$flags
= ENT_COMPAT | ENT_HTML401,string
$encoding
= ini_get("default_charset"),bool
$double_encode
= true
): string
本函数各方面都和 htmlspecialchars() 一样, 除了 htmlentities() 会转换所有具有 HTML 实体的字符。
如果要解码(反向操作),可以使用 html_entity_decode()。
参数
-
string
-
输入字符。
-
flags
-
以下一组位掩码标记,用于设置如何处理引号、无效代码序列、使用文档的类型。 默认是
ENT_COMPAT | ENT_HTML401
。有效 flags
标记常量常量名 描述 ENT_COMPAT
会转换双引号,不转换单引号。 ENT_QUOTES
既转换双引号也转换单引号。 ENT_NOQUOTES
单/双引号都不转换 ENT_IGNORE
静默丢弃无效的代码单元序列,而不是返回空字符串。 不建议使用此标记, 因为它» 可能有安全影响。 ENT_SUBSTITUTE
替换无效的代码单元序列为 Unicode 代替符(Replacement Character), U+FFFD (UTF-8) 或者 � (其他),而不是返回空字符串。 ENT_DISALLOWED
为文档的无效代码点替换为 Unicode 代替符(Replacement Character): U+FFFD (UTF-8),或 �(其他),而不是把它们留在原处。 比如以下情况下就很有用:要保证 XML 文档嵌入额外内容时格式合法。 ENT_HTML401
以 HTML 4.01 处理代码。 ENT_XML1
以 XML 1 处理代码。 ENT_XHTML
以 XHTML 处理代码。 ENT_HTML5
以 HTML 5 处理代码。 -
encoding
-
An optional argument defining the encoding used when converting characters.
If omitted,
encoding
defaults to the value of the default_charset configuration option.Although this argument is technically optional, you are highly encouraged to specify the correct value for your code if the default_charset configuration option may be set incorrectly for the given input.
支持以下字符集:
支持的字符集列表 字符集 别名 描述 ISO-8859-1 ISO8859-1 西欧,Latin-1 ISO-8859-5 ISO8859-5 Little used cyrillic charset (Latin/Cyrillic). ISO-8859-15 ISO8859-15 西欧,Latin-9。增加欧元符号,法语和芬兰语字母在 Latin-1(ISO-8859-1) 中缺失。 UTF-8 ASCII 兼容的多字节 8 位 Unicode。 cp866 ibm866, 866 DOS 特有的西里尔编码。本字符集在 4.3.2 版本中得到支持。 cp1251 Windows-1251, win-1251, 1251 Windows 特有的西里尔编码。本字符集在 4.3.2 版本中得到支持。 cp1252 Windows-1252, 1252 Windows 特有的西欧编码。 KOI8-R koi8-ru, koi8r 俄语。本字符集在 4.3.2 版本中得到支持。 BIG5 950 繁体中文,主要用于中国台湾省。 GB2312 936 简体中文,中国国家标准字符集。 BIG5-HKSCS 繁体中文,附带香港扩展的 Big5 字符集。 Shift_JIS SJIS, 932 日语 EUC-JP EUCJP 日语 MacRoman Mac OS 使用的字符串。 ''
An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended. 注意: 其他字符集没有认可。将会使用默认编码并抛出异常。
-
double_encode
-
关闭
double_encode
时,PHP 不会转换现有的 HTML 实体, 默认是全部转换。
返回值
返回编码后的字符。
如果指定的编码 encoding
里,
string
包含了无效的代码单元序列,
没有设置 ENT_IGNORE
或者
ENT_SUBSTITUTE
标记的情况下,会返回空字符串。
更新日志
版本 | 说明 |
---|---|
5.6.0 |
The default value for the encoding parameter was
changed to be the value of the
default_charset configuration
option.
|
5.4.0 |
encoding 参数的默认值改成 UTF-8。
|
5.4.0 |
增加常量 ENT_SUBSTITUTE 、 ENT_DISALLOWED 、
ENT_HTML401 、 ENT_XML1 、
ENT_XHTML 、 ENT_HTML5 。
|
5.3.0 |
增加常量 ENT_IGNORE 。
|
5.2.3 |
增加参数 double_encode 。
|
范例
示例 #1 htmlentities() 例子
<?php $str = "A 'quote' is <b>bold</b>"; // 输出: A 'quote' is < b> bold< /b> echo htmlentities($str); // 输出: A ' quote' is < b> bold< /b> echo htmlentities($str, ENT_QUOTES); ?>
示例 #2 ENT_IGNORE
用法示例
<?php $str = "\x8F!!!"; // 输出空 stringecho htmlentities($str, ENT_QUOTES, "UTF-8"); // 输出 "!!!"echo htmlentities($str, ENT_QUOTES | ENT_IGNORE, "UTF-8"); ?>
参见
- html_entity_decode() - Convert HTML entities to their corresponding characters
- get_html_translation_table() - 返回使用 htmlspecialchars 和 htmlentities 后的转换表
- htmlspecialchars() - 将特殊字符转换为 HTML 实体
- nl2br() - 在字符串所有新行之前插入 HTML 换行标记
- urlencode() - 编码 URL 字符串
- PHP(0)
- PHP杂项(34)
- PHP基础-李炎恢系列课程(20)
- 中文函数手册(0)
- 错误处理 函数(13)
- OPcache 函数(6)
- PHP 选项/信息 函数(54)
- Zip 函数(10)
- Hash 函数(15)
- OpenSSL 函数(63)
- Date/Time 函数(51)
- 目录函数(9)
- Fileinfo 函数(6)
- iconv 函数(11)
- 文件系统函数(81)
- 多字节字符串 函数(57)
- GD 和图像处理 函数(114)
- 可交换图像信息(5)
- Math 函数(50)
- 程序执行函数(11)
- PCNTL 函数(23)
- JSON 函数(4)
- SPL 函数(15)
- URL 函数(10)
- cURL 函数(32)
- 网络 函数(33)
- FTP 函数(36)
- Session 函数(23)
- PCRE 函数(11)
- PCRE 正则语法(19)
- 数组 函数(81)
- 类/对象 函数(18)
- 函数处理 函数(13)
- 变量处理 函数(37)
- SimpleXML 函数(3)
- 杂项 函数(31)
- 字符串 函数(101)
- addcslashes 以 C 语言风格使用反斜线转义字符串中的字符(0)
- addslashes 使用反斜线引用字符串(0)
- bin2hex 函数把包含数据的二进制字符串转换为十六进制值(0)
- chop rtrim() 的别名(0)
- chr 返回指定的字符(0)
- chunk_split 将字符串分割成小块(0)
- convert_cyr_string 将字符由一种 Cyrillic 字符转换成另一种(0)
- convert_uudecode 解码一个 uuencode 编码的字符串(0)
- convert_uuencode 使用 uuencode 编码一个字符串(0)
- count_chars 返回字符串所用字符的信息(0)
- crc32 计算一个字符串的 crc32 多项式(0)
- crypt 单向字符串散列(0)
- echo 输出一个或多个字符串(0)
- explode 使用一个字符串分割另一个字符串(0)
- fprintf 将格式化后的字符串写入到流(0)
- get_html_translation_table 返回使用 htmlspecialchars() 和 htmlentities() 后的转换表(0)
- hebrev 将逻辑顺序希伯来文(logical-Hebrew)转换为视觉顺序希伯来文(visual-Hebrew)(0)
- hebrevc 将逻辑顺序希伯来文(logical-Hebrew)转换为视觉顺序希伯来文(visual-Hebrew),并且转换换行符(0)
- hex2bin 转换十六进制字符串为二进制字符串(0)
- html_entity_decode Convert HTML entities to their corresponding characters(0)
- htmlentities 将字符转换为 HTML 转义字符(0)
- htmlspecialchars_decode 将特殊的 HTML 实体转换回普通字符(0)
- htmlspecialchars 将特殊字符转换为 HTML 实体(0)
- implode 将一个一维数组的值转化为字符串(0)
- join 别名 implode()(0)
- lcfirst 使一个字符串的第一个字符小写(0)
- levenshtein 计算两个字符串之间的编辑距离(0)
- localeconv Get numeric formatting information(0)
- ltrim 删除字符串开头的空白字符(或其他字符)(0)
- md5_file 计算指定文件的 MD5 散列值(0)
- md5 计算字符串的 MD5 散列值(0)
- metaphone Calculate the metaphone key of a string(0)
- money_format 将数字格式化成货币字符串(0)
- nl_langinfo Query language and locale information(0)
- nl2br 在字符串所有新行之前插入 HTML 换行标记(0)
- number_format 以千位分隔符方式格式化一个数字(0)
- ord 转换字符串第一个字节为 0-255 之间的值(0)
- parse_str 将字符串解析成多个变量(0)
- print 输出字符串(0)
- printf 输出格式化字符串(0)
- quoted_printable_decode 将 quoted-printable 字符串转换为 8-bit 字符串(0)
- quoted_printable_encode 将 8-bit 字符串转换成 quoted-printable 字符串(0)
- quotemeta 转义元字符集(0)
- rtrim 删除字符串末端的空白字符(或者其他字符)(0)
- setlocale 设置地区信息(0)
- sha1_file 计算文件的 sha1 散列值(0)
- sha1 计算字符串的 sha1 散列值(0)
- similar_text 计算两个字符串的相似度(0)
- soundex Calculate the soundex key of a string(0)
- sprintf 返回格式化字符串(0)
- sscanf 根据指定格式解析输入的字符(0)
- str_contains Determine if a string contains a given substring(0)
- str_ends_with Checks if a string ends with a given substring(0)
- str_getcsv 解析 CSV 字符串为一个数组(0)
- str_ireplace str_replace() 的忽略大小写版本(0)
- str_pad 使用另一个字符串填充字符串为指定长度(0)
- str_repeat 重复一个字符串(0)
- str_replace 子字符串替换(0)
- str_rot13 对字符串执行 ROT13 转换(0)
- str_shuffle 随机打乱一个字符串(0)
- str_split 将字符串转换为数组(0)
- str_starts_with Checks if a string starts with a given substring(0)
- str_word_count 返回字符串中单词的使用情况(0)
- strcasecmp 二进制安全比较字符串(不区分大小写)(0)
- strchr 别名 strstr()(0)
- strcmp 二进制安全字符串比较(0)
- strcoll 基于区域设置的字符串比较(0)
- strcspn 获取不匹配遮罩的起始子字符串的长度(0)
- strip_tags 从字符串中去除 HTML 和 PHP 标记(0)
- stripcslashes 反引用一个使用 addcslashes() 转义的字符串(0)
- stripos 查找字符串首次出现的位置(不区分大小写)(0)
- stripslashes 反引用一个引用字符串(0)
- stristr strstr() 函数的忽略大小写版本(0)
- strlen 获取字符串长度(0)
- strnatcasecmp 使用“自然顺序”算法比较字符串(不区分大小写)(0)
- strnatcmp 使用自然排序算法比较字符串(0)
- strncasecmp 二进制安全比较字符串开头的若干个字符(不区分大小写)(0)
- strncmp 二进制安全比较字符串开头的若干个字符(0)
- strpbrk 在字符串中查找一组字符的任何一个字符(0)
- strpos 查找字符串首次出现的位置(0)
- strrchr 查找指定字符在字符串中的最后一次出现(0)
- strrev 反转字符串(0)
- strripos 计算指定字符串在目标字符串中最后一次出现的位置(不区分大小写)(0)
- strrpos 计算指定字符串在目标字符串中最后一次出现的位置(0)
- strspn 计算字符串中全部字符都存在于指定字符集合中的第一段子串的长度。(0)
- strstr 查找字符串的首次出现(0)
- strtok 标记分割字符串(0)
- strtolower 将字符串转化为小写(0)
- strtoupper 将字符串转化为大写(0)
- strtr 转换指定字符(0)
- substr_compare 二进制安全比较字符串(从偏移位置比较指定长度)(0)
- substr_count 计算字串出现的次数(0)
- substr_replace 替换字符串的子串(0)
- substr 返回字符串的子串(0)
- trim 去除字符串首尾处的空白字符(或者其他字符)(0)
- ucfirst 将字符串的首字母转换为大写(0)
- ucwords 将字符串中每个单词的首字母转换为大写(0)
- vfprintf 将格式化字符串写入流(0)
- vprintf 输出格式化字符串(0)
- vsprintf 返回格式化字符串(0)
- wordwrap 打断字符串为指定数量的字串(0)