当前位置: 移动技术网 > IT编程>开发语言>PHP > php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总

php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总

2018年06月25日  | 移动技术网IT编程  | 我要评论

威特猛,公主恋人ova无修版,江西省抚州市区号

从旧版升级到php5.4,恐怕最麻烦的就是htmlspecialchars这个问题了!当然,htmlentities也会受影响,不过,对于中文站来说一般用htmlspecialchars比较常见,htmlentities非常少用到。

可能老外认为网页普遍应该是utf-8编码的,于是苦了那些用gb2312,gbk编码的中文站......!

具体表现:

复制代码 代码如下:

$str = "9enjoy.com的php版本是5.2.10";
echo htmlspecialchars($str);

gbk字符集下输出为空...utf-8下,输出正常。

为什么呢,原因在于5.4.0对这个函数的变化:

复制代码 代码如下:

5.4.0   the default value for the encoding parameter was changed to utf-8.

原来是什么呢?
复制代码 代码如下:

string htmlspecialchars ( string $string [, int $flags = ent_compat | ent_html401 [, string $encoding = 'utf-8' [, bool $double_encode = true ]]] )

defines encoding used in conversion. if omitted, the default value for this argument is iso-8859-1 in versions of php prior to 5.4.0, and utf-8 from php 5.4.0 onwards.


原来是iso-8859-1,5.4后默认变成utf-8!然后中文使用这个函数就输出为空白了。

国内一堆开源程序在5.4下都会有这样的问题,discuz官方也建议用户不要升级到5.4

解决方案:

1.苦逼的修改所有用到htmlspecialchars地方的程序

1.1 其第二个$flags参数,默认是ent_compat,因此改成

复制代码 代码如下:

htmlspecialchars($str,ent_compat,'gb2312');

为什么不是gbk?因为没有gbk这个参数,如果强行使用gbk,则报错给你看:
复制代码 代码如下:

warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8

为了能使用gbk,则改成:
复制代码 代码如下:

htmlspecialchars($str,ent_compat,'iso-8859-1');

1.2.一样是改程序,但可以省略一个参数。
可以在网页头部加
复制代码 代码如下:

ini_set('default_charset','gbk');

然后改成
复制代码 代码如下:

htmlspecialchars($str,ent_compat,'');

文档中有写:an empty string activates detection from script encoding (zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. not recommended.
大概意思就是:传入空字符串则使用default_charset的编码

1.3.封装一个函数吧...本来htmlspecialchars这个单词一直不好记。

复制代码 代码如下:

function htmlout($str) {
    return htmlspecialchars($str,ent_compat,'iso-8859-1');
}

然后去批量替换。

2.直接修改源码,重编译!这也是目前我在线上做的方案。
修改ext/standard/html.c
大概在372行

复制代码 代码如下:

/* default is now utf-8 */
if (charset_hint == null)
return cs_utf_8;

把cs_utf_8改成 cs_8859_1
复制代码 代码如下:

/* default is now utf-8 */
if (charset_hint == null)
return cs_8859_1;

编译后,原程序就不用做任何调整了。
安装方法可参考:

windows下怎么办?这个,自己想办法编译吧,难度比较大...
提供一个网址供参考:
引用其一句话:准备好咖啡、可乐,做好准备,可能要折腾数小时…

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网