当前位置: 移动技术网 > IT编程>开发语言>PHP > php上传中文文件名乱码问题处理方案

php上传中文文件名乱码问题处理方案

2019年06月01日  | 移动技术网IT编程  | 我要评论

淘宝网夏装新款,邯郸肯雅隆,河间征婚

php上传文件是最最基础的一个技术点,但是深入进去也有不少问题需要解决,这不,上传中文文件后,文件名变成了乱码。

下面是问题代码,很简单:

1.问题代码

html部分:

复制代码 代码如下:

 <html>
 <body>
 <form action="upload_file.php" method="post"
 enctype="multipart/form-data">
 <label for="file">filename:</label>
 <input type="file" name="file" id="file" />
 <br />
 <input type="submit" name="submit" value="submit" />
 </form>
 </body>
 </html>

php部分:
 

复制代码 代码如下:

 <?php
 if ($_files["file"]["error"] > 0)
 {
     echo "return code: " . $_files["file"]["error"] . "<br />";
 }else
 {
     echo "upload: " . $_files["file"]["name"] . "<br />";
     echo "type: " . $_files["file"]["type"] . "<br />";
     echo "size: " . ($_files["file"]["size"] / 1024) . " kb<br />";
     echo "temp file: " . $_files["file"]["tmp_name"] . "<br />";
     if (file_exists("upload/" . $_files["file"]["name"]))
     {
         echo $_files["file"]["name"] . " already exists. ";
     }
     else
     {
       move_uploaded_file($_files["file"]["tmp_name"],
       "upload/" . $_files["file"]["name"]);
     }
 }

上传了一个文件名为“测试数据.txt”的文件,oh ho,文件是传上去了,但是文件名为乱码。

2.初试

网上搜索一下解决方案,将

复制代码 代码如下:

move_uploaded_file($_files["file"]["tmp_name"], "upload/" . $_files["file"]["name"]);

改成

复制代码 代码如下:

move_uploaded_file($_files["file"]["tmp_name"],"upload/" . iconv("utf-8","gbk",$_files["file"]["name"]));

结果发现iconv函数返回值为false。

查一下函数手册,发现第二个参数有特别的用法,简单翻译一下就是我可以在编码的后面追加//translit 或 //ignore ,前者会将无法翻译的字符转成最接近的字符,后者就是直接忽略不能转化的字符。

试一下:

复制代码 代码如下:

var_dump( iconv("utf-8","gbk//translit",$_files["file"]["name"]));
var_dump( iconv("utf-8","gbk//ignore",$_files["file"]["name"]));

结果:

bool(false) string(4) ".txt"

也就是说中文都没法转化,甚至连接近的字符都没有,看来网上介绍的方法也并非万能。

3.网上介绍方法失败,再尝试

猜测一下,也许我的系统在创建中文文件的时候会乱码,于是我将代码改写了一下:

复制代码 代码如下:

move_uploaded_file($_files["file"]["tmp_name"], "upload/测试数据.txt");

结果创建成功,没有乱码。。。也就是说不是系统问题。

想一下,我的php文件本身是utf8编码的,那么

复制代码 代码如下:

move_uploaded_file($_files["file"]["tmp_name"],"upload/测试数据.txt");

这个语句肯定使用的是utf8编码,那么之前上传的文件名肯定就不是utf8编码了,那么以下的语句肯定是错误的,因为源字符串本身就不是utf8编码的:

复制代码 代码如下:

iconv("utf-8","gbk//translit",$_files["file"]["name"]);

使用函数检查源字符串的编码:

复制代码 代码如下:

$e=mb_detect_encoding($text, array(‘utf-8', ‘gbk','gb2312'));
echo $e;

结果是cp936,也就是源字符串编码是gbk。

试一下

复制代码 代码如下:

move_uploaded_file($_files["file"]["tmp_name"],"upload/" . iconv("gbk","utf-8",$_files["file"]["name"]));

问题解决,不再乱码

4.另一种解决办法

实际上还有一种解决办法,就是在html文件的head标签中间加入

复制代码 代码如下:

<meta http-equiv="content-type" content="text/html; charset=utf-8" />

从而使编码保持统一,也就不需要再转码了

5.下面是结论

使用iconv函数可以解决上传中文文件名乱码的问题,实际上iconv能解决各种各样的由于编码不统一造成的乱码问题。
使用iconv函数请先检查源字符串的编码,除非你已经确定了源字符串的编码。
尽量保证所有的代码的编码一致,万不得已才使用iconv函数。
吐槽一下,尽量不使用中文文件名作为服务器上保存的文件名,请将文件名转化成自己的文件名(即使是英文文件名也请转化一下)。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网