php专区

 首页 > php专区 > PHP高级 > 缓存异常处理 > 织梦中文分词 输入的词语返回乱码怎么处理

织梦中文分词 输入的词语返回乱码怎么处理

分享到:
【字体:
导读:
         摘要:织梦中文分词 输入的词语返回乱码怎么办织梦的中文分词,词库中明明有烦恼,忧愁这样的词语,但是测试输入,返回乱码,不知道是怎么回事,还有这样的代码&n...

织梦中文分词 输入的词语返回乱码怎么处理
织梦中文分词 输入的词语返回乱码怎么办
织梦的中文分词 ,词库中明明有烦恼 ,忧愁这样的词语 ,但是测试输入 ,返回乱码 ,不知道是怎么回事   ,还有这样的代码  else if($n>0xA13F && $n < 0xAA40) , 其中 0xA13F ,0xAA40 是怎么来的 。
php中文分词,织梦中文分词

------解决方案--------------------
if($n>0xA13F && $n < 0xAA40) 是全角符号

他用的是 gbk 字符集,如果你不是的,那一定会乱码的
------解决方案--------------------
他首先用 ReviseString 方法对传入串做预处理
其中有
        //如果中文字符
        if(isset($str[$i+1])){
          $c = $str[$i].$str[$i+1];
就是说他认为一个中文是由两个字节组成的,这是 gbk 的编码规则
而一个非 ascii 的 utf-8 字符可以是 2个、3个、4个...字节组成
汉字的 utf-8 多由 3 个字节组成

你只把文件内容改为 utf-8 的,没有改变处理规则
出现乱码不就是很正常的了吗?
------解决方案--------------------
调用前将 utf-8 转成 gbk 的
调用后在把 贵宾卡 转成 utf-8 的
这样就不需要研究算法了 织梦中文分词 输入的词语返回乱码怎么处理
分享到:
一个关于dedecms系统的有关问题,刚开始...
一个关于dedecms系统的有关问题,刚开始学这个系统,遇到个小疑点,望大家帮忙解决。 一个关于dedecms系统的问题,刚开始学这个系统,遇到个小问题,望大家帮忙解决。。 问题如图所示! DedeCMS 分享到: ...
关于MYSQL数据封存用utf8编码保存,有的...
关于MYSQL数据封存用utf8编码保存,有的数据搜索不到 关于MYSQL数据保存用utf8编码保存,有的数据搜索不到我的网页用的是utf8编码,所以在保存数据时加入了mysql_query("set names &#039;utf-8&#039;");  mysql整理成了utf8_general_ci 而我在搜索数据时 $so="爱你一万年"; movie` WHERE `a0` LIKE &#039;%$so%&#03...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……