Grails 引发的中文乱码问题

在一个 Grails 项目里面,我想写一个过滤不良信息的 Service,而将过滤的规则放置在 xml 文件之中。

以下 xml 文件放置不良信息,包含单词、词组和句法,支持正则表达式:

<filter>
    <words>
        <word>fuck</word>
        <word>kill</word>
    </words>
    <phrases>
        <phrase>asshole</phrase>
    </phrases>
    <grammars>
        <grammar>kick.*ass</grammar>
        <grammar>impud.nce</grammar>
    </grammars>
</filter>

然后是一个完成过滤功能的 Service:

classFilterService{
    def private static node=newXmlParser().parse(newFile('./config/filter.xml'))
    static Stringfilter(Stringsource){
        def substitution=node.substitution.text()
        def sensitive=[node.words.word*.text().join('|'),
        node.phrases.phrase*.text().join('|'),
        node.grammars.grammar*.text().join('|')].join('|')

        if(!source||!sensitive)returnsource
            returnsource.replaceAll(sensitive,substitution)
    }
}

就这样的代码,结果在 Grails 运行时出现中文问题,并且不止是页面,在 filter 方法里面就已经无法正确显示中文,而 Service 中同样的代码在普通 Groovy 应用程序中就没有中文问题。

按照以前 J2EE 开发的经验,尝试使用如下方法:

String result=new String(testString.getBytes("iso-8859-1"),"UTF-8")

依旧乱码……

再次尝试:增加定义的运行参数-Dfile.encoding=UTF-8
无效……

xml 文件中加入

<?xmlversion="1.0"encoding="UTF-8"?>

仍然无效……


琢磨了半天,得出解决方案:

譬如打算将整个项目编码统一成 UTF-8 格式的,我使用 Eclipse 开发,我的 Eclipse 默认的的编码是 GBK 的,那么这个可以保持不变,在项目上单击右键,选择 Properties 中的 Resource,将 Text file encoding 设置成 UTF-8。

image

注意:这样的后果是项目 groovy 等文件中原本使用 GBK 的中文会变成乱码!因此请选择合适的编码。

之后删除运行参数-Dfile.encoding=UTF-8。

再做一则改动:

//将原来的
def node=newXmlParser().parse(newFile('./config/filter.xml'))
//改为
def node=newXmlParser().parseText(newFile('./config/filter.xml').getText())

最后,页面上面老规矩,加上:

<meta http-equiv="Content-Type" content="text/html; charset=GBK" />

就可以了。

如果你的编码是 GBK 的,一样处理。

文章未经特殊标明皆为本人原创,未经许可不得用于任何商业用途,转载请保持完整性并注明来源链接 《四火的唠叨》

11,712 次阅读

发表评论

电子邮件地址不会被公开。

back to top