开发者社区> 问答> 正文

求一个验证 (数字,字母(不分大小写) ,中文汉字) 的正则表达式

项目里面用到了分词,但是得到很多无关的分词,比如标点,各种符号之类的。后来在黑名单里面加了中文停用词,能去除绝大部分,但是还是有一些奇奇怪怪的符号去不掉。所以求一个正则:只能是 (数字,字母(不区分大小写),汉字)或其任意组合。
比如
1.abcF
2.as212
3.das你好1d
4.34D4H好
5.大家

展开
收起
蛮大人123 2016-02-27 14:55:11 2834 0
1 条回答
写回答
取消 提交回答
  • 我说我不帅他们就打我,还说我虚伪

    u4E00-u9FA5uF900-uFA2D
    加上
    w

       public static void main(String[] args) {
            // TODO implement RegexStuff.main
            String regex = "([\u4E00-\u9FA5\uF900-\uFA2D]|\\w)+";
            //Pattern pattern = Pattern.compile(regex);
    
            String str1 = "abcF";
            String str2 = "as212";
            String str3 = "das你好1d";
            String str4 = "34D4H好";
            String str5 = "大家";
            System.out.println(str1.matches(regex)); // true
            System.out.println(str2.matches(regex)); // true
            System.out.println(str3.matches(regex)); // true
            System.out.println(str4.matches(regex)); // true
            System.out.println(str5.matches(regex)); // true
    
        }

    参考:http://benchild.iteye.com/blog/689603

    2019-07-17 18:48:53
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载