日期:2014-05-20  浏览次数:21190 次

如何判断一个字符串的内容是什么语言的?(帮顶有分)
如何判断一个字符串的内容是什么语言的?我只能判断出中文和英文的区别,其他语言呢?怎么判断?
或者换个说法,谁知道其他语言的码值范围?


------解决方案--------------------
不会,帮顶。
等待答案
------解决方案--------------------
有很多种语言参杂在里面算什么?
------解决方案--------------------
不知道

------解决方案--------------------
可能先要确定该字符串使用的哪种字符编码,utf-8,gb2312?在这些编码中,汉字是用一段连续的区间,其他的泰文,韩文等也是这样
------解决方案--------------------
极复杂的问题啊.....
好难!
------解决方案--------------------
有点复杂,顶 一下
------解决方案--------------------
支持一下
------解决方案--------------------
感觉很复杂。
日文和繁体中文某些汉字怎么判断?
比如:日本語
你说 日本 是简体中文还是日文?
語 是繁体中文还是日文?
------解决方案--------------------
:D
------解决方案--------------------
不知道怎么搞
------解决方案--------------------
我只知道如何把字符串转换为其他的语言编码,但是不知道如何判断其语言是什么.是个问题.
------解决方案--------------------
正则表达式可以。但是只能是枚举自己已知内容的unicode字符。
中文:[\u4E00-\u9FA5],匹配到就是中文否则再查
------解决方案--------------------
不过判断语言文化可以用
Currentculture
msdn里搜索:culture
------解决方案--------------------
应该和操作系统的语言相关联的~~
------解决方案--------------------
建议用UNCODE玛来判断全世界的语言都能判断的具体怎么做我不太清楚
------解决方案--------------------
帮顶。

------解决方案--------------------
关注中...
顺便帮顶
------解决方案--------------------
UNCODE 好像只有这编码才有可能...
------解决方案--------------------
不会啊 只能帮你顶一下
------解决方案--------------------
有难度啊,帮你顶下把,关注中
------解决方案--------------------
如果是正确的字符串,它就是Unicode编码
字符串的定义就是Unicode字符的序列~
------解决方案--------------------
楼主可以这样``把他们都转成unicode编码``再做个表,存放每个国家的的字符的范围,哈``虽然耗时了一点``不过相信这个表有些网站是有的``你再写个程序,转换成你要的格式就是了```
------解决方案--------------------
看来只能查表了
------解决方案--------------------
如果不知道编码方式,你不知道字符编码是几个字节,你也就无法分析,一个字符可以是一个两个或者更多字节,
------解决方案--------------------
获取 空格与空格之间的字符串 ..
获取全世界各个文字最常用的一部分 单词表 //比较难吖..
再判断 ~
------解决方案--------------------
关注...

友情帮顶之...
------解决方案--------------------
楼主还不清楚字符串编码格式问题。如果仅仅有一个字符串,本质上和二进制数没什么区别,你需要知道这个字符串的编码格式才能判断这个字符串的内容,进而判断字符串的语言。相同的字符串采用不同编码方式编码的结果是不一样的。反过来,相同的两个字节,用gbk和unicode方式解码出来的内容是不一样的,所以你要知道你的这个字符串采用什么编码格式才能进一步判断是什么语言
------解决方案--------------------