微信昵称中符号的使用情况

前天帮同事把公司一个微信公众号的关注用户导出来了。正好我已经好久好久没有发表文章了,特发水文一篇,证明我还在博客界混着,并没有离开。
Ps:绝对的水文,下述统计基本上没有什么意义,大家就不用讨论具体内容了,聊聊天就好。

我把20000个关注者的昵称,全部拆分开,得到了数字、不区分大小写的字母、汉字(含繁体、异体、长得像中文的日文)以及其他符号共四类,共81426个样本。
四者占用比例如下:
usedrate

接下来,是字母、数字、符号的分布情况:
letters

numbers

symbols

虽然我说了这个统计没什么意义,不过“问号”有点儿太多了吧。
表情符号?UTF8转GB2312出错?还是微信昵称中的那些图片表情?

最后是中文,来两张(汉字在20000用户中出现了3632个,太多了,图表的X轴就不显示了吧):
hanzi-pinyin

hanzi-usedrate

最后的最后,本来要写个总结的,但是这些统计实在没什么意义(又不是涉及到数百上千万用户的大数据统计),那么,就这样吧。

文章发完,闪人,继续闭关。

作者: Leniy

Do not , for one repulse , give up the purpose that you resolved to effect . 本文著作版权归Leniy所有,并受法律保护。 转载、使用整体或任何部分的内容(包含但不限于各个页面的标题、评论框提示语)须经过Leniy的授权。 CopyRight © 2006-2017 Leniy.org all rights reserved.

23 thoughts on “微信昵称中符号的使用情况

发表评论

电子邮件地址不会被公开。 必填项已用*标注