前端时间挺无聊的,而且正好接触了一些大数据的内容,就简单统计了一下战雷的这个数据。
代码其实很简单,用不了多少时间(其实大部分GPT帮忙搞定...)
下面就是结果了。
今年1月的:

去年12月的:

目前有几点,会存在误差,主要是拼音的检测,由于它基本上只能匹配字符串,比较呆,会出现一些误认的情况,比如说Naga1224这个ID,可能就会被误报,不好说是不是拼音。
再比如说部分统计数字可能会出现重复,比如说英语昵称里可能会包含拼音昵称,不过对于其他语言,特别是非英语字符的统计,还是比较容易且准确的,毕竟只要有就可以+1了。
大体就是这个样子,看贴吧里很多人好奇这个ID的数量组成,就发出来给大家看看。
代码其实很简单,用不了多少时间(其实大部分GPT帮忙搞定...)
下面就是结果了。
今年1月的:

去年12月的:

目前有几点,会存在误差,主要是拼音的检测,由于它基本上只能匹配字符串,比较呆,会出现一些误认的情况,比如说Naga1224这个ID,可能就会被误报,不好说是不是拼音。
再比如说部分统计数字可能会出现重复,比如说英语昵称里可能会包含拼音昵称,不过对于其他语言,特别是非英语字符的统计,还是比较容易且准确的,毕竟只要有就可以+1了。
大体就是这个样子,看贴吧里很多人好奇这个ID的数量组成,就发出来给大家看看。