文章目录
文章目录
1. 手机号码组成
2. 手机号码段
3. 生成手机号码全库
4. 手机号码归属地数据源
5. 总结
1. 手机号码组成
❝我国手机号码由11位组成,其中,前3位网络识别号,第4-7位为地区编码,第8-11位为用户号码
❞
2. 手机号码段
中国移动号段:
❝134 135 136 137 138 139 147 148 150 151 152 157 158 159 165 172 178 182 183 184 187 188 198
❞
中国联通号段:
❝130 131 132 145 146 155 156 166 171 175 176 185 186
❞
中国电信号段:
❝133 149 153 173 174 177 180 181 189 191 199
❞
虚拟运营商:
❝170
❞
3. 生成手机号码全库
❝手机号码段相对固定,我搜集整理到号码段是48个,为了获取其完整的归属地数据,我首先生成全库。原理是,号码总共11位,前三位代表网络识别号(运营商),第4-7位为地区编码,最后4位才是用户标号,因此要获取归属地数据,我们只需要前8位即可,排列组合总共48(号码段) * 10000(10的4次方) = 480000种情况。由此生成号码全库
❞
4. 手机号码归属地数据源
❝网上有很多数据源,比如
❞
百度 https://haoma.baidu.com/
IP138 http://www.ip138.com/sj/
这些网站的数据采集十分简单,不在介绍具体的代码实现,主要是了解爬虫的分析思路。
5. 总结
❝❞
了解手机号码的组成:前3位网络识别号,第4-7位为地区编码,第8-11位为用户号码 生成手机号码全库(只根据前8位即可),共480000种排列组合 找合适的数据源,进行数据采集,逐条更新 480000条数据的归属地信息即可,截止到目前为止,供累计获取和更新434280条有归属地信息的数据 全库48W条数据,数据源采集很简单,不在赘述
文章转载自Python爬虫和数据挖掘,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
【专家有话说第五期】在不同年龄段,DBA应该怎样规划自己的职业发展?
墨天轮编辑部
1327次阅读
2025-03-13 11:40:53
【专家观点】罗敏:从理论到真实SQL,感受DeepSeek如何做性能优化
墨天轮编辑部
1316次阅读
2025-03-06 16:45:38
2025年2月国产数据库中标情况一览:GoldenDB 3500+万!达梦近千万!
通讯员
919次阅读
2025-03-06 11:40:20
2月“墨力原创作者计划”获奖名单公布
墨天轮编辑部
469次阅读
2025-03-13 14:38:19
AI的优化能力,取决于你问问题的能力!
潇湘秦
441次阅读
2025-03-11 11:18:22
优炫数据库成功应用于国家电投集团青海海南州新能源电厂!
优炫软件
346次阅读
2025-03-21 10:34:08
达梦数据与法本信息签署战略合作协议
达梦数据
300次阅读
2025-03-06 09:26:57
国产化+性能王炸!这套国产方案让 3.5T 数据 5 小时“无感搬家”
YMatrix
288次阅读
2025-03-13 09:51:26
GoldenDB数据库社区正式上线!期待与您共享新知
GoldenDB分布式数据库
242次阅读
2025-03-12 14:06:39
一键装库脚本3分钟极速部署,传统耗时砍掉95%!
IT邦德
240次阅读
2025-03-10 07:58:44