今天朋友拿了一份加了密的数据,让帮忙做个解密,记录一下。
摩拜单车举行的单车停放点位置预测数据挖掘竞赛中的数据也是这样的,起始位置和终止位置是经过geohash算法编码的。可以使用Python的geohash包来进行解析。
一、安装库
pip install Geohash
复制
二、使用
-
转换前
-
demo
from Geohash import geohash
import pandas as pd
# 调用Geohash库的decode方法,定义解码函数
def decode_data(data):
return geohash.decode(data)
if __name__ == '__main__':
# 读取数据
df_data = pd.read_csv('ceshi.csv')
# 使用apply方法,调用解码方法进行解码
df_data['start_loc'] = df_data['geohashed_start_loc'].apply(decode_data)
df_data['end_loc'] = df_data['geohashed_end_loc'].apply(decode_data)
# 预览
print(df_data)
# 保存
df_data.to_csv('result.csv')
复制
- 转换后
三、问题排查
【问题】
安装之后,直接导入会有问题,需要找到geohash.py,把该文件放到项目下才行。
-
【方式一】可以直接找到该文件,copy到项目下
-
【方式二】去github下载
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
目录