检查结果: 数据检查完毕,这次没有发现有坐标异常点(有的注释是之前初步检查时发现的,彼时信息不全,当信息补充完整后,问题数据应该都被删掉了)


In [ ]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from matplotlib import cm
plt.rcParams['figure.figsize'] = (16 ,12)

In [ ]:
df = pd.read_csv('Tokyo.txt', delimiter='\s+')
for i in [10, 15, 18, 20, 25]:
    fig, ax = plt.subplots()
    cmap = cm.get_cmap('BuGn')
    ax = df.plot.hexbin(x='lon', y='lat', gridsize=i, sharex=False, ax=ax, cmap=cmap,  vmin=0, vmax=10000)
    plt.title('tokyo')
    plt.show()
#     fig.savefig('tokyo{}.png'.format(i))
# 运行此程序发现有一个东经138度的异常点,手工去除后,重新运行
# 最红的几个点,从左下到右上三个点分别为涩谷区, 东京证券交易所, 不明
# 中心点: 35.68, 139.78
# 35.66, 139.7   35.7, 139.77 35.715, 139.8

In [ ]:
df2 = pd.read_csv('London.txt', delimiter='\s+')
for i in [10, 15, 18, 20, 25]:
    cmap = cm.get_cmap('BuGn')
    fig, ax = plt.subplots()
    df2.plot.hexbin(x='lon', y='lat', gridsize=i, sharex=False, ax=ax, cmap=cmap, vmin=0, vmax=50000)
    # df2.plot.scatter(x='lon', y='lat', sharex=False) #用于检测异常值, 共检测到至少三个异常点,需要剔除
    plt.title('london')
    plt.show()
#     fig.savefig('london{}.png'.format(i))
# 中心点: 51.515, -0.10
# 51.51, -0.13 周围名胜很多, 位于白金汉宫和大英博物馆的中间