tar 讀取

  • 導入 tarfile module
  • 利用 filename_format 和 csv_format 來建立檔名
  • 讀取 2016-12-18 的 tar 檔並且列表
  • 打開裡面 10 點鐘的資料的 csv 檔案物件
  • 讀內容看看 (.read 或 .readline)

In [ ]:
# 檔案名稱格式
filename_format="M06A_{year:04d}{month:02d}{day:02d}.tar.gz".format
csv_format = "M06A/{year:04d}{month:02d}{day:02d}/{hour:02d}/TDCS_M06A_{year:04d}{month:02d}{day:02d}_{hour:02d}0000.csv".format

利用 pandas 來讀入資料


In [ ]:
# Hint
from urllib.parse import quote_plus
"https://zh.wikipedia.org/wiki/"+quote_plus('臺灣行政區人口列表')

In [ ]:

  • 利用 pandas.read_csv 讀取 csv, 並依照國道高速公路手冊設定欄位
  • 查看前十筆資料
  • 用 .iloc 看第 11 筆資料
  • 只注意 TripInformation 和 VehicleType 兩欄(查看前五筆)
  • 找 VehicleType 是 32 的紀錄

In [ ]:
# 欄位名稱
M06A_fields = ['VehicleType',
               'DetectionTime_O','GantryID_O',
               'DetectionTime_D','GantryID_D ',
               'TripLength', 'TripEnd', 'TripInformation']

In [ ]: