重点区域人群密度预测

北京市政务数据资源网-连环夺宝

新型冠状病毒肺炎疫情牵动人心,举国关注。人口的流动聚集,客观上加大了疫情传播的风险和防控的难度。出于对公共卫生、重大公共利益相关影响的为研究目的,为进一步掌握人员流动聚集动向,做好紧急疫情的防控工作。本赛题针对疫情相关的做重点区域人群聚集密度预测。

本次比赛,选取北京市100个不同类别的重点区域,提供各区域历史多天分小时人群密度数据。同时,提供北京六环内历史多天分小时的网格(200*200)人群密度、北京市迁入和迁出指数、网格间联系强度指数。参赛者需要根据这些已知数据,结合自己从互联网上获取的其他任何数据,来预测接下来每天分小时北京市重点区域的人群密度。

数据集包括北京市和全国其他省份城市天级的迁入迁出指数,北京市分网格(200*200)的小时级别人群密度数据,各类别重点区域的小时级别人群密度数据,以及网格之问的联系强度数据。

本次比赛将提供以下数据文件:

训练数据集:

北京市重点区域人流量指数,文件:area_passenger_info.csv重点区域的信息,文件首行无

字段名称含义示例
id区域id10
area_name区域名称北京市石景山体育场
area_type区域类型运动健身;体育场馆
center_x区域中心点经度,国测局02坐标系116.201709
center_y区域中心点纬度,国测局02坐标系39.906121
grid_x区域中心点所在网格的中心点经度,国测局02坐标系116.200936
grid_y区域中心点所在网格的中心点纬度,国测局02坐标系39.906260
area区域面积,单位为平方米90062.3125

文件:area_passenger_index.csv, 重点区域人流量情况, 文件首行无head,字段含义如下顺序。

字段名称含义示例
id区域id10
date、hour日期、小时2020011703
index人流量指数2.9

辅助训练数据集:
1.北京市迁徙指数
数据文件:migration_index.csv, 文件首行无head,字段含义如下顺序

字段名称含义示例
date迁徙日期20200201
departure_province迁徙出发省份广东省
departure_city迁徙出发城市深圳市
arrival__province迁徙到达省份北京市
arrival_city迁徙到达城市北京市
index迁徙指数1.83

2.北京市分网格人流量指数
数据文件:shortstay_20200201_20200215.csv、shortstay_20200117_20200131.csv, 文件首行无head,字段含义如下顺序

字段名称含义示例
date日期20200201
hour小时10
grid_x网格中心点经度,国测局02坐标系116.393779028
grid_y网格中心点纬度,国测局02坐标系39.8797856554
index人流量指数70.5

3.北京市网格联系强度, grid_strength.csv ,文件首行无head,字段含义如下顺序

字段名称含义示例
hour小时20200201
start__grid_x出发网格中心点经度,国测局02坐标系116.393779028
start__grid_y出发网格中心点纬度,国测局02坐标系39.8797856554
end_grid_x到达网格中心点经度,国测局02坐标系116.649814053
end_grid_y到达网格中心点纬度,国测局02坐标系39.9489893429
index联系强度0.2
2020/3/5赛题数据训练集 - md5: 0c21a86960672e13394460131bce077d
2020/3/5赛题数据训练数据-grid_strength.csv-更新 - md5: 4bb334acf8e2581ea1af1b18bd386568
网站地图