
本次比赛,选取北京市100个不同类别的重点区域,提供各区域历史多天分小时人群密度数据。同时,提供北京六环内历史多天分小时的网格(200*200)人群密度、北京市迁入和迁出指数、网格间联系强度指数。参赛者需要根据这些已知数据,结合自己从互联网上获取的其他任何数据,来预测接下来每天分小时北京市重点区域的人群密度。
数据集包括北京市和全国其他省份城市天级的迁入迁出指数,北京市分网格(200*200)的小时级别人群密度数据,各类别重点区域的小时级别人群密度数据,以及网格之问的联系强度数据。
新型冠状病毒肺炎疫情牵动人心,举国关注。人口的流动聚集,客观上加大了疫情传播的风险和防控的难度。出于对公共卫生、重大公共利益相关影响的为研究目的,为进一步掌握人员流动聚集动向,做好紧急疫情的防控工作。本赛题针对疫情相关的做重点区域人群聚集密度预测。
本次比赛,选取北京市100个不同类别的重点区域,提供各区域历史多天分小时人群密度数据。同时,提供北京六环内历史多天分小时的网格(200*200)人群密度、北京市迁入和迁出指数、网格间联系强度指数。参赛者需要根据这些已知数据,结合自己从互联网上获取的其他任何数据,来预测接下来每天分小时北京市重点区域的人群密度。
数据集包括北京市和全国其他省份城市天级的迁入迁出指数,北京市分网格(200*200)的小时级别人群密度数据,各类别重点区域的小时级别人群密度数据,以及网格之问的联系强度数据。
本次比赛将提供以下数据文件:
训练数据集:
北京市重点区域人流量指数,文件:area_passenger_info.csv重点区域的信息,文件首行无
文件:area_passenger_index.csv, 重点区域人流量情况, 文件首行无head,字段含义如下顺序。
辅助训练数据集:
1.北京市迁徙指数
数据文件:migration_index.csv, 文件首行无head,字段含义如下顺序
2.北京市分网格人流量指数
数据文件:shortstay_20200201_20200215.csv、shortstay_20200117_20200131.csv, 文件首行无head,字段含义如下顺序
3.北京市网格联系强度, grid_strength.csv ,文件首行无head,字段含义如下顺序