-
单位数1个
-
数据集6个
-
数据项25个
-
数据量6971万条
重点区域人群密度预测
(包含3个训练数据集)
定向数据-连环夺宝
辅助训练数据集:
1.北京市迁徙指数
数据文件:migration_index.csv, 文件首行无head,字段含义如下顺序
字段名称含义示例
date迁徙日期20200201
departure_province迁徙出发省份广东省
departure_city迁徙出发城市深圳市
arrival__province迁徙到达省份北京市
arrival_city迁徙到达城市北京市
index迁徙指数1.83
2.北京市分网格人流量指数
数据文件:shortstay_20200201_20200215.csv、shortstay_20200117_20200131.csv, 文件首行无head,字段含义如下顺序
字段名称含义示例
date日期20200201
hour小时10
grid_x网格中心点经度,国测局02坐标系116.393779028
grid_y网格中心点纬度,国测局02坐标系39.8797856554
index人流量指数70.5
3.北京市网格联系强度, grid_strength.csv ,文件首行无head,字段含义如下顺序
字段名称含义示例
hour小时20200201
start__grid_x出发网格中心点经度,国测局02坐标系116.393779028
start__grid_y出发网格中心点纬度,国测局02坐标系39.8797856554
end_grid_x到达网格中心点经度,国测局02坐标系116.649814053
end_grid_y到达网格中心点纬度,国测局02坐标系39.9489893429
index联系强度0.2
2020/3/5赛题数据训练集 - md5: 9012b17dc672c8bd9478963309f48b80
2020/3/5赛题数据训练集 - md5: 0058943e79fd27862e2028012bef6247
2020/3/5赛题数据训练集 - md5: 70bf86f048d8759f853c769f9c952aae
疫情政务问答助手
(包含3个训练数据集)
数据包含3个文件,context.csv, train.csv, test.csv.
1.corpus.csv 政策文件内容,使用utf-8编码,用tab分隔。
字段名称字段说明
docid政策文件id
text政策内容
2.train.csv:训练集,使用utf-8编码,用tab分隔。
字段名称字段说明
qid训练问题的id
query用户查询的问题
docid答案参考的政策文件id
answer答案
3.test.csv:测试集,使用utf-8编码,用tab分隔。
字段名称字段说明
qid测试问题的id
query用户查询的问题
2020/3/3赛题数据训练集 - md5: 5cb1ba79d5ce77985465f6b5b3335e54
2020/3/3赛题数据政策文件内容 - md5: 868e5e195f1ed4862c343a0c6e8c86e5
2020/3/3赛题数据测试集 - md5: 3b8c004d0869f3472f05075a3ebcf421