# 原始数据 ### METR\_LA **地点:** Los Angeles County, USA **时期:** Mar. 1, 2012 ~ Jun. 27, 2012 **链接:** https://github.com/liyaguang/DCRNN **描述:** 由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据。 ### LOS_LOOP **地点:** Los Angeles County, USA **时期:** Mar. 1, 2012 ~ Jun. 27, 2012 **链接:** https://github.com/lehaifeng/T-GCN/tree/master/data **描述:** 与METR LA略有不同,缺失值通过线性插值得到补充。 ### SZ\_TAXI **地点:** Shenzhen, China **时期:** Jan. 1, 2015 ~ Jan. 31, 2015 **链接:** https://github.com/lehaifeng/T-GCN/tree/master/data **描述:** SZ-Taxi 数据集包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息。 ### LOOP\_SEATTLE **地点:** Greater Seattle Area, USA **时期:** 2015 全年 **链接:** https://github.com/zhiyongc/Seattle-Loop-Data **描述:** Loop Seattle 数据集由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据。 ### Q_TRAFFIC **地点:** Beijing, China **时期:** Apr. 1, 2017 ~ May 31, 2017 **链接:** https://github.com/JingqingZ/BaiduTraffic **描述:** Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集。 ### PEMS **地点:** California, USA **时期:** 2001 ~ present **链接:** http://pems.dot.ca.gov **描述:** PEMS 记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点。 ### PEMSD3 **地点:** District 3 of California, USA **时期:** Sept. 1, 2018 ~ Nov. 30, 2018 **链接:** https://github.com/Davidham3/STSGCN **描述:** PeMSD3 数据集包括 358 个传感器和流量信息。 ### PEMSD4 **地点:** San Francisco Bay Area, USA **时期:** Jan. 1, 2018 ~ Feb. 28, 2018 **链接:** https://github.com/Davidham3/ASTGCN/tree/master/data/PEMS04 **描述:** PeMSD4 数据集描述了加州高速公路的速度流量占用信息,包含29条道路上的3848个传感器。 ### PEMSD7 **地点:** District 7 of California, USA **时期:** Jul. 1, 2016 ~ Aug. 31, 2016 **链接:** https://github.com/Davidham3/STSGCN **描述:** PeMSD7 数据集包含883个传感器站的交通流量信息。 ### PEMSD8 **地点:** San Bernardino Area, USA **时期:** Jul. 1, 2016 ~ Aug. 31, 2016 **链接:** https://github.com/Davidham3/ASTGCN/tree/master/data/PEMS08 **描述:** PeMSD8 数据集描述了加州高速公路的速度占用率,数据来自8条公路上的1979个传感器。 ### PEMSD7(M) **地点:** District 7 of California, USA **时期:** the weekdays of May and June of 2012 **链接:** https://github.com/Davidham3/STGCN/tree/master/datasets **描述:** PeMSD7(M) 数据集描述了加州第7区228个站点的高速公路速度信息。 ### PEMS_BAY **地点:** San Francisco Bay Area, USA **时期:** Jan. 1, 2017 ~ Jun. 30, 2017 **链接:** https://github.com/liyaguang/DCRNN **描述:** PEMS-BAY 数据集包含6个月的交通速度统计数据,包括325个传感器。 ### BEIJING_SUBWAY **地点:** Beijing, China **时期:** Feb. 29, 2016 - Apr. 3, 2016 **链接:** https://github.com/JinleiZhangBJTU/ResNet-LSTM-GCN **描述:** 该数据集是从2016年2月29日至4月3日连续五周的05:00-23:00从北京地铁采集的数据。截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站)。 ### M_DENSE **地点:** Madrid, Spain **时期:** Jan. 1, 2018 - Dec. 21, 2019 **链接:** https://github.com/rdemedrano/crann_traffic **描述:** 该数据集包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度。 ### ROTTERDAM **地点:** Rotterdam, Holland **时期:** 135 days of 2018 **链接:** https://github.com/RomainLITUD/DGCN_traffic_forecasting **描述:** ROTTERDAM 数据集包含 208 条链路的交通状态信息。 ### SHMETRO **地点:** Shanghai, China **时期:** Jul. 1, 2016 - Sept. 30, 2016 **链接:** https://github.com/ivechan/PVCGN **描述:** 该数据集是基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次。 ### HZMETRO **地点:** Hangzhou, China **时期:** Jan. 1, 2019 - Jan. 25, 2019 **链接:** https://github.com/ivechan/PVCGN **描述:** 该数据集是根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客。 ### TAXIBJ **地点:** Beijing, China **时期:** Jul. 1, 2013 ~ Oct. 30, 2013, Mar. 1, 2014 ~ Jun. 30, 2014, Mar. 1, 2015 ~ Jun. 30, 2015 and Nov. 1, 2015 ~ Apr. 10, 2016 **链接:** https://github.com/TolicWang/DeepST/issues/3 **描述:** TaxiBJ 数据集包含出租车 GPS 数据,包括人流、气象和节假日信息。 ### T_DRIVE **地点:** Beijing, China **时期:** Feb. 2, 2008 ~ Feb. 8, 2008 **链接:** https://www.microsoft.com/en-us/research/publication/t-drive-trajectory-data-sample/ **描述:** T-Drive轨迹数据集样本包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里。 ### PORTO **地点:** Porto, Portugal **时期:** Jul. 1, 2013 ~ Jun. 30, 2014 **链接:** https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015 **描述:** 数据集描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹。 ### NYCTAXI **地点:** New York, USA **时期:** 2009 ~ present **链接:** https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page **描述:** NYC-Taxi 数据集包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹。 ### NYCTAXI_DYNA - NYCTAXI_DYNA 是一个用不规则区域划分方法统计区域流入流出的数据集。 ### NYCTAXI_OD - NYCTAXI_OD 是一个数据集,它使用不规则区域划分方法计算区域之间的起点-终点流量。 ### NYCTAXI_GRID - NYCTAXI_GRID 是一个数据集,它使用基于网格的划分方法计算区域的流入和流出。 ### NYC_TOD **地点:** New York, USA **时期:** 2014 **链接:** https://github.com/liulingbo918/CSTN#:~:text=download%20NYC-TOD.tar.gz%20with%20following%20links%20and%20put%20it%20into%20folder%20NYC-TOD/. **描述:** NYC_TOD 使用基于网格的划分方法计算区域的流入和流出。由 [CSTN](https://arxiv.org/pdf/1905.06335) 的论文作者通过轨迹数据集处理得到。 ### NYCBIKE **地点:** New York, USA **时期:** Jun. 2013 ~ present **链接:** https://www.citibikenyc.com/system-data **描述:** NYC-Bike 数据集包含从 NYC CitiBike 系统收集的自行车轨迹。 ### AUSTINRIDE **地点:** Austin, USA **时期:** Jun. 4, 2016 ~ Apr. 13, 2017 **链接:** https://data.world/ride-austin/ride-austin-june-6-april-13 **描述:** AustinRide 数据集包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行。 ### BIKEDC **地点:** Washington, USA **时期:** Sept. 20, 2010 ~ Oct. 2020 **链接:** https://www.capitalbikeshare.com/system-data **描述:** BikeDC 数据集描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点。 ### BIKECHI **地点:** Chicago, USA **时期:** Jun. 27, 2013 ~ 2018 **链接:** https://www.divvybikes.com/system-data **描述:** BikeCHI 数据集展示了 2013 年至 2018 年芝加哥共享单车的发展情况。 ### Foursquare **时期:** Apr. 12, 2012 ~ Feb. 16, 2013 **链接:** https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46 **描述:** Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。我们使用链接中的第二个数据集,即 *NYC and Tokyo Check-in Dataset* 。我们对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC。 ### Gowalla **地点:** **时期:** Feb. 2009 ~ Oct. 2010 **链接:** https://snap.stanford.edu/data/loc-gowalla.html **描述:** Gowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID。 ### Brightkite **地点:** Global **时期:** Apr. 2008 ~ Oct. 2010 **链接:** http://snap.stanford.edu/data/loc-brightkite.html **描述:** Brightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID。 ### Instagram **地点:** New York, USA **时期:** Jun. 15, 2011 - Nov. 8, 2016 **链接:** https://dmis.korea.ac.kr/cape **描述:** 该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。 ### Seattle **地点:** Seattle,WA,USA **时期:** Jan. 17,2009 20:27:37~22:34:28 **链接:** https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/ **描述:** 这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。轨迹从Marymoor公园附近开始。数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。 ### Global **地点:** 全世界100个地区 **时期:** — **链接:** https://zenodo.org/record/57731#.YVwZ7WJBxnK **描述:** 这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。由于这个数据集覆盖全球,可以提高泛化能力。 ### BJ_ROADMAP **地点:** Beijing, China **时期:** - **链接:** **描述:** 原始数据集包含 OpenStreetMap 格式的节点和边的属性。建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。 ### BJ_TRAJ **地点:** Beijing, China **时期:** Apr. 2015 - Jul. 2015 **链接:** **描述:** BJ_TRAJ 数据集包含海量轨迹数据,每月约 760 万条。 ### CD_TRAJ **地点:** Chengdu, China **时期:** Oct. 01, 2018 - Nov. 30, 2018 **链接:** **描述:** CD_TRAJ 数据集包含海量轨迹数据,每 10 天约 258 万条。 有 2 个月的数据可用。 ### XA_TRAJ **地点:** Xi'an, China **时期:** Oct. 01, 2018 - Nov. 30, 2018 **链接:** **描述:** XA_TRAJ 数据集包含海量轨迹数据,每 15 天约 214 万条。 有 2 个月的数据可用。 ### Chengdu_Taxi_Sample1 **地点:** Chengdu, China **时期:** Aug. 03, 2014 - Aug. 30, 2014 **链接:** https://github.com/UrbComp/DeepTTE/tree/master/data **描述:** Chengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。 ### Beijing_Taxi_Sample **地点**:Beijing, China **时期**:Oct. 01, 2013 - Oct. 31, 2013 **链接**:https://github.com/YibinShen/TTPNet/tree/master/data **描述**:Beijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据。 ### NYC_RISK **地点:** New York, USA **时期:** Jan.01,2013 ~ Dec.31,2013 **链接:** https://github.com/Echohhhhhh/GSNet **描述:** NYC_RISK 数据集包含了2013年纽约道路、风险和POI数据。 ### CHICAGO_RISK **地点:** New York, USA **时期:** Feb.01,2016 ~ Sep.30,2016 **链接:** https://github.com/Echohhhhhh/GSNet **描述:** CHICAGO_RISK 数据集包含了2016年1月到9月芝加哥道路和风险数据。