Responsive image
博碩士論文 etd-0031123-194145 詳細資訊
Title page for etd-0031123-194145
論文名稱
Title
基於混合效應機器學習模型的捷運流量預測-以高雄捷運為例
Mixed-effects Machine Learning Models for Passenger Flow Prediction – An Example on Kaohsiung Mass Rapid Transit
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
42
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2023-01-11
繳交日期
Date of Submission
2023-01-31
關鍵字
Keywords
捷運運量預測、時間序列、階層線性模型、線性混合效應模型、極限梯度提升、隨機森林
Metro Passenger Flow Prediction, Time Series, Hierarchical Linear Model, Linear Mixed -effects model, eXtreme Gradient Boosting, Random Forest
統計
Statistics
本論文已被瀏覽 384 次,被下載 41
The thesis/dissertation has been browsed 384 times, has been downloaded 41 times.
中文摘要
隨著現代社會的發展,大眾捷運系統在一座現代化都市生活中已成為民眾生活日常中重要的交通工具,不僅能有效的改善都會區的交通問題,大幅縮短通勤旅行的時間,也擴大了都市居民的生活版圖,提升了民眾的生活品質。捷運套票行銷為捷運公司的收入來源之一,若能明確分析民眾日常通勤通學時所進入的車站,及出口的車站,以提升投入資源分配後的營業收入,並維持營運服務水準。所以旅運量分析預測方式為研擬套票行銷的主要關鍵,當預測準確時,後續的規劃即可迎刃而解。
本研究選定以高雄捷運場域為實證分析,除了探討捷運車站間的互相影響之外,並將影響車站進出人數的因素包含時間和天氣因子等外部的特徵納入考慮。有鑒於機器學習演算法逐漸成為資料分析的方法,本研究使用混合效應模型(Mixed-Effects Model)等演算法用於高雄捷運旅運量之出站人次預測成效性。資料使用2019年高雄捷運起訖點間的運量(Origin-Destination, OD)資料,我們試圖找出旅運量預測效能最佳、誤差最小、解釋性佳的預測模型。
最後期望透過本研究對於影響預測表現的重要特徵因子進行結果分析後,所建構之預測模型,可提供給捷運公司辦理套票規劃決策時之參考。
Abstract
With the development of modern society, the mass rapid transit system has become an important means of transportation in the daily life for the people in a modern city life. It not only effectively improves the traffic problems in modern society, greatly shorten the time of commuting and traveling, but also expand the living territory that improve the quality of life of the people. The marketing of MRT package tickets is one of the revenue sources of the MRT Corporation. If we can clearly analyze which stations commuter enter and exit, the operating income after resource allocation can be increased and the operating service level can be maintained. Therefore, the traffic volume analysis and forecasting method is the key to study the package ticket marketing. When the forecast is accurate, the follow-up planning can be easily solved.
This study selects the Kaohsiung MRT as the empirical analysis. In addition to exploring the mutual influence between MRT stations, we consider some factors that affect the number of people in and out of a station, including time, the administrative district where the station is located, and weather. In view of the fact that machine learning algorithms are gradually becoming the method of data analysis. In this study, algorithms such as the Linear Mixed-Effects Model are used to predict the effectiveness of Kaohsiung MRT outbound traffic volume. Here we employ the traffic volume data (Origin-Destination, OD) between the origin and destination of Kaohsiung MRT in 2019, trying to find the prediction model with the best prediction performance, the smallest error, and good explication.
Finally, it is expected that after analyzing the results of this study on the characteristic factors with significant influence, the constructed forecasting model can be provided as a reference for MRT Corporation when making the decision of package planning.
目次 Table of Contents
論文審定書 i
誌 謝 ii
摘 要 iii
Abstract iv
目 錄 v
圖 次 vii
表 次 viii
第一章 緒論 1
1.1研究背景 1
1.2研究動機 2
1.3研究目的 3
第二章 文獻探討 4
2.1 階層式嵌套架構 4
2.2 機器學習 7
2.3 交叉驗證(Cross-Validation) 9
2.4 Prequential 10
第三章 研究方法與步驟 13
3.1 研究流程 13
3.2 研究方法 13
第四章 研究結果與討論分析 17
4.1 資料蒐集 17
4.2 資料清理 20
4.3 建立模型 20
4.4 評估模型 23
4.5建模結果及比較分析 23
第五章 研究結論與建議 30
5.1 研究結論 30
5.2 未來建議 30
參考文獻 32
參考文獻 References
[1] D. Yan, J. Zhou, Y. Zhao及B. Wu, 作者, 「Short-Term Subway Passenger Flow Prediction Based on ARIMA」, 收入 Geo-Spatial Knowledge and Intelligence, Singapore, 2018, 頁 464–479. doi: 10.1007/978-981-13-0893-2_49.
[2] S. Feng及G. Cai, 作者, 「Passenger Flow Forecast of Metro Station Based on the ARIMA Model」, 收入 Proceedings of the 2015 International Conference on Electrical and Information Technologies for Rail Transportation, Berlin, Heidelberg, 2016, 頁 463–470. doi: 10.1007/978-3-662-49370-0_49.
[3] B. M. Williams, P. K. Durvasula及D. E. Brown, 作者, 「Urban Freeway Traffic Flow Prediction: Application of Seasonal Autoregressive Integrated Moving Average and Exponential Smoothing Models」, Transp. Res. Rec., 卷 1644, 期 1, 頁 132–141, 1月 1998, doi: 10.3141/1644-14.
[4] B. M. Williams及L. A. Hoel, 作者, 「Modeling and Forecasting Vehicular Traffic Flow as a Seasonal ARIMA Process: Theoretical Basis and Empirical Results」, J. Transp. Eng., 卷 129, 期 6, 頁 664–672, 11月 2003, doi: 10.1061/(ASCE)0733-947X(2003)129:6(664).
[5] 劉祐瑋, 作者, 「含有離異點時間序列模型對於臺北捷運的人流量預測」, 國立宜蘭大學, 宜蘭縣, 2021. 載於: https://hdl.handle.net/11296/9uyj62
[6] 楊立勤, 作者, 「大數據分析 - 天氣對捷運、台鐵與高鐵搭乘率之影響」, 中國文化大學, 台北市, 2018. 載於: https://hdl.handle.net/11296/9yyfer
[7] 交通部, 作者, 「民眾日常使用運具狀況調查」, 交通部. https://www.motc.gov.tw/ch/home.jsp?id=1679&parentpath=0,6&mcustomize=statistics105.jsp (引見於 2023年1月22日).
[8] 陳怡靜, 作者, 「影響捷運運量因素之探討-以高雄捷運為例」, 國立中山大學, 高雄市, 2014. [線上]. 載於: https://hdl.handle.net/11296/bfd4n2
[9] 陳鼎文, 作者, 「計數型廣義線性模型於車流量預測」, 國立中山大學, 高雄市, 2018. [線上]. 載於: https://hdl.handle.net/11296/fq7h3d
[10] Y. Danfeng及W. Jing, 作者, 「Subway Passenger Flow Forecasting With Multi-Station and External Factors」, IEEE Access, 卷 7, 頁 57415–57423, 2019, doi: 10.1109/ACCESS.2019.2914239.
[11] R. S. Michalski, J. G. Carbonell及T. M. Mitchell, 編輯, 「Front Matter」, 收入 Machine Learning, San Francisco (CA): Morgan Kaufmann, 1983, 頁 iii. doi: 10.1016/B978-0-08-051054-5.50001-7.
[12] 邱皓政及溫福星, 作者, 「脈絡效果的階層線性模型分析:以學校組織創新氣氛與教師創意表現為例,ERICDATA高等教育知識庫」, 2007年. http://ericdata.com/tw/detail.aspx?no=51006 (引見於 2022年11月6日).
[13] M. Fokkema, N. Smits, A. Zeileis, T. Hothorn及H. Kelderman, 作者, 「Detecting treatment-subgroup interactions in clustered data with generalized linear mixed-effects model trees」, Behav. Res. Methods, 卷 50, 期 5, 頁 2016–2034, 10月 2018, doi: 10.3758/s13428-017-0971-x.
[14] 陳泰宇, 作者, 「k折交叉驗證檢驗均方誤差的偏誤和變異數之間的抵換關係: 模擬研究」, 國立清華大學, 新竹市, 2020. 載於: https://hdl.handle.net/11296/b6fu42
[15] C. Bergmeir及J. M. Benítez, 作者, 「On the use of cross-validation for time series predictor evaluation」, Inf. Sci., 卷 191, 頁 192–213, 5月 2012, doi: 10.1016/j.ins.2011.12.028.
[16] D. S. Modha及E. Masry, 作者, 「Prequential and Cross-Validated Regression Estimation」, Mach. Learn., 卷 33, 期 1, 頁 5–39, 10月 1998, doi: 10.1023/A:1007577530334.
[17] 「年報資料 - 高雄捷運股份有限公司」. https://corp.krtc.com.tw/News/annual_report (引見於 2023年1月2日).
[18] 「站間行駛時間 - 高雄捷運全球資訊網」. https://www.krtc.com.tw/Guide/time_between_train (引見於 2023年1月24日).
[19] C. D. Lewis, 作者, Industrial and business forecasting methods: A practical guide to exponential smoothing and curve fitting. Butterworth-Heinemann, 1982.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外完全公開 unrestricted
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code