Responsive image
博碩士論文 etd-0528123-170556 詳細資訊
Title page for etd-0528123-170556
論文名稱
Title
BERT模型在財金新聞情緒與台灣股票報酬預測之運用
Application of the BERT Model in Predicting Taiwanese Stock Returns Based on Financial News Sentiment
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
57
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2023-06-21
繳交日期
Date of Submission
2023-06-28
關鍵字
Keywords
BERT模型、新聞情緒、交易策略、機器學習、股市預測
BERT Model, News Sentiment, Trading Strategy, Machine Learning, Market Prediction
統計
Statistics
本論文已被瀏覽 61 次,被下載 6
The thesis/dissertation has been browsed 61 times, has been downloaded 6 times.
中文摘要
過去的許多研究,透過交易量、股價乖離均線比例,作為散戶投資人情緒的代理變數。本研究考量原先已存在的情緒代理變數外,也透過網路新聞情緒,轉化成可用於建模的數字後,納入交易策略中,成為情緒增強交易策略,並研究該策略的有效程度。近年來蓬勃發展的大型語言模型能有效分類文本,本研究使用Google Brain團隊所研發的開源大型語言模型BERT(Bidirectional Encoder Representations from Transformers),以2013年至2022年共十年間的鉅亨網產業新聞、ETToday財經版新聞,透過小規模標籤資料fine-tuned該模型,並以該模型預測值標籤所有新聞情緒,將所有新聞分類成負面、中立、正面三種情緒。另一方面,本研究也蒐集台灣國家發展委員會的景氣燈號、領先綜合指數、同時綜合指數、落後綜合指數等總體經濟指標,並將取得的資料特徵輸入XGBoost模型,透過模型預測值進行交易策略,以驗證新聞增強交易策略的有效性。研究結果表示,新聞增強交易策略的每週報酬平均值、累積報酬、年化報酬皆較原始策略高。而在考量景氣燈號後,在黃藍燈、綠燈、紅燈等三種景氣燈下,增加新聞情緒特徵後可增加原始交易策略的報酬率。
Abstract
In recent years, investors and researchers have been actively seeking effective methods to predict and explain the volatility of asset returns. One such method involves using news sentiment or other investment sentiment proxy variables. Previous studies have used indicators such as trading volume, price-to-moving-average ratio as proxy variables for individual investor’s sentiment. In this study, in addition to considering the existing sentiment proxy variables, we incorporated internet news sentiment, which was transformed into a quantifiable metric, into our trading strategy. This became an emotion-enhanced trading strategy, and we examined its effectiveness. Large language models (LLMs) have seen significant development and have proven effective in text classification. In this study, we utilized BERT (Bidirectional Encoder Representations from Transformers) to finish text sentiment classification. We fine-tuned the model with a small amount of labeled data, using news from Aune and ETToday over a ten-year period (2013-2022) then used the model's predicted values to label the sentiment of all news articles, distinguishing them as negative, neutral, or positive. This study conducts robust test with macroeconomic indicators. The results indicated that strategy with news sentiment will enhance the performance, but at the same time raise the volatility over weekly returns.
目次 Table of Contents
論文審定書 i
摘要 ii
Abstract iii
圖次 v
表次 vi
第一章 緒論 1
第一節 研究動機與目的 1
第二節、研究架構 3
第二章 文獻回顧 5
第一節 情緒代理變數 5
第二節 BERT模型 6
第三節 機器學習預測模型 7
第四節 總體經濟指標與股市 8
第三章 研究方法 10
第一節 研究流程 10
第二節 研究資料 12
2.1 Aune鉅亨網台股產業版新聞 12
2.2 ETToday財經版新聞資料 13
2.3 散戶投資者情緒代理變數 15
2.4 股價及報酬資料 17
2.5 景氣對策燈號 17
2.6 領先、同時與落後綜合指標 20
第三節 新聞資料數值化 21
3.1 BERT語言模型 21
3.2 新聞情緒分數 23
第四節 機器學習交易策略 24
4.1 XGBoost 24
4.2 交易策略建構流程 25
4.3 交易策略績效衡量指標 28
第四章 實證結果 30
第一節 新聞情緒分數 30
1.1 新聞情緒分類結果 30
1.2 情緒分數結果 32
第二節 交易策略績效 33
2.1 新聞情緒增強策略績效 33
2.2 情緒增強交易策略與原始策略的比較 36
第五章 研究結論 46
參考文獻 48
參考文獻 References
中文文獻
王希佩(2021),「以機器學習建構股價預測模型: 以台灣股市為例」,博士論文,國立中央大學資訊管理學研究所。

百吉(2016),「總體經濟學指標對於蒙古股票市場報酬的影響」,博士論文,國立台灣大學財務金融學研究所。

朱英姿, 吳美, & 陳超. (2012). 我國宏觀經濟因素對股市預測
力研究. 投資研究, 31(11), 76-87.

林玉樹(2006),「總體經濟景氣循環變數與股市報酬之相關性-以台灣為例」,碩士論文,國立台灣大學國際企業學研究所。

胡慧君, 楊雨煙, 易洋, & 劉茂福. 基於细粒度信息感知 BERT-EEP 的情绪分類方法. 計算機工程與科學, 45(04), 751.

許溪南、郭玟秀、鄭乃誠(2005),「投資人情緒與股價報酬波動之互動關係:台灣股市之實證」,台灣金融財務季刊;6卷3期,107-121

張傳銘(2021),「新聞情緒與投資人情緒建構台股機器學習交易策略」,碩士論文,國立中山大學金融創新產業碩士班。

黃子源(2022),「基於BERT模型進行社群情緒與股價報酬預測之分析」,碩士論文,國立中山大學金融創新產業碩士班。

劉祥熹, & 涂登才. (2012)美國股市及其總體經濟變數間關連性與波動性之研究─ VEC GJR DCC-GARCH-M 之模型應用. 經濟研究 (Taipei Economic Inquiry), 48(1), 139-189.

英文文獻
Christensen, K., Siggaard, M., & Veliyev, B. (2021). A machine learning approach to volatility forecasting. Available at SSRN.

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Pre-training of Deep Bidirectional Transformers For Language Understanding. arXiv preprint arXiv:1810.04805.

Goulet Coulombe, P., Leroux, M., Stevanovic, D., & Surprenant, S. (2022). How is Machine Learning Useful For Macroeconomic Forecasting?. Journal of Applied Econometrics, 37(5), 920-964.

Jianhua Gang, Zongxin Qian, Tiange Xu, (2019). Investment Horizons, Cash Flow News and the Profitability of Momentum and Reversal Strategies in The Chinese Stock Market,Economic Modelling, Volume 83,2019,Pages 364-371

Jiao, Y., & Jakubowicz, J. (2017, December). Predicting Stock Movement Direction with Machine Learning: An Extensive Study On S&P 500 Stocks. In 2017 IEEE International Conference on Big Data (Big Data) (pp. 4705-4713). IEEE.

Leippold, M., Wang, Q., & Zhou, W. (2022). Machine Learning In The Chinese Stock Market. Journal of Financial Economics, 145(2), 64-82.

Mikolov, T., Sutskever, I., Chen, K., Corrado, G. S., & Dean, J. (2013). Distributed Representations Of Words and Phrases and Their Compositionality. Advances In Neural Information Processing systems, 26.

Patel, J., Shah, S., Thakkar, P., & Kotecha, K. (2015). Predicting Stock Market Index Using Fusion Of Machine Learning Techniques. Expert Systems with Applications, 42(4), 2162-2172.

Pennington, J., Socher, R., & Manning, C. D. (2014, October). Glove: Global Vectors Forward Representation. In Proceedings Of The 2014 Conference On Empirical Methods In Natural Language Processing (EMNLP) (pp. 1532-1543).

Review of Irrational Exuberance, by R. J. Shiller. (2000). The American Journal of Economics and Sociology, 59(3), 537–540.

Shiller, R.J. (1984) Stock Prices and Social Dynamics. Brookings Papers on Economic Activity, 1984, 457-498.
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... &

Polosukhin, I. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems, 30.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外完全公開 unrestricted
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code