博碩士論文 etd-0725114-134605 詳細資訊
從使用者自建內容挖掘網民對議題的立場: 以兩岸服貿為例
A Framework for Discovering Opinions on Issues From User Generated Content: Using Cross-Strait Agreement on Trade in Services as an Example
Social issue, Political science, Natural language processing, Text mining, Sentiment analysis
The thesis/dissertation has been browsed 6074 times, has been downloaded 439 times.
國民在資訊科技的發展下,使用者自建內容隨之大量產生,其內容可以是對經濟、社會或政治議題發帖討論,投票響應。透過文字探勘技術,以使用者自建內容取代民意調查的原始資料,用以反映社會輿論或民意動向已是可思考的方向;本篇論文中提出一個議題分析架構,藉由自然語言結構建構出議題的討論面向,並以Stanford Parser搭配NTUSD情感字典實作情感分析流程,以期能彈性的檢視臺灣網民對於兩岸服務貿易協定議題的立場資訊以及情感表達。為了實作議題分析架構,我們蒐集網民於BBS網站PTT政治討論相關版面的討論內容,約20萬篇文章內容並進行過濾,最後採用其中15,000篇文章,藉由與相關文獻的對照,發現網民的整體情緒為負向態度,以及議題的不同面向之討論程度並不平均,著重討論的面向為議題的間接面向。
User generated content (UGC) is increasing quickly due to the advance of information technology. A post about enterprise finance condition or social political issue in forums is part of UGC. Nowadays applying text mining and sentiment analysis techniques on UGC has been shown to be a promising alternative to the traditional polls. In this work, we propose a framework for discovering opinions on issues discussed on forums, specifically those related to Cross-Strait Agreement on Trade in Services. In particular, we identify issues by finding frequent nouns and then discover the pertaining opinions on the posts. Over Fifteen thousand posts on PTT forums are processed using the proposed approach. Finally, we discover that the overall emotion on various issues tend to be negative, whereas the amount of discussion and the degree of negative emotions vary dramatically.
目次 Table of Contents
論文審定書 i
中文摘要 ii
英文摘要 iii
第一章 、緒論 1
第一節 、研究背景 1
第二節 、研究動機 2
第三節 、研究問題 3
第二章 、文獻探討 6
第一節 、社會議題與立場 6
第二節 、情緒分析 8
第三節 、情緒辭典 10
第四節 、斷詞服務 11
第三章 、研究流程 13
第一節 、建立資料集 14
第二節 、建立初始議題字典 15
第三節 、過濾資料 16
第四節 、擴增議題字典 16
第五節 、建立情緒字典 19
第六節 、識別文章之議題特徵與情緒 19
第四章 、彙總與觀察 24
第一節 、資料集說明 24
第二節 、議題字典設定與說明 25
第三節 、情緒分析結果與觀察 26
第五章 、結論與未來展望 36
參考文獻 37
附錄 40
參考文獻 References
