返回網站

2020美國總統大選最後辯論會分析

郭迺鋒 世新大學財務金融學系副教授

鄭佳欣 台北醫學大學大數據科技及管理研究所碩士生

本文透過2020年美國總統大選的最後一次辯論會之文字資料,進行社會網絡分析,試圖理解Donald Trump與Joe Biden在政策思想上的差異,或可提供讀者一個思考政治未來的依據。

辯論會語音轉文稿差異分析

資料來自Rev.com提供的辯論語音轉換文字稿「Donald Trump & Joe Biden Final Presidential Debate Transcript 2020」[1],使用Python套件Scattertext 0.0.2.64進行辯論用語差異分析,找尋辯論用語異同之處,由Donald Trump打招呼開啟這場辯論會,透過辯論用語差異分析圖,了解此次辯論會兩位候選人的辯論內容,x軸由左至右為Joe Biden詞頻由低至高;y軸則為Donald Trump詞頻由低至高;右上至左下對角線上為兩位候選人相似辯論用語區,背離對角線為兩位候選人高頻率用語相異之文字分布。

 

[1] https://www.rev.com/blog/transcripts/donald-trump-joe-biden-final-presidential-debate-transcript-2020

broken image

其中移除停用字(python package: stop_words)的辯論用語差異分析,Joe Biden以「fact, sure, states, need, able」為高頻率用語,而Donald Trump以「joe, russia, like, ago, think」為高頻率用語。此外,忽略動詞、介係詞等辯論文字, Joe Biden相較Donald Trump提及更多的是「law, drug, insurance」,Donald Trump相較Joe Biden提及更多的是「families, obamacare, black」以家庭、健保、種族為主,傾向談論家庭價值。

broken image

辯論過程情緒變化

情緒時間線圖,x軸的單位點係依據Rev.com辯論文字稿段落為一個單位文本統計,y軸為情緒分數,當情緒分數大於0表示正向情緒,小於0則為負向,無論使用Afinn、Vader或是Blob情緒字典,對於每單位辯論文本呈現相似的情緒趨勢。因此,以情緒分數值波幅較大的Afinn來進行候選人情緒比較,Joe Biden整場辯論會情緒波幅約於-20~10分,波幅較大,而Donald Trump情緒分數則約於-20~40分。其中Joe Biden在第18個單位點(-21分)和第81個單位點(-20分)有較大的負向情緒表現;Donald Trump在第9個單位點(-21分)和第75個單位點(41分)有較大的情緒波動,就平均而言,兩位候選人情緒分數在正負10分內,且Donald Trump的負向情緒文本(62比文本資料)高於正向情緒文本(46比比文本資料),但是Joe Biden整場辯論淨情緒分數值為-89分(所有文本情緒分數總和)帶有負向情緒遠高於Donald Trump的-26分。

broken image

辯論文字情緒分布象限圖

將兩位候選人每單位文本給定Afinn情緒之正負向,進一步使用剖析辯論正負向情緒文本用語並進行比較,座標軸上方文字為同時出現在正向和負向情緒的文本;座標軸下方文字為出現在中性情緒的文本,座標軸向右文字為常出現在負向情緒文本;座標軸向左文字為常出現在正向情緒文本。比較兩位候選人情緒分布象限圖,兩位候選人對於「china」的情緒傾向中性情緒,表示探討較少的中國議題,Joe Biden對於「open, insurance, jobs」傾向正向態度,Donald Trump對於「want, love, better」傾向正向態度。

broken image
broken image