2014/01/17

Facebook動態消息得讚比因素分析

感謝
在此首先要感謝我的FB朋友們,他們在我沒有事先告知的情況下協助我完成了這次研究,並且沒有任何報償,時間長達半年。其中可能有人會在得知真相後感到不悅、受欺騙、被愚弄,我在此致上最深的歉意,一切都是為了學術。

緒論與文獻回顧
        FB流行幾近氾濫的時代中,隨處可見的是人們閒暇時刻便拿起手機或開著網頁瀏覽FB,由於其動作通常是不斷的往下捲動,我們通常稱為「滑FB」。不可否認的,這樣的資訊接收平台大大的改變了我們習慣的方式,加上其互動式的功能:「點讚」(Like),使人與人、人與團體之間的互動多了一種有趣的方式。通常,我們會給偶像的粉絲專業讚,以表示支持與認同,但這種讚是一次性的。因此本研究的主要重點集中在於動態,動態是所有人都可以發佈的消息,並且不受次數頻率、內容形式影響,而動態會根據某些演算法[1]得到其分數,排序後出現在好友或追蹤者的動態消息(News Feed,以下簡稱動態)中,任何看到這則動態的人,可以自由選擇是否要留言或給予讚,而不會受到任何限制。
        因此可想而知,讚的數目極度容易受到曝光率、動態內容等眾多因素影響。我曾經在半年前分析過可能受到影響的因素(亦是此研究的起點),而這只是非常粗略的區分,略作修正後如下:
        一個發文頻率普通的人,得到的讚數除以他的總朋友數,也就是得讚比,通常介於5%~15%之間。影響因素有如:
  • 朋友結構:你的得讚比近10%或超過,可能你的朋友都是些只會迎合你喜好的王八蛋。或只是單純熟朋友比較多。
  • 發文類型:大於10%,你的發文類型較合大家胃口,換句話說,你是迎合別人胃口的王八蛋。或只是單純你的文筆好、照片驚悚,或你是正妹。
  • 發文時間:熱門時段是晚餐過後至睡前,及大家剛起床先滑手機時,在這段時間曝光,較不容易被蓋過。
  • 發文頻率:發文頻率過高者,普遍得讚比較低,原因如「超級廢文」或「超級大爛廢文」,然而發文頻率低者不一定較高。
然而,在了解了FB的演算法則後,我發現有許多因素其實已經被綜合在FB的評分排序(ranking)內,且其演算法則是眾所皆知的,並沒有研究的價值。因此本研究注重動態的內容,包括其結構、語氣、修辭方式等,旨在探討何種形式或內容的動態較能或較不符合他人的胃口(讚不等於合胃口,但姑且讓我們這樣形容它)。

研究動機
        探討影響FB動態消息的因素,注重在內容與形式上的變項。

研究方法
        使用因素分析,並以SPSS統計軟體做多元迴歸分析。依變項為得讚比,計算方式為:
                得讚比=該動態讚數/朋友數量
        將可能影響的變項分為八大類,共包含45個因素,除時間距離、字數、行數、標籤數外皆為二分變項。說明及操作型定義如下:

·         時間
·         與十點半距離(分鐘):同時段瀏覽使用者最多為晚間十點半[2],以分鐘為單位,不分正負。
·         與上篇間隔時間(天):推測頻繁的發佈動態會造成接收者不願意仔細觀看或內容空泛,也就是俗稱的廢文。
·         功能:FB動態所內建可選的功能,不包括打卡。
·         圖:動態是否附圖,不分析圖片性質。
·         連結:動態內是否有附連結,推測有連結可能造成接收者轉移注意、懶得回來按讚。
·         分享:此篇動態是否是分享他人內容(使用分享功能而非單純的分享)。
·         標籤:在動態內是否有標記朋友。
·         標籤數目:標記朋友的數目。
·         內容
·         愛情:內容有愛情成分。推測多數人較愛好愛情類的內容。
·         友情:內容有友情成分。推測此類較能引起共鳴。
·         親情:內容有親情成分。
·         抱怨:內容有抱怨成分。推測會不受歡迎,但亦有可能得到安慰。
·         廣告:內容有廣告成分。推測會不受歡迎。
·         時事:內容有時是成分。避免混淆,新聞媒體所報導的稱為時事,否則為生活貼近。
·         用詞
·         文青:文青為文藝青年的簡稱,意為用浮誇的詞藻修飾。本身可能意義不大,但推測會受到某部分族群歡迎。
·         粗俗:包含一些常見的髒話、匿稱、誇張的自稱,無自謙詞。
·         形式
·         記敘:符合生活真實事件,推測易引起共鳴,可能與生活貼近有共變。
·         抒情:可能較符合某些族群。
·         論說:可能較符合某些族群。
·         學術:可能較不受歡迎。
·         結構
·         聳動開頭:吸引人繼續觀看,可能有明顯效果。
·         創意結尾:使人印象深刻,願意按讚。
·         貼近結尾:在結尾與接收者互動,使人較願意留言或參與討論。(如:以下開放......,開放式問題)
·         行數:長度可能影響感官感受,太長可能使人不願意讀下去,太短內容可能不容易非常突出。
·         字數:與行數類似,但統計方式不同。
·         語氣
·         諷刺:諷刺對象或事件不拘,推測有其客群。
·         哀怨:可能令人不愉快,但亦可能引起共鳴。
·         雙關:可能需要思考,推測有部分客群。
·         悲傷:與哀怨不同,可能會吸引安慰。
·         其他
·         實用性:動態內容是否有其實用價值、是否對他人有幫助。
·         生活貼近:內容是否貼近朋友們得生活,推測可能引起共鳴。
·         耍屌:假裝很屌。
·         真屌:真的很屌。
·         佳句:文內含有佳句,無論明引或暗引,亦不討論佳句種類。
·         有趣搞笑:內容是否會引人發笑,推測有好效果。
·         音樂:內容是否附有音樂歌詞、音樂連結或相關描述。
·         夢想熱情:內容是否牽涉到夢想或熱情,可能引起某些較重視熱血的族群。
·         創意:內容是否有創意,不可抄襲。
·         文內呼應:在文中前後或各部分是否有互相呼應,推測易讓人有好的感覺。
·         回憶:內容是否有包含回憶成分,推測會吸引念舊的人。
·         感動:內容是否使人感動,推測吸引感性的人。
·         修辭
·         對偶:是否有對偶,推測有助閱讀。
·         映襯:是否有映襯,可能有衝突感。
·         轉品:是否有轉品。

研究結果
        由於變項過多,不便附上完整的相關性檢定,請參照整理過後的表,已刪除不顯著的變項。

正相關因素:
類別
因素
r
t
顯著性
內容
愛情
0.53
2.72
***
其他
真屌
0.48
2.39
**
形式
記敘
0.47
2.33
**
其他
文內呼應
0.47
2.31
**
其他
回憶
0.46
2.27
**


負相關因素:
類別
因素
r
t
顯著性
功能
連結
-0.56
-2.98
****
功能
分享
-0.45
-2.23
**
內容
廣告
-0.44
-2.13
**
形式
學術
-0.44
-2.13
**
功能
-0.39
-1.87
*
時間
與十點半距離(m)[3]
-0.38
-1.77
*

*:α=0.05顯著
**:α=0.025顯著
***:α=0.01顯著
****:α=0.005顯著

迴歸分析:
係數a
模式
未標準化係數
標準化係數
t
顯著性
B 之估計值
標準誤差
Beta 分配
1
(常數)
-2.263
.000
 
.
.
-3.492
.000
-.242
.
.
愛情
14.191
.000
1.050
.
.
與十點半距離(m)
.021
.000
.690
.
.
標籤數目
7.780
.000
.512
.
.
與上篇間隔時間()
.259
.000
.269
.
.
親情
9.086
.000
.299
.
.
記敘
1.307
.000
.090
.
.
字數
.003
.000
.222
.
.
哀怨
-10.933
.000
-.660
.
.
實用性
4.458
.000
.147
.
.
生活貼近
3.246
.000
.244
.
.
耍屌
-.845
.000
-.038
.
.
真屌
7.493
.000
.339
.
.
有趣搞笑
3.863
.000
.253
.
.
音樂
.342
.000
.016
.
.
文內呼應
6.631
.000
.300
.
.
感動
3.702
.000
.168
.
.
對偶
-3.872
.000
-.253
.
.
轉品
5.922
.000
.319
.
.
a. 依變數: 得讚比

討論
        根據結果發現,沒有任何因素有決定性的作用。但記敘文、有回憶成分、愛情是最能顯著影響得讚比的(α=0.01),而屌文、敘述、回憶及發文時間及文內呼應則是次要的決定因素。我推測由於記敘文較容易閱讀,也較少個人差異,加上本人的文筆所致,因此記敘文能獲得較多的讚。回憶的作用則不是很清楚,推測可能和接受者有相似之處而產生共鳴。愛情此因素則在預料之內,多數人喜歡看愛情故事或相關的文章,這部份可能有很大的年齡差異。文內呼應可能是決定性的「文章好不好看」的重要關鍵,我會分析此因素也是因為看重此因素而常試著寫出這樣的手法,個人認為這是流暢度的展現,但可以受到有意的操控(故意使用這種手法很容易讓人覺得文章好看,並會忽略其他沒有呼應且寫的不好的部份)。屌文數目很少,可能導致誤差,但可以證實人們相對不喜歡耍屌。最後則是發文時間,這是一篇動態最好掌握的因素,十點半,估計是說多數人結束了一天在休息時會滑FB,或在念書時正要滑FB的時段,太早可能會被較新動態蓋過,太晚則可能錯失某些課群。
        負相關的因素有連結、分享、廣告、學術、圖。大部分是符合預料,連結的影響力超乎預期的大(r=-.56),可能是因為會使接受者連結到另一個地方去閱覽,導致轉移注意力而沒有到原頁面點讚,且因為這種動態相當於把一部分的價值放到連結內,若接受者未點動態,會導致低估此動態的價值。分享和連結類似,通常也需要連結到另一個頁面,並且特別的是分享的是圖時,點進此圖按讚視同按圖片發佈者的讚,而非分享者,導致顯著稀釋得讚比。廣告和學術亦能理解,多數人不喜歡「廣告」本身,更不在意廣告內容為何,且通常廣告與連結共存,更降低人去點擊的慾望。學術則艱深難懂、耗費腦力資源,讓想輕鬆滑FB的人一點也不想進去看。圖則是稍微出乎意料,估計是因為沒有討論圖的類型,且圖文很難完全相符。
        在迴歸分析的部份,其實用價值無法保證。常數是負的意味著一篇動態不符合這些因素時會有-2%的得讚比,這明顯不合理,並且我根據迴歸分析算出公布此研究的動態的得讚比估計會是28個讚,實際情形留待觀察。
        特別提出的非統計討論則是:我一開始推測更換感情狀態為「穩定交往中」是會獲得最高得讚比的,在經過24小時等待後,事實證明此預測是對的,有意義、有內容的文章還是能吸引許多的讚(兩者沒有顯著差異)。在20篇統計當中,最高的是更改感情狀態獲得26.5%得讚比;次高的是獲得26%得讚比的一個感人的愛情故事(主觀評論);而第三高的是友情故事,雖然旨在嘲笑朋友,但內容充滿可能引起共鳴的回憶,並起與多數朋友有聯繫,亦標註了兩個朋友,因此獲得24.2%得讚比(第四高則掉到21.2%)。以下推論沒有數據支持,個人認為要獲得共鳴的方式不能單已愛情而論,而是要感人(然而因為這太過主觀無法列入變項分析,有些可惜)或切入時事,或貼近多數朋友的生活(注意,是要貼近朋友的生活,而非自己的),也就是兼具愛情成分同時滿足其他條件,而這估計和朋友族群的八卦程度有極大關係。
        最後,有一些無法分析的因素我不知道如何納入考量,在這邊提出來,某些人會但單純因為文章很長就跳過,但相反地,有些跳過的人會因為發文的是好朋友而毫無理由的按讚。有些人則是只有女生發的動態才按讚;有些人則是只按正妹或跟自己有關的(這些無法掌握的客群通常在每人的朋友結構中佔了部分不可忽略的數量)。有些人會在看完動態後不先按讚去看留言,然後只按留言讚,可能是忘了或懶得回來按;有些人可能單純討厭我或猜到我要做因素分析而故意改變行為。

注釋
[1] FB三年前棄用了使用已久的Edgerank演算法,台大心理系刊物《逆光》去年三月有一篇「Facebook沒有告訴你的事」對於此演算法有詳細的說明(雖然他不知道已經棄用了),目前FB並沒有公開內部使用的演算法,但多數人同意使用的因素非常多,並同時與使用者互動式的調整(你可以藉由按「我不想看到這個」改變你的排序加權)。並且也有許多人找到了重要的影響因子。
        由於這個演算法非常有趣,容我稍作說明:FB會計算親近度權重、時間衰變、與朋友關係的設定(摯友)、貼文種類(影片>圖片>>純文字)、隱藏貼文、使用裝置、連網速度、Story bumping(舊但是沒看到的動態會自動浮出來)、Last actor(考慮最近50個互動朋友)。

[2] 十點半的由來是得讚比分別與九點、十點、十點半、十一點計算相關,最後取相關最高者,其相關分別是-.28-.32-.37-.29
  
[3] 得讚比與與十點半距離負相關表示發文時間越接近十點半得讚比越高呈正相關。

後記
        再次感謝受我欺騙的朋友們,尤其是最後一個更改感情狀態的動態(其他動態內容「多數」是真實的)。並且感謝那些支持我發文的朋友們,我為了作因素分析時常轉換文章風格(是否有人發現一下愛情一下友情,一下時事一下回憶,一下嘴砲一下文青?),因此造成我的動態水準參差不齊,若有人因此對我的某些文章感到失望,我也只能遺憾的說這是必要的犧牲了。歡迎繼續支持。
        另外礙於篇幅所限,也不附上實際分析的資料與每篇動態的內容,若想要的話可以私下索取。
可能有人會質疑這篇分析的價值,認為我找出了45個變項依然不能準確預測得讚比,是的,確實,根據迴歸模型,公開這篇的動態預測會是28個讚(接收者可以因此按或不按而改變準確度)。但在公開的數據之外,別忘了FB的點讚是記名的,在我得到了大眾胃口的結構之後,便可以分析所有曾經按我讚的人的喜好。是的,你只要有點過我的讚,我都已經知道你的胃口如何了(這就是隱藏研究動機),這價值高不高,就得視你個人的價值而定了(下次點其他人讚時也請三思,我也看的到)。而這些數據因為隱私而不能公開,「理論上」作為一個有倫理的研究者我應該也不會對私下偷偷來問我的人透漏的。

沒有留言:

張貼留言

請。高談闊論