2014/01/28

影響Facebook動態消息得讚比之因素分析 v2


感謝

在此首先要感謝我的FB朋友們,他們在我沒有事先告知的情況下協助我完成了這次研究,並且沒有任何報償,時間長達半年。其中可能有人會在得知真相後感到不悅、受欺騙、被愚弄,在此致上最深的歉意。

v2版本修訂

        此版本新增了3份樣本動態,並增加了分析方法、修正了一些錯誤,包括上一版本中的相關性檢定誤用了單尾檢定,已做修正,但因為第一版本的討論中仍有部分價值,故予以保留。

---20140622修訂
        修改緒論,新增參考文獻及部分微調。

緒論

        FB流行幾近氾濫的時代中,隨處可見的是人們閒暇時刻便拿起手機或開著網頁瀏覽FB,由於其動作通常是不斷的往下捲動,我們通常稱為「滑FB」。2009年的研究發現,學生族群一天花30分鐘於使用FB上;同時,他們比閱讀真實的文章花更多時間在閱讀FB上的內容(Pempek et al., 2009),調查顯示,42%的人在上課期間分享至少15條連結(Baresch et al., 2011)。不可否認的,這樣的資訊接收平台大大的改變了我們習慣的方式,現今年輕人用分享消息和連結來確保自己知道任何該知道的消息,Stelter (2008)稱這種策略為「social filter」,而相較較好的另一種傳統方式則是「professional filter」,也就是傳統資訊提供者與閱聽者之間的關係。
S. Güzin MAZMAN (2011)等人收取了870FB使用者樣本後,將使用的主要目的進行因素分析後發現可以被分為四大類:維繫現有關係(maintaining existing relationships)、產生新的人際連結(making new relationships)、學術用途(using for academic purposes)以及追隨特定議題(following specific agenda)Bonds-RaackeRaacke (2008, 2010)指出FB對於我們在維繫現有關係、產生新的人際連結及傳遞訊息的功能上可以得到滿足。而我們達成這些功能的方式,不外乎只有發送訊息、發表動態消息(News feed)及相關功能(留言、按讚)及「戳」(poke),但「戳」現今以幾乎無人使用,訊息亦為私密資訊不易取得,因此本研究將會專注於動態消息的部分。
關於動態消息的互動方式,FB有其獨創的功能:「按讚」(Like),使人與人、人與團體之間的互動多了一種有趣的方式。「按讚」在社群網站上非常重要且有其價值,The e-commerce platform company ChompOn2011年估計,FB上的每一個讚對其價值平均為8美元(Baresch et al., 2011)。然而,根據Yahoo!奇摩社群研究團隊的報告,一則動態按讚、回應的數量和連結的點閱並沒有太大的關聯。舉例來說,新聞「曾雅妮首冠」的按讚留言為「手機緊急撥號」案例的2~3倍,看似這篇文章似乎較多網友觀看,但實際上「曾雅妮首冠」的點閱率僅為手機案例的4%。該研究團隊發現,欲得到讚所需要的內容屬性為:讓網友感到有當下負荷的必要情緒性內容(創造義氣感)、符合民意的發言。他們實際觀察後得到的結論發現如下表。然而,這只是他們階段性的結論,從生活中的案例可以發現,極度不合民意的發言同樣也可以獲得高讚數,而有意義、深度的內容理應也應該得到叫多的讚數,因此本研究試圖分析得到較多讚之動態內容,目標是找到一般學生族群之按讚胃口。
From: https://marketing.tw.campaign.yahoo.net/emarketing/contentF4.php?main=A06&sub=B02&tri=&literary=453

通常,我們可以給偶像或喜愛的粉絲專頁讚,以表示支持與認同,但這種讚是一次性的。因此本研究的主要重點集中在於動態,動態是所有人都可以發佈的消息,並且不受次數頻率、內容形式影響,而動態會根據某些演算法[1]得到其分數,排序後出現在好友或追蹤者的動態消息中,任何看到這則動態的人,可以自由選擇是否要留言或給予讚,而不會受到任何限制。
            因此可想而知,讚的數目極度容易受到曝光率、動態內容等眾多因素影響。我曾經在半年前分析過可能受到影響的因素(亦是此研究的起點),而這只是非常粗略的區分,略作修正後如下:

一個發文頻率普通的人,得到的讚數除以他的總朋友數,也就是得讚比,通常介於5%~15%之間。影響因素有如:
·                  朋友結構:你的得讚比近10%或超過,可能你的朋友都是些只會迎合你喜好的王八蛋。或只是單純熟朋友比較多。
·                  發文類型:大於10%,你的發文類型較合大家胃口,換句話說,你是迎合別人胃口的王八蛋。或只是單純你的文筆好、照片驚悚,或你是正妹。
·                  發文時間:熱門時段是晚餐過後至睡前,及大家剛起床先滑手機時,在這段時間曝光,較不容易被蓋過。
·                  發文頻率:發文頻率過高者,普遍得讚比較低,原因如超級廢文超級大爛廢文,然而發文頻率低者不一定較高。

然而,在了解了FB的演算法則後,我發現有許多因素其實已經被綜合在FB的評分排序(ranking)內,且其演算法則是眾所皆知的,並沒有研究的價值。因此本研究注重動態的內容,包括其結構、語氣、修辭方式等,旨在探討何種形式或內容的動態較能或較不符合他人的胃口(讚不等於合胃口,但姑且讓我們這樣形容它)。

研究動機

        探討影響FB動態消息的因素,注重在內容與形式上的變項。

研究方法

        使用SPSS統計軟體進行相關分析、變異量分析與因素分析。 
        依變項為得讚比,其計算方式為:
                得讚比=該動態讚數/當時朋友數量
        將可能影響的變項分為八大類,共包含45個因素,除時間距離、字數、行數、標籤數外皆為二分變項。說明及操作型定義如下:
·         時間
·         與十點半距離(分鐘):發佈動態得讚比最高時段為晚間十點半[2],以分鐘為單位,不分正負。
·         與上篇間隔時間(天):推測頻繁的發佈動態會造成接收者不願意仔細觀看或內容空泛,也就是俗稱的廢文。
·         功能:FB動態所內建可選的功能,不包括打卡。
·         圖:動態是否附圖,不分析圖片性質。
·         連結:動態內是否有附連結,推測有連結可能造成接收者轉移注意、懶得回來按讚。
·         分享:此篇動態是否是分享他人內容(使用分享功能而非單純的分享)。
·         標籤:在動態內是否有標記朋友。
·         標籤數目:標記朋友的數目。
·         內容
·         愛情:內容有愛情成分。推測多數人較愛好愛情類的內容。
·         友情:內容有友情成分。推測此類較能引起共鳴。
·         親情:內容有親情成分。
·         抱怨:內容有抱怨成分。推測會不受歡迎,但亦有可能得到安慰。
·         廣告:內容有廣告成分。推測會不受歡迎。
·         時事:內容有時事成分。新聞媒體所報導的稱為時事,否則為生活貼近。
·         用詞
·         文青:用詞文青,文青為文藝青年的簡稱,意為用浮誇的詞藻修飾。本身可能意義不大,但推測會受到某部分族群歡迎、評價兩極。
·         粗俗:用詞粗俗,包含一些常見的髒話、匿稱、誇張的自稱,無自謙詞。
·         形式
·         記敘:記敘文。通常符合生活真實事件,推測易引起共鳴,可能與生活貼近有共變。
·         抒情:抒情文。可能較符合某些族群。
·         論說:論說文。可能較符合某些族群。
·         學術:論文或類似格式。可能較不受歡迎。
·         結構
·         聳動開頭:能夠吸引人繼續觀看,可能有明顯效果。
·         創意結尾:能使人印象深刻,願意按讚。
·         貼近結尾:在結尾與接收者互動,使人較願意留言或參與討論。(如:以下開放討論或開放式問題)
·         行數:長度可能影響第一印象,太長可能使人不願意讀下去,太短內容可能不容易有高價值。
·         字數:與行數類似,統計方式不同。
·         語氣
·         諷刺:諷刺對象或事件不拘,推測有其客群。
·         哀怨:可能令人不愉快,但亦可能引起共鳴。
·         雙關:可能需要思考,推測有部分客群。
·         悲傷:與哀怨不同,可能會吸引安慰。
·         其他
·         實用性:動態內容是否有其實用價值、是否對他人有幫助。
·         生活貼近:內容是否貼近朋友們的生活,推測可能引起共鳴。
·         耍屌:假裝很屌。由多人判定
·         真屌:真的很屌。由多人判定。
·         佳句:文內含有佳句,無論明引或暗引,亦不討論佳句種類。
·         有趣搞笑:內容是否會引人發笑,推測有好效果。
·         音樂:內容是否附有音樂歌詞、音樂連結或相關描述。
·         夢想熱情:內容是否牽涉到夢想或熱情,可能引起某些較重視熱血生活的族群。
·         創意:內容是否有創意,不可抄襲。
·         文內呼應:在文中前後或各部分是否有互相呼應,推測有好效果。
·         回憶:內容是否有包含回憶成分,推測會吸引念舊的人。
·         感動:內容是否使人感動,推測吸引感性的人。
·         修辭
·         對偶:是否有對偶,推測有助閱讀。
·         映襯:是否有映襯,可能有衝突感。
·         轉品:是否有轉品。

研究結果

        由於變項過多,請參照整理過後的表,已刪除不顯著的變項。負相關因素全部不顯著。

表一:正相關因素及相關性檢定
類別
因子
r
t
其他
真屌
0.601
3.442 **
時間
與十點半距離(m)
-0.551
-3.028 **[3]
內容
愛情
0.442
2.260 *
功能
標籤數目
0.425
2.149 *
*:α=0.05
**:α=0.01
PS. 真屌為由他人判定的盡量客觀但無操作型定義因素

表二:迴歸分析Anova
Anovab
模式
平方和
df
平均平方和
F
顯著性
1
迴歸
1569.737
22
71.352
.
.a
殘差
.000
0
.
 
 
總數
1569.737
22
 
 
 
a. 預測變數:(常數), 轉品, 愛情, 抱怨, 論說, 標籤數目, 文內呼應, 有趣搞笑, 雙關, 友情, 囂張, 音樂, 感動, 親情, 與十點半距離(m), 與上篇間隔時間(), 回憶, 耍屌, 夢想熱情, 生活貼近, 諷刺, 映襯, 真屌
b.
依變數: 得讚比

表三:迴歸分析係數
係數a
模式
未標準化係數
標準化係數
t
顯著性
B 之估計值
標準誤差
Beta 分配
1
(常數)
4.712
.000
 
.
.
與十點半距離(m)
.004
.000
.128
.
.
標籤數目
-.089
.000
-.110
.
.
與上篇間隔時間()
-.695
.000
-.536
.
.
愛情
-3.910
.000
-.225
.
.
友情
8.708
.000
.297
.
.
親情
36.504
.000
.901
.
.
抱怨
4.792
.000
.239
.
.
論說
15.225
.000
.621
.
.
諷刺
9.056
.000
.416
.
.
囂張
-.911
.000
-.037
.
.
雙關
-7.195
.000
-.330
.
.
生活貼近
-2.988
.000
-.179
.
.
耍屌
3.360
.000
.115
.
.
真屌
30.318
.000
1.236
.
.
有趣搞笑
-2.184
.000
-.116
.
.
音樂
-3.705
.000
-.151
.
.
夢想熱情
-2.989
.000
-.102
.
.
文內呼應
6.995
.000
.239
.
.
回憶
16.812
.000
.894
.
.
感動
2.185
.000
.075
.
.
映襯
9.708
.000
.485
.
.
轉品
-.472
.000
-.019
.
.
a. 依變數: 得讚比

表四:全部因素描述統計
敘述統計

平均數
標準離差
分析個數
得讚比
13.502
8.447
23
與十點半距離(m)
231.91
253.645
23
.30
.470
23
連結
.30
.470
23
分享
.30
.470
23
標籤
.13
.344
23
標籤數目
2.35
10.404
23
與上篇間隔時間()
7.30
6.519
23
愛情
.35
.487
23
友情
.09
.288
23
親情
.04
.209
23
抱怨
.22
.422
23
廣告
.13
.344
23
時事
.13
.344
23
文青
.22
.422
23
粗俗
.09
.288
23
記敘
.26
.449
23
抒情
.30
.470
23
論說
.13
.344
23
學術
.17
.388
23
聳動開頭
.22
.422
23
創意結尾
.48
.511
23
貼近結尾
.39
.499
23
行數
26.65
31.373
23
字數
408.87
565.900
23
諷刺
.17
.388
23
哀怨
.17
.388
23
囂張
.13
.344
23
含蓄
.17
.388
23
雙關
.17
.388
23
悲傷
.13
.344
23
實用性
.09
.288
23
生活貼近
.43
.507
23
耍屌
.09
.288
23
真屌
.13
.344
23
佳句
.39
.499
23
有趣搞笑
.26
.449
23
音樂
.13
.344
23
夢想熱情
.09
.288
23
創意
.30
.470
23
文內呼應
.09
.288
23
回憶
.26
.449
23
感動
.09
.288
23
對偶
.22
.422
23
映襯
.22
.422
23
轉品
.13
.344
23

 

討論

        結果發現,屌文與愛情是最能顯著影響得讚比的(α=0.01),而愛情與標籤數目則是次要的決定因素。愛情此因素在預料之內,多數人喜歡看愛情故事或相關的文章,這部份可能有很大的年齡差異。屌文數目不多,可能導致誤差,但可以證實人們相對不喜歡耍屌(-.012)。發文時間則是一篇動態最好掌握的因素,十點半,估計是多數人結束了一天在休息時會滑FB,或在念書時正要滑FB的時段,太早可能會被較新動態蓋過,太晚則可能錯失某些客群。最後標籤數目也是重要的影響因素,因為標記朋友幾乎絕對的保證了出現在其通知中,曝光率會顯著的提升,然而不可胡亂標記(如廣告)。
        負相關的因素在修正後全部都不顯著,但其中有幾項低度相關的因素在此提出:圖、分享、連結、廣告,相關係數分別為-.389-.358-.339-.332。連結可能是因為會使接受者轉移注意力,且因為這種動態相當於把一部分的價值放到連結內,若接受者未點連結,會導致低估此動態的價值。分享和連結類似,通常也需要連結到另一個頁面,較特別的是分享的是圖時,點進此圖按讚視同按圖片發佈者的讚,而非分享者,導致顯著稀釋得讚比。
        在迴歸分析的部份,其實用價值則無法保證,可能需要另外驗證。
        特別提出的非統計討論則是:我一開始推測更換感情狀態為「穩定交往中」是會獲得最高得讚比的,然而事後發現只有第二高。在23篇統計當中,最高的是發佈此篇研究並標記50個朋友(所有按更改感情狀態讚的人)的動態,獲得29.9%得讚比;更改感情狀態獲得27.7%得讚比;第三高的是獲得26%得讚比的一個感人的愛情故事(主觀評論);而第四高的是友情故事,雖然旨在嘲笑朋友,但內容充滿可能引起共鳴的回憶,並起與多數朋友有聯繫,亦標註了兩個朋友,因此獲得24.2%得讚比。以下推論沒有數據支持,個人認為要獲得高得讚比的方式不能單已愛情或屌文而論,而是要感人(然而因為這太過主觀無法列入變項分析,有些可惜或貼近多數朋友的生活(注意是要貼近朋友的生活,而非自己的),也就是兼具愛情成分同時滿足其他條件,而這估計和朋友族群的八卦程度有極大關係。但相對來講,若單純為提高得讚比,發佈一些與朋友有關並標註他們的動態、並在關鍵時段是更為有效的方式(時常可以在吃飯聚餐的打卡上發現穩定的得讚比)。
        最後,有一些無法分析的因素無法納入考量,在這邊提出來,某些人會但單純因為文章很長就跳過不看,相反地,有些跳過的人會因為發文的是好朋友而毫無理由的按讚。有些人則是只有女生或正妹的才按(這些無法掌握的客群通常在每人的朋友結構中佔了部分不可忽略的數量)。有些人會在看完動態後不先按讚而去看留言,然後只按了留言讚;有些人可能單純討厭我或猜到我要做因素分析而故意改變行為。

注釋

[1] FB三年前棄用了使用已久的Edgerank演算法,台大心理系刊物《逆光》去年三月有一篇「Facebook沒有告訴你的事」對於此演算法有詳細的說明(雖然他不知道已經棄用了),目前FB並沒有公開內部使用的演算法,但多數人同意使用的因素非常多,並同時與使用者互動式的調整(你可以藉由按「我不想看到這個」改變你的排序加權)。並且也有許多人找到了重要的影響因子。
        由於這個演算法非常有趣,容我稍作說明:FB會計算親近度權重、時間衰變、與朋友關係的設定(摯友)、貼文種類(影片>圖片>>純文字)、隱藏貼文、使用裝置、連網速度、Story bumping(舊但是沒看到的動態會自動浮出來)、Last actor(考慮最近50個互動朋友)。
[2] 十點半的由來是得讚比分別與九點、十點、十點半、十一點計算相關,最後取相關最高者。
[3] 得讚比與與十點半距離負相關表示發文時間越接近十點半得讚比越高呈正相關。

參考文獻
Tiffany A. Pempek, Yevdokiya A. Yermolayeva, Sandra L. Calvert. (2009). College students' social networking experiences on Facebook. Journal of Applied Developmental Psychology, 30, 227–238.
Brian Baresch, Lewis Knight, Dustin Harp, Carolyn Yaschur. (2011). Friends Who Choose Your News: An analysis of content links on Facebook. International Symposium on Online Journalism.
Stelter, B. (2008). Finding political news online, the young pass it on. The New York Times. Retrieved from http://www.nytimes.com/2008/03/27/us/politics/27voters.html
S. Güzin MAZMAN, Yasemin Koçak USLUEL. (2011). Gender differences in using social networks. The Turkish Online Journal of Educational Technology.
Bonds-Raacke, J., & Raacke, J. (2010). MySpace and Facebook: Identifying dimensions of uses and gratifications for friend networking sites. Individual Differences Research, 8(1), 27-33.
Raacke, J., & Bonds-Raacke, J. (2008). MySpace and Facebook: Applying the uses and gratifications theory to exploring friend-networking sites. Cyberpsychology & behavior, 11(2), 169-174.

後記


        再次感謝我的朋友們,尤其是受最後一個更改感情狀態的動態所騙的朋友(其他動態內容多數是真實的),而此動態有許多人猜測是假的,並在事後非常肯定的和我說有猜到,對此我認為不會影響統計,因為多數人仍會按讚,且有極大成分是後見之明偏誤(經過調查,多數人的肯定程度落在0.7~0.9之間,以此數字來看,幾乎可以肯定有偏誤成分)。並且感謝那些支持我發文的朋友們,我為了作因素分析時常轉換文章風格(是否有人發現一下愛情一下友情,一下時事一下回憶,一下嘴砲一下文青?),因此造成我的動態水準參差不齊,若有人因此對我的某些文章感到失望,我也只能遺憾的說這是必要的犧牲了。歡迎繼續支持。
            另外礙於篇幅所限,也不附上實際分析的資料與每篇動態的內容,若想要的話可以私下索取。
可能有人會質疑這篇分析的價值,認為我找出了45個變項依然不能準確預測得讚比,是的,根據迴歸模型,發佈這篇的動態預測會是15.6%的得讚比(接受者可以因此按或不按而改變準確度),但實際卻是出人意料的29.9%。但其價值並不在於預測,而是了解影響因素,雖然樣本動態過少,確實是有其困難度。但在公開的數據之外,FB的點讚是記名的,在我得到了大眾胃口的結構之後,便可以分析所有曾經按我讚的人的喜好。是的,你只要有點過我的讚,我都已經知道你的胃口如何了,這價值高不高,就得視個人的價值而定了(下次點其他人讚時也請三思)。而這些數據因為隱私問題而不能公開,理論上作為一個有倫理的研究者我應該也不會對私下偷偷來問我的人透漏的。