2010/08/21

資訊傳遞失真率

很明顯標題有個「率」表示這是一篇有大量計算的文章,所有資訊都是有依據的,但是這篇文章並不帶有嘗試影響各位價值觀的意味,請確定保持您思想的客觀性後入內觀賞,若是被本文影響概不負責。

在開頭來個與本文只有少許關聯的謎語:你來到一個三岔路,一邊是通往老實村,另一邊是通往說謊村,但你並不知道哪條路是通往哪個村子。而老實村的村民不管你問什麼都會照實回答,而說謊村的村民不管你問什麼都會以假話回答,恰巧這時候有一位不知道來自哪個村子的村民站在路口,你只能問他一個是或否的問句,你如何能判斷出哪邊是老實村呢?
歡迎各位暫停稍作思考,解答在文末。

進入本文。
首先先舉一個例子方便各位理解,請看下圖:

假設一個人持有正確情報(以T表示正確,F表示錯誤),他告訴0.9(90%)的人正確,0.1的人F,而其餘的人也依此方式傳遞下去,當然有些人持有F並告訴0.1的人錯誤的情報,也就又變成了T。
到了第三層,計算一下T與F的總數會發現T=0.756, F=0.244,和原來第一層的T=0.9, F=0.1相差了許多,以此類推傳遞下去的話,會變成如下狀況:
  T F
0 100 0
1 90 10
2 82 18
3 76 24
4 70 30
5 66 37
6 63 37
7 60 40
8 58 42
相信各位很容易觀察的出來,T和F的值會漸漸趨近50,也就是T和F漸趨相等。
這種情況不只是在0.9正確的情況下發生,不論資訊傳遞的失真率是多少,都會漸漸趨近於「半真半假」,以下是證明及公式推導。

(pf)
設a是失真率(正,前文的0.9),b=a-1(負值),因此當數字為正時情報為T,負時為F。
設n是第幾次傳遞(幾層),T為真情報的比率,F為假情報的比率的相反數(0"<"T"<"1, 0<-F<1)

根據上圖可以得到以下算式:
if n=1→T=a, F=b
if n=2→T=a2+b2, F=2ab
if n=3
→T=a3+3ab2, F=3a2b+b3
if n=4→T=a4+6a2b2, F=b4+4a3b+4ab3
整理以上式子後發現:
if n=1→T+F=a+b
if n=2→T+F=(a+b)2
if n=3→T+F=(a+b)3
if n=4→T+F=(a+b)4
if n=k→T+F=(a+b)k
又因為T與-F皆為比率,相加為1(100%)。
因此得到T-F=1。
聯立 T+F=(a+b)n ...(1)
T-F=1 ...(2)
得到T=[(a+b)n+1]/2
又因b=a-1,可化簡為T=[(2a-1)n+1]/2
取極限,limn→∞(2a-1)n=0, limnn→∞
[(2a-1)n+1]/2=0.5,故正確率T及錯誤率-F皆會趨近相等得證。
且根據公式只要輸入變數(失真率, 層數)=(a, n),即可求出正確率T。

證明部分告一段落,整理一下,到這邊已經導出了藉由確認「資訊失真率」、
「資訊傳遞層數」,即可求出「資訊正確率」的理論值公式。此為上半部。
但是到目前為止,都還是在純理論的階段,在現實生活中沒有人統計過所謂的「失真率」,因此我要根據部分的數據計算出現實世界的資訊傳遞失真率。

首先根據統計,人類說話速度為每分鐘85字,人類說話頻率為每分鐘60字,人類說謊頻率為每10分鐘說3次謊。計算後得到說話速度為1.4167字/秒、說話頻率為1字/秒、說謊頻率為200秒/次。整理後,每200秒說1次謊,其中講了200字共花了141.67秒,因此說謊率計算出為:每141/200=0.705,也就是a值。

再來,根據六度分隔理論,人與人的平均距離最多只隔了六個人,因此此層數(n)在一定的機率下必不超過6。

因此將(a, n)=(0.705, 6)代回公式後得到T=0.5023750521205。
此為結論。

順便附上在a=0.705的情況下,
n=1時,T=0.705
n=2時,T=0.584
n=3時,T=0.534
n=4時,T=0.514
n=5時,T=0.506
n=6時,T=0.502

由此篇可以得知,資訊的傳遞經過越多手消息,可靠性皆會大大的降低,包含在第一手資訊情況內可信度只有0.7,所謂成語「半信半疑」大概就是在描述此種情況吧。仔細想想,我們平常接觸到的資訊媒體,至少都是經由提供者→整理者→報導者→接收者之三手消息,在合理範圍內判斷所有資訊可信度約五成並不為過吧。

當然了,這篇也只是理論,並沒有考慮進真實資訊的複雜程度,包含:資訊不一定為是非命題、資訊可能牽涉到商業或政治等因素而a會遠小於0.705、資訊提供者及傳遞者的嘴殘狀況、資訊傳遞者及接收者的耳包狀況、電子訊號傳遞所產生的自然失真、資訊經手人的個人信用程度、資訊接收者的個人信任度價值觀、資訊接受者的個人心理變態程度、資訊本身所牽扯到的附加利益或成本產生的影響、資訊經手者本身的人際關係、資訊本身與道德或法律相違背的狀況、資訊本身並非資訊的狀況、資訊經過多國語言翻譯產生的失真、資訊經過聽說以外的管道產生的理解錯誤...等等狀況無法一一列舉。

重點:請抱持半信半疑。

在第一段提到的謎語,在此公布答案:只要你問他:請問你的村子在右邊嗎?


引用及參考文獻部分:
誠實村以及說謊村之謎語:《應急詭辯術》,廖英迪,大展出版社有限公司。
靈感及部分計算表示方式:《應急詭辯術》,廖英迪,大展出版社有限公司。
人類說話速度平均每分鐘85字:由演藝公會統計。
人每10分鐘說3次謊:統計,心理學家保羅‧艾克曼。
六度分隔理論:連鎖信實驗,心理學教授斯坦利‧米爾格拉姆,維基百科

感謝您的欣賞,歡迎提出批評。

2 則留言:

  1. 那謎語好像是某本書裡面的
    書名叫什麼來著的我忘了..

    好吧整篇我只有那謎語看得懂= =

    回覆刪除
  2. 我後面有寫引用啊,應急詭辯術,但是應該很多書都有吧

    回覆刪除

請。高談闊論