科學數據如何畫靚啲?

科學家在寫論文的時候,除了文字解釋外,也需要用圖表去表達數據。今次我想介紹的是科學家很常用的一種數據表達方式:對數 (logarithm)。

我們在中學都會學過對數的數學運算。根據我一位數學家朋友所講,簡單來說,對數「就是用加法來做乘法」:

[在本篇文章之中,所有對數的底數 (base) 都是 10,當然我們的討論同樣適用於其他底數]

在日常生活中,我們可能沒有什麼機會用到對數運算。不過科學家卻是非常喜歡用的呢!為什麼呢?

很多自然定律都有一個特徵,就是它們的數學表達式,都是遵從冪定律 (power law) 的。例如地震強度、萬有引力和電磁力的強度、太陽內部的核子反應過程速率、行星運動軌跡、大家比較熟悉的經濟學裡的 80 – 20 定律 (長尾理論)、我在《科研解碼:淺談伽瑪射線暴》中介紹過的電子同步幅射光譜等等,都遵守冪定律。

可是冪定律又跟對數有什麼關係呢?其實在數學上並沒有特別關係,對數只是一種運算方法。不過在表達數據的時候,例如在用圖表去把數據畫出來的時間,如果不用對數去表達冪定律,就可能不太方便了。例如下圖是電子同步幅射光譜:

Screen Shot 2015-06-18 at 16.50.16

在上圖,我們很容易就可以看出同步軸射光譜的特徵。留意圖中橫軸和縱軸,我們不是 1, 2, 3, 4… 即線性 (linear) 地去數,而是 1, 10, 100, 1000… 地去數。換句話說,我們用了對數方式去表達橫軸和縱軸,因為 log 1 = 0, log 10 = 1, log 100 = 2, log 1000 = 3… 如此類推。所以其實在橫軸上,越向右邊的數字之間的「密度」就越高;同樣地在縱軸上,越向上面的數字之間的「密度」也越高。即是當我們使用對數去表達圖表的時候,越大的數字的貢獻會被「濃縮」,反之越小的數字的貢獻就會被「強調」。

我們會問,為什麼要這樣做啊?因為大自然的運作方式,很多時候都是冪定律。冪定律意味著在分析數據的時候,我們需要同時分析「很大」和「很小」的數字。但是,人類的腦袋卻比較習慣分析線性的資料,即是之間分別不是太大的數字。

例如,我們比較容易感受 1, 2, 3, 4… 去到不太大的數字之間的分別,例如我能夠感受 1 蚊和 100 蚊之間的分別 (很重要的啊,我以前可是要儲很久才買到一部 1:144 高達)。可是如果我問「1 萬和 1 千億之間的分別」或者「 1 仙和 1000 蚊之間的分別」時,我們對這兩個數字之間的分別的感受就沒有 1 蚊和 100 蚊之間的分別那麼大了。

其實不用講這麼多,我只要把上圖的橫軸和縱軸由對數改成熟悉的線性,大家就會明白了:

Screen Shot 2015-06-18 at 16.52.36

變成了圖中大部分只看到一條橫線,而且完全看不出來同步軸射曲線的曲率了!注意,這兩張圖在數學上是完全等同、一模一樣的,只是表達方式由對數變成線性罷了!

其實科學家在寫論文的時候,很大一部分時間都是在考慮如何能把數據表達得比較「美觀」,即是如何直接把數據的重點表達出來。由數軸用對數還是線性、選擇用什麼數學符號、以至數據點用什麼顏色等等,都有很大的學問在其中啊!

phd0213

[圖片來源:PHD Comics]

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s