FYI: 常用的數據分析工具 — Python、R、SPSS. 行銷人和商管人過去在進行資料(數據)分析時,經常會使用MS… | by 行銷資料科學 | Marketingdatascience | Medium
Published by 劉正山,
行銷人和商管人過去在進行資料(數據)分析時,經常會使用MS Excel、SPSS或者是SAS等套裝軟體。因此,讀過商研、心理或社會學等研究所的學生對這些軟體都不會太陌生。但是,現在隨著R和Python電腦語言的崛起,加上其免費、後續衍生的套件功能強大、可處理資料容量也讓SPSS等軟體難以望其項背。因此,許多研究生和商管人已有逐漸改用R、Python的趨勢。
過去,由於商管研究所學生要畢業之前,大都規定要寫一本論文,因此做量化問卷和用SPSS跑統計是很稀鬆平常的事。而在寫論文之前,就會聽到很多學長姐或同學一直在詢問,哪裡可以找到SPSS軟體。
SPSS套裝軟體的好處是,它很容易於操作與學習,但必須要付費。R和Python語言的最大好處是「免費」,而且有龐大的社群在背後支持,加上不斷地開發出新的套件,供使用者使用。
不過,這些套裝軟體或是程式語言,都有優缺點與其適用性,在進行資料分析的學習與實作時,可以根據自己的需求與條件,選擇適合的套裝軟體或是程式語言來學習。
以下,簡單就SPSS、R和Python進行比較,如圖1所示。

- SPSS
SPSS是IBM旗下的一套統計分析軟體。它的歷史悠久,最早的版本是於1968年提出。本書作者在學校做研究時,大都使用SPSS來進行。SPSS的售價並不便宜,大約十萬元起跳,如果需要用到其他進階功能,還需加購其它進階模組。
至於在資料量的處理上,相對於Python與R,SPSS處理的資料量相對較小(當然,處理能力還牽涉到電腦效能)。在資料分析上,SPSS適合進行統計分析與資料探勘,但繪圖功能對於Python與R要來的弱。
總之,SPSS是一套相當好上手的套裝軟體,也廣受許多大研究機構、學校、企業所使用。
2. R語言
R語言是由紐西蘭奧克蘭大學的羅斯·伊哈卡(George Ross Ihaka)和羅伯特·傑特曼(Robert Clifford Gentleman)於1993年所開發。R語言是一套免費的程式語言,而且背後有廣大的社群不斷地在研發新的套件。在資料量的處理上,R語言適合處理較大的資料量(相對於SPSS,如果資料量更大,就適合用Python)。
在進行資料分析時,R適合進行統計分析與資料探勘,而且R的繪圖功能非常強大,能呈現出良好的資料視覺化。目前幾乎所有統計系的學生,都被要求學習R。
3.Python
Python是由荷蘭程式設計師吉多·范‧羅蘇姆(Guido van Rossum)於1991年所提出。它與R一樣,是一套免費的軟體,而且背後有龐大的研發社群進行支援。
在資料量上,Python適合處理大資料與小資料。Python除了適合進行數據分析,Python還適合連結網頁後端,並與各大應用框架進行串接。這樣強大的延展性的功能,已經讓資料科學家跳脫數據分析的範疇,而進入到資料產品服務的研發設計上。
作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)