SPSS中文版(Statistical Product and Service Solutions)是一款專業的數據統計和服務軟件,能夠為用戶錄入的數據進行統計、分析并加以運算,并且更加便捷的管理這些數據,使得用戶能夠更加清晰的找出這些數據,或者對這些數據進行編排,讓用戶在辦公的時候更加輕便。
操作簡便
界面非常友好,除了數據錄入及部分命令程序等少數輸入工作需要鍵盤鍵入外,大多數操作可通過鼠標拖曳、點擊“菜單”、“按鈕”和“對話框”來完成。
編程方便
具有第四代語言的特點,告訴系統要做什么,無需告訴怎樣做。只要了解統計分析的原理,無需通曉統計方法的各種算法,即可得到需要的統計分析結果。對于常見的統計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由“對話框”的操作完成。因此,用戶無需花大量時間記憶大量的命令、過程、選擇項。
功能強大
具有完整的數據輸入、編輯、統計分析、報表、圖形制作等功能。自帶11種類型136個函數。SPSS提供了從簡單的統計描述到復雜的多因素統計分析方法,比如數據的探索性分析、統計描述、列聯表分析、二維相關、秩相關、偏相關、方差分析、非參數檢驗、多元回歸、生存分析、協方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。
數據接口
能夠讀取及輸出多種格式的文件。比如由dBASE、FoxBASE、FoxPRO產生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數據文件,Excel的*.xls文件等均可轉換成可供分析的SPSS數據文件。能夠把SPSS的圖形轉換為7種圖形文件。結果可保存為*.txt及html格式的文件。
模塊組合
SPSS for Windows軟件分為若干功能模塊。用戶可以根據自己的分析需要和計算機的實際配置情況靈活選擇。
針對性強
SPSS針對初學者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡單的操作分析,大多青睞于SPSS,像薛薇的《基于SPSS的數據分析》一書也較適用于初學者。而那些熟練或精通者也較喜歡SPSS,因為他們可以通過編程來實現更強大的功能。
數據管理
在10版以后,SPSS的每個新增版本都會對數據管理功能作一些改進,以使用戶的使用更為方便。13版中的改進可能主要有以下幾個方面:
1)超長變量名:在12版中,變量名已經最多可以為64個字符長度,13版中可能還要大大放寬這一限制,以達到對當今各種復雜數據倉庫更好的兼容性。
2)改進的Autorecode過程:該過程將可以使用自動編碼模版,從而用戶可以按自定義的順序,而不是默認的ASCII碼順序進行變量值的重編碼。另外,Autorecode過程將可以同時對多個變量進行重編碼,以提高分析效率。
3)改進的日期/時間函數:本次的改進將集中在使得兩個日期/時間差值的計算,以及對日期變量值的增減更為容易上。
結果報告
從10版起,對數據和結果的圖表呈現功能一直是SPSS改進的重點。在16版中,SPSS推出了全新的常規圖功能,報表功能也達到了比較完善的地步。13版將針對使用中出現的一些問題,以及用戶的需求對圖表功能作進一步的改善。
1)統計圖:在經過一年的使用后,新的常規圖操作界面已基本完善,本次的改進除使得操作更為便捷外,還突出了兩個重點。首先在常規圖中引入更多的交互圖功能,如圖組(Paneled charts),帶誤差線的分類圖形如誤差線條圖和線圖,三維效果的簡單、堆積和分段餅圖等。其次是引入幾種新的圖形,已知的有人口金字塔和點密度圖兩種。
2)統計表:幾乎全部過程的輸出都將會棄用文本,改為更美觀的樞軸表。而且樞軸表的表現和易用性會得到進一步的提高,并加入了一些新的功能,如可以對統計量進行排序、在表格中合并/省略若干小類的輸出等。此外,樞軸表將可以被直接導出到PowerPoint中,這些無疑都方便了用戶的使用。
統計建模
Complex Samples是12版中新增的模塊,用于實現復雜抽樣的設計方案,以及對相應的數據進行描述。但當時并未提供統計建模功能。在13版中,這將會有很大的改觀。一般線形模型將會被完整地引入復雜抽樣模塊中,以實現對復雜抽樣研究中各種連續性變量的建模預測功能,例如對市場調研中的客戶滿意度數據進行建模。對于分類數據,Logistic回歸則將會被系統的引入。這樣,對于一個任意復雜的抽樣研究,如多階段分層整群抽樣,或者更復雜的PPS抽樣,研究者都可以在該模塊中輕松的實現從抽樣設計、統計描述到復雜統計建模以發現影響因素的整個分析過程,方差分析模型、線形回歸模型、Logistic回歸模型等復雜的統計模型都可以加以使用,而操作方式將會和完全隨機抽樣數據的分析操作沒有什么差別。可以預見,該模塊的推出將會大大促進國內對復雜抽樣時統計推斷模型的正確應用。
模塊
這個模塊實際上就是將以前單獨發行的SPSS AnswerTree軟件整合進了SPSS平臺。筆者幾年前在自己的網站上介紹SPSS 11的新功能時,曾經很尖銳地指出SPSS的產品線過于分散,應當把各種功能較單一的小軟件,如AnswerTree、Sample Power等整合到SPSS等幾個平臺上去。看來SPSS公司也意識到了這一點,而AnswerTree就是在此背景下第一個被徹底整合的產品。
Classification Tree模塊基于數據挖掘中發展起來的樹結構模型對分類變量或連續變量進行預測,可以方便、快速的對樣本進行細分,而不需要用戶有太多的統計專業知識。在市場細分和數據挖掘中有較廣泛的應用。已知該模塊提供了CHAID、Exhaustive CHAID和C&RT三種算法,在AnswerTree中提供的QUEST算法尚不能肯定是否會被納入。
為了方便新老用戶的使用,Tree模塊在操作方式上不再使用AnswerTree中的向導方式,而是SPSS近兩年開始采用的交互式選項卡對話框。但是,整個選項卡界面的內容實際上是和原先的向導基本一致的,另外,模型的結果輸出仍然是AnswerTree中標準的樹形圖,這使得AnswerTree的老用戶基本上不需要專門的學習就能夠懂得如何使用該模塊。
由于樹結構模型的方法體系和傳統的統計方法完全不同,貿然引入可能會引起讀者統計方法體系的混亂。為此,本次編寫的高級教程并未介紹該模塊,而將在高級教程的下一個版本,以及關于市場細分問題的教材中對其加以詳細介紹。
兼容性
隨著自身產品線的不斷完善,SPSS公司的產品體系已經日益完整,而不同產品間的互補和兼容性也在不斷加以改進。在13版中,SPSS軟件已經可以和其他一些最新的產品很好的整合在一起,形成更為完整的解決方案。例如,SPSS、SPSS Data Entry和新發布的SPSS Text Analysis for Surveys一起就形成了對調查研究的完整解決方案。而新增的SPSS Classification Trees模塊將使得SPSS軟件本身就能夠針對市場細分工作提供更為完整的方法體系。
SPSS中導入EXCEL數據?
首先在電腦上打開spss軟件,如果沒有spss就要去安裝一個,點擊spss快捷方式,進入spss圖形操作界面。
在spss的操作界面上,點擊左上角“文件”,在菜單中找到打開,點擊“打開”,在下級選項里選擇“數據”。
點擊進去文件管理界面后,在這邊選擇你所需要打開的excel文件,在“查找范圍”里選擇你excel數據文件存放的文件夾,接著在下面文件類型選擇excel文件類型,不然找不到excel文件。
當選擇好excel數據文件之后,單擊右邊“打開”按鈕,打開excel文件,在彈出的消息框中選擇“確定”打開。
打開之后,spss就把excel數據文件打開了,接著你可以按照需求來操作標簽各種變量值,這樣子我們就成功用spss處理excel數據文件了。
spss如何輸入數據?
1、首先打開SPSS,即可進入以下界面,這個界面就是打開之后的初始頁面。
2、點擊左上角的文件,新建一個文件,文件類型設置為數據。
3、新建結束后,我們就進入了如下界面。仔細看左下角,分為數據視圖和變量視圖。要想輸入數據,我們必須先設置好變量。
4、點擊變量視圖,即可出現如下界面。我們可以看到變量視圖中,第一個變量可以設置的包括名稱、類型、寬度、小數、標簽、和值等設置類型。
5、這里我們設置兩個變量,分別為姓名和年齡。姓名設置為字符串型,寬度為8位,小數位為0
6、年齡設置為數值型,寬度為2位,小數位為0。
7、當這些設置完成后,即可出現下列界面,表示變量定義完成。
8、然后點擊保存該文檔(文件——保存),存在一個自己記得的位置,方便下次可以快速找到它。
9、保存成功后,我們再回到剛剛已經保存的這個界面中,點擊左下角的數據視圖,就可以輸入數據。
在SPSS中,如果進行方差齊性檢驗呢?命令是什么?
方差分析(AnaylsisofVariance,ANOVA)要求各組方差整齊,不過一般認為,如果各組人數相若,就算未能通過方差整齊檢驗,問題也不大。
One-WayANOVA對話方塊中,點擊Options…(選項…)按扭,勾Homogeneity-of-variance即可。它會產生Levene、CochranC、Bartlett-BoxF等檢驗值及其顯著性水平P值,若P值<于0.05,便拒絕方差整齊的假設。
順帶一提,Cochran和Bartlett檢定對非正態性相當敏感,若出現「拒絕方差整齊」的檢測結果,或因這原因而做成。
在SPSS中能否直接讀入EXCEL97數據文件?有無讀入數據的簡便方法?
在SPSS10.0版中,任何版本的EXCEL文件都可以在OPEN對話框中直接打開。但在9.0及以前版本中就比較復雜,實際上SPSS7.0以上的版本都可以讀入EXCEL97和ACCESS97的數據文件。但這些文件類型不能在打開文件對話框的文件類型中找到,SPSS是利用ODBC來實現對這些數據文件的讀取的。例如在SPSS9.0中,請選擇File菜單->
newquery,會彈出數據庫讀取向導的對話框,按提示操作即可(你所能夠讀取的ODBC數據類型取決于你所用計算機上安裝的ODBC驅動程序的多少)。
實際上對于老版本的SPSS來說,讀入EXCEL97數據文件最簡單的方法是先在EXCEL97中選擇并復制所需數據(不要選擇變量名),然后在SPSS數據界面中選擇一行一列的單元格,將數據粘貼過來,最后將變量名改為原變量名。當變量少而記錄數多時,這種方法是最快的。
如何將SPSS的結果文件(*.spo文件)轉換為其它格式?
SPSS的結果文件從7.0版本起就是專用的*.spo文件,據我所知,還沒有那種文字處理軟件可以將他讀出來,但SPSS提供了將該文件轉存為其它格式的功能。在SPSS的OUTPUT窗口中選擇File菜單->export,可以將結果文件另存為HTML文件和TXT文件。當然,要比spo文件難看的多。圖表則自動轉化為JPG圖片,不能再編輯。因此,最好在所有修改都完成后再EXPORT。另外,該命令也可以針對單個圖片或表格進行,選中所需圖片或表格,單擊右鍵,選擇快捷菜單中的EXPORT即可。
想將SPSS的結果表格直接粘貼到WORD中使用,但一粘過去表格的格式就亂了,如何保持原有的格式?
選中所需表格,單擊右鍵,選擇快捷菜單中的copyobject即可,此時粘貼過去的表格就會保持原有的格式(實際上粘貼過去的是一幅圖片)。
在打開已有的Excel表格時可以成功地讀入數據,但同時出現Output1-SPSSViewer窗,這是什么原因?
該提示的意思是EXCEL表格的的12行第五列的數據和SPSS的格式不兼容,從而該數值可能無法正確導入,可能的原因是小數點后的位數太多。這需要談到一點編程的問題,EXCEL和ACCESS等的默認數據長度都是24位的,無論你的實際數值為多大。精度高是好事,但這個精度也太高了,會導致小數點后面跟了一大堆的0,從而超出SPSS所能夠承受的精度范圍,導致出現警告。這時你需要檢查一下你的數據,比如說太長、或者數字中間打入了一個逗號等,許多時候將該列的默認數據格式改一下就可以了。
如何在SPSS中文版中進行正交設計及正交分析?
我以前以為SPSS不能作正交設計,感謝網友edof@sh的提醒,經研究,做法如下:
設要做二因素的正交設計,A因素有三個水平,B因素有兩個水平。則選擇Data-->
generate,彈出的就是正交設計窗口:
Factorname框:輸入A:單擊ADD鈕:單擊Definevalue鈕:分別在Value列的頭三行輸入1、2和3,單擊continue鈕,這樣就定義好了變量A。
按類似的方法定義好變量B的2個水平。單擊OK,系統就輸出一個新定義的數據集,前兩個變量就是要分析的A和B,各個水平已經按正交設計的要求排列好了。后面的status_和card_變量是系統產生的LOG變量,可以不管它,F在你再建立一個結果變量,輸入實驗結果,就可以進行正交設計的分析了。
正交設計的分析用GLM模塊進行。具體操作如下
Univariate...dependent中選入應變量,fixedfactor中選入自變量。然后進入model鈕進行模型設置,這一步非常重要!設置模型為custom,然后選擇需要分析的主效應和交互作用。然后確認,就可以得到所需要的結果。
請注意,如果model鈕進行模型設置時選擇錯誤,則得到的結果肯定是不正確的。
如何在SPSS中作條件Logistic回歸分析和啞變量分析?
A:SPSS對條件Logistic回歸是無能為力的,但可以參照SAS答疑解惑中的變換方式對原數據進行變換再進行擬合。至于啞變量,如果將原變量設為分類變量(即選定為CAT),則擬合時許多模型會自動按啞變量擬合,但多數情況下得自行產生新變量。
SPSS能否用另外一個具有同樣數據結構的數據庫更新數據?如同foxpro中的Replace命令?
SPSS中DATA菜單提供的MERGEFILES過程就是用于橫向和縱向合并數據文件的,一般情況的數據合并問題該菜單都可以解決,具體用法請參見網站的SPSS教程第二章。
在SPSS中有無編程語言可寫?如IF....Else..等編程語句?
SPSS中有IF....Else..等編程語句,實際上也可以象其它編程語言一樣的使用。即可以用SPSS的SYNTAX窗口編寫SPSS程序來解決,在教程的第四章我有簡單的介紹。更復雜的情況可以用專門的SPSSPRODUCTIONFACILITY來完成。不過,我們所能碰到的多數問題可以用菜單來完成,如COMPUTE中的IF子菜單,不需要去編SPSS程序。
方差分析(ANOVA)多個樣本均數間的兩兩比較,即PostHoc對話框中提供了兩種不同情況下的選項,請問EqualVarianceNotAssumed是在方差不齊時選用的嗎?其下所提供的四種陌生的檢驗方法可以介紹一下嗎?
是的,的確如此,這些方法就是在方差不齊時選用的。不過>這四種檢驗方法我也不熟悉,實際上除了SNK、LSD等少數幾種方法外,對于方差分析的兩兩比較理論上就沒有統一起來,真正是各說各的理,結果誰也不服誰。不信你去看看SAS,這四種檢驗方法根本就找不到!從SPSS的幫助內容翻譯出來的意思如下:
Tamhanes’sh2:基于T檢驗的一種保守的兩兩比較方法。
Dunnetts’st3:基于標準化最大系數的兩兩比較方法。
Games-howell:有時標準過松的兩兩比較方法。
Dunnett’sC:基于標準化全距的兩兩比較方法。
以上四種方法在方差不齊時使用才合適。
SPSS中HomogeneousSubsets下的S-N-K是國內教科書中所指的S-N-K法嗎?他提供的LSD法可用于各組間的兩兩比較嗎?或者說,可以替代國內教科書中此種情況下所介紹的S-N-K法嗎(因為您知道LSD法在教科書中是用于各治療組與對照組之間兩兩比較的)?
你說的對,此S-N-K即彼S-N-K。不過SPSS提供的LSD法不能就這樣簡單的代替SNK法,因為每種方法都有它的設計思想和適用范圍,LSD在推導時就是在假設有一個標準對照的情況下進行的,如果用它來作任意兩組的兩兩比較,則相當于隨便改變了alpha水準,自然不對了。