統計學

来源:www.uuuwell.com

   

統計學(statistics)是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學人文科學,甚至被用來工商業及政府的情報決策之上。

簡介

  統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。

發展歷程

起源

  統計學的英文statistics最早是源於現代拉丁文statisticum collegium (國會

統計學相關書籍

)以及義大利文statista (國民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是「研究國家的科學」。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。   統計學是一門很古老的科學,一般認為其學理研究始於古希臘的亞里斯多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了「城邦政情」,「政治算數」和「統計分析科學」三個發展階段。所謂「數理統計」並非獨立於統計學的新學科,確切地說它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的範疇,而屬於數學的範疇。   統計學的發展過程的三個階段

《商務管理統計學》封面圖

「城邦政情」階段

  「城邦政情」(Matters of state)階段始於古希臘的亞里斯多德撰寫「城邦政情」或「城邦紀要」。他一共撰寫了一百五十餘種紀要,其內容包括各城邦的歷史,行政,科學,藝術,人口,資源和財富等社會和經濟情況的比較,分析,具有社會科學特點。「城邦政情」式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被「政治算數」這個名詞所替代,並且很快被演化為「統計學」(Statistics)。統計學依然保留了城邦(state)這個詞根。

「政治算數」階段

  與「城邦政情」(Politcal arithmetic)階段沒有很明顯的分界點,本質的差別也不大。   「政治算數」的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加註重運用定量分析方法。   1690年英國威廉·配弟出版 (政治算數)一書作為這個階段的起始標誌。   威廉·配弟用數字,重量尺度將社會經濟現象數量化的方法是近代統計學的重要特徵。因此,威廉?配弟的(政治算數)被後來的學者評價為近代統計學的來源,威廉?配弟本人也被評價為近代統計學之父。   配弟在書中使用的數字有三類:   第一類是對社會經濟現象進行統計調查經驗觀察得到的數字.因為受歷史條件的限制,書中通過嚴格的統計調查得到的數據少,根據經驗得出的數字多;   第二類是運用某種數學方法推算出來的數字。其推算方法可分為三種:   (1)以已知數或已知量為基礎,循著某種具體關係進行推算的方法;   (2)通過運用數字的理論性推理來進行推算的方法;

《商務統計學》封面圖

(3)以平均數為基礎進行推算的方法」;   第三類是為了進行理論性推理而採用的例示性的數字.配弟把這種運用數字和符號進行的推理稱之為「代數的演算法」。從配弟使用數據的方法看,「政治算數」階段的統計學已經比較明顯地體現了「收集和分析數據的科學和藝術」特點,統計實證方法和理論分析方法渾然一體,這種方法即使是現代統計學也依然繼承

「統計分析科學」階段

  在「政治算數」階段出現的統計與數學的結合趨勢逐漸發展形成了「統計分析科學」。   十九世紀末,歐洲大學開設的「國情紀要」或「政治算數」等課程名稱逐漸消失,代之而起的是「統計分析科學」課程。當時的「統計分析科學」(Science of statistical analysis)課程的內容仍然是分析研究社會經濟問題。   「統計分析科學」課程的出現是現代統計發展階段的開端. 1908年,「學生」氏(William Sleey Gosset的筆名Student)發表了關於t分佈論文,這是一篇在統計學發展史上劃時代的文章。它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。   現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用於社會科學,自然科學工程技術科學領域,因為他深信統計學是可以用於研究任何科學的一般研究方法.   現代統計學的理論基礎概率論始於研究賭博的機遇問題,大約開始於1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分佈理論和最小平方法則。於是,現代統計方法便有了比較堅實的理論基礎。

主要術語

  統計學(statistics):收集、處理、分析、解釋數據並從數據中得出結論的科學。   描述統計(descriptive statistics):研究數據收集、處理和描述的統計學方法。   推斷統計(inferential statistics):研究如何利用樣本數據來推斷總體特徵的統計學方法。   變數(variable):每次觀察會得到不同結果的某種特徵。   分類變數(categorical variable):觀測結果表現為某種類別的變數。   順序變數(rank variable):又稱有序分類變數,觀測結果表現為某種有序類別的變數。   數值型變數(metric variable):又稱定量變數,觀測結果表現為數字的變數。

統計學的觀念

  為了將統計學應用到科學,工業以及社會問題上,我們由研究母體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產的商品。一個母體甚至可能由許多次同樣的觀察程序所組成;由這種資料收集所組成的母體我們稱它叫時間序列。   為了實際的理由,我們選擇研究母體的子集代替研究母體的每一筆資料,這個子集稱做樣本。以某種經驗設計實驗所搜集的樣本叫做資料。資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。

《統計學導論》封面圖

描述統計學處理有關敘述的問題:資料是否可以被有效的摘要,不論是以數學或是圖片表現,以用來代表母體的性質?基礎的數學描述包括了平均數和標準差。圖像的摘要則包含了許多種的表和圖。   推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關係模型化(回歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列,以及數據挖掘。   相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變數(母體中的兩種性質)傾向於一起變動,好像它們是相連的一樣。舉例來說,對於人收入和死亡年齡的研究期刊可能會發現窮人比起富人平均來說傾向擁有較短的生命。這兩個變數被稱做相關的。但是實際上,我們不能直接推論這兩個變數中有因果關係;參見相關性推論因果關係(邏輯謬誤)。   如果樣本足以代表母體的,那麼由樣本所做的推論和結論可以被引申到整個母體之上。最大的問題在於決定樣本是否足以代表 整個母體。統計學提供了許多方法來估計和修正樣本和蒐集資料過程中的隨機性(誤差),如同上面所提到的透過經驗所設計的實驗。參見實驗設計。   要了解隨機性或是機率必須具備基本的數學觀念。數理統計(通常又叫做統計理論)是應用數學的分支,它使用機率論來分析並且驗證統計的理論基礎。   任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋樑或是核能發電計劃結構的可靠性。   即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變數所導致,但是這個顯著性可能與大眾的直覺相悖。人們需要一些統計的技巧(或懷疑)以面對每天日常生活中透過引用統計數據所獲得的資訊。

統計方法

1)測量的尺度

  統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性 。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(如智力或溫度的測量)。( Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義。

2)統計技術

  以下列出一些有名的統計檢定方法以及可供驗證實驗數據的程序   Fisher最小顯著差異法(Fisher's Least Significant Difference test )   學生t檢驗(Student's t-test)   曼-惠特尼 U 檢定(Mann-Whitney U)   回歸分析(regression analysis)   相關性(correlation)   皮爾森積矩相關係數(Pearson product-moment correlation coefficient)   史匹曼等級相關係數(Spearman's rank correlation coefficient )   卡方分佈(chi-square )

統計學的創立時期

  德國的斯勒茲曾說過:「統計是動態的歷史,歷史是靜態的統計。」可見統計學的產生與發展是和生產的發展、社會的進步緊密相聯的。   統計學的萌芽產生在歐洲。17世紀中葉至18世紀中葉是統計學的創立時期。在這一時期,統計學理論初步形成了一定的學術派別,主要有國勢學派和政治算術學派。

1、國勢學派

  國勢學派又稱記述學派,產生於17世紀的德國。由於該學派主要以文字記述國家的顯著事項,故稱記述學派。其主要代表人物是海爾曼·康令和阿亨華爾。康令第一個在德國黑爾姆斯太特大學以「國勢學」為題講授政治活動家應具備的知識。阿亨華爾在格丁根大學開設「國家學」課程,其主要著作是《近代歐洲各國國勢學綱要》,書中講述「一國或多數國家的顯著事項」,主要用對比分析的方法研究了解國家組織、領土、人口、資源財富和國情國力,比較了各國實力的強弱,為德國的君主政體服務。因在外文中「國勢」與「統計」詞義相通,後來正式命名為「統計學」。該學派在進行國勢比較分析中,偏重事物性質的解釋,而不注重數量對比和數量計算,但卻為統計學的發展奠定了經濟理論基礎。但隨著資本主義市場經濟的發展,對事物量的計算和分析顯得越來越重要,該學派後來發生了分裂,分化為圖表學派和比較學派。

2、政治算術學派

  政治算術學派產生於17世紀中葉的英國,創始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算術》一書。這裡的「政治」是指政治經濟學,「算術」是指統計方法。在這部書中,他利用實際資料,運用數字、重量和尺度等統計方法對英國、法國和荷蘭三國的國情國力,作了系統的數量對比分析,從而為統計學的形成和發展奠定了方法論基礎。因此馬克思說:「威廉·佩第——政治經濟學之父,在某種程度上也是統計學的創始人。」   政治算術學派的另一個代表人物是約翰·格朗特(1620-1674)。他以1604年倫敦教會每周一次發表的「死亡公報」為研究資料,在 1662年發表了《關於死亡公報的自然和政治觀察》的論著。書中分析了60年來倫敦居民死亡的原因及人口變動的關係,首次提出通過大量觀察,可以發現新生兒性別比例具有穩定性和不同死因的比例等人口規律;並且第一次編製了「生命表」,對死亡率與人口壽命作了分析,從而引起了普遍的關注。他的研究清楚地表明了統計學作為國家管理工具的重要作用。

統計學的發展時期

  18世紀末至19世紀末是統計學的發展時期。在這時期,各種學派的學術觀點已經形成,並且形成了兩個主要學派,即數理統計學派和社會統計學派。

1、數理統計學派

  在18世紀,由於概率理論日益成熟,為統計學的發展奠定了基礎。19世紀中葉,把概率論引進統計學而形成數理學派。其奠基人是比利時的阿道夫·凱特勒(1796-1874),其主要著作有:《論人類》、《概率論書簡》、《社會制度》和《社會物理學》等。他主張用研究自然科學的方法研究社會現象,正式把古典概率論引進統計學,使統計學XX一個新的發展階段。由於歷史的局限性,凱特勒在研究過程中混淆了自然現象和本質區別,對犯罪、道德等社會問題,用研究自然現象的觀點和方法作出一些機械的、庸俗化的解釋。但是,他把概率論引入統計學,使統計學在「政治算術」所建立的「算術」方法的基礎上,在準確化道路上大大跨進了一步,為數理統計學的形成與發展奠定了基礎。

2、社會統計學派

  社會統計學派產生於19世紀後半葉,創始人是德國經濟學家、統計學家克尼斯(1821-1889),主要代表人物主要有恩格爾(1821- 1896)、梅爾(1841-1925)等人。他們融合了國勢學派與政治算術學派的觀點,沿著凱特勒的「基本統計理論」向前發展,但在學科性質上認為統計學是一門社會科學,是研究社會現象變動原因和規律性的實質性科學,以此同數理統計學派通用方法相對立。社會統計學派在研究對象上認為統計學是研究體而不是個別現象,而且認為由於社會現象的複雜性和整體性,必須地總體進行大量觀察和分析,研究其內在聯繫才能揭示現象內在規律。這是社會統計學派的「實質性科學」的顯著特點。   社會經濟的發展,要求統計學提供更多的統計方法;社會科學本身也不斷地向細分化和定量化發展,也要求統計學能提供更有效的調查整理、分析資料的方法。因此,社會統計學派也日益重視方法論的研究,出現了從實質性方法論轉化的趨勢。但是,社會統計學派仍然強調在統計研究中必須以事物的質為前提和認識事物質的重要性,這同數理統計學派的計量不計質的方法論性質是有本質區別的。

迅速發展的統計學

  20世紀初以來,科學技術迅猛發展,社會發生了巨大變化,統計學XX了快速發展時期。歸納起來有以下幾個方面。   1、由記述統計向推斷統計發展。記述統計是對所搜集的大量數據資料進行加工整理、綜合概括,通過圖示、列表和數字,如編製次數分佈表、繪製直方圖、計算各種特徵數等,對資料進行分析和描述。而推斷統計,則是在搜集、整理觀測的樣本數據基礎上,對有關總體作出推斷。其特點是根據帶隨機性的觀測樣本數據以及問題的條件和假定(模型),而對未知事物作出的,以概率形式表述的推斷。目前,西方國家所指的科學統計方法,主要就是指推斷統計來說的。   2、由社會、經濟統計向多分支學科發展。在20世紀以前,統計學的領域主要是人口統計、生命統計、社會統計和經濟統計。隨著社會、經濟和科學技術的發展,到今天,統計的範疇已覆蓋了社會生活的一切領域,幾乎無所不包,成為通用的方法論科學。它被廣泛用於研究社會和自然界的各個方面,並發展成為有著許多分支學科的科學。   3、統計預測和決策科學的發展。傳統的統計是對已經發生和正在發生的事物進行統計,提供統計資料和數據。20世紀30年代以來,特別是第二次世界大戰以來,由於經濟、社會、軍事等方面的客觀需要,統計預測和統計決策科學有了很大發展,使統計走出了傳統的領域而被賦予新的意義和使命。   4、資訊理論、控制論、系統論與統計學的相互滲透和結合,使統計科學進一步得到發展和日趨完善。資訊理論、控制論、系統論在許多基本概念、基本思想、基本方法等方面有著共同之處,三者從不同角度、側面提出了解決共同問題的方法和原則。三論的創立和發展,徹底改變了世界的科學圖景和科學家思維方式,也使統計科學和統計工作從中吸取了營養,拓寬了視野,豐富了內容,出現了新的發展趨勢。   5、計算技術和一系列新技術、新方法在統計領域不斷得到開發和應用。近幾十年間,電腦技術不斷發展,使統計數據的搜集、處理、分析、存貯、傳遞、印製等過程日益現代化,提高了統計工作的效能。電腦技術的發展,日益擴大了傳統的和先進的統計技術的應用領域,促使統計科學和統計工作發生了革命性的變化。如今,電腦科學已經成為統計科學不可分割組成部分。隨著科學技術的發展,統計理論和實踐深度和廣度方面也不斷發展。   6.統計在現代化管理和社會生活中的地位日益重要。隨著社會、經濟和科學技術的發展,統計在現代化國家管理和企業管理中的地位,在社會生活中的地位,越來越重要了。人們的日常生活和一切社會生活都離不開統計。英國統計學家哈斯利特說:「統計方法的應用是這樣普遍,在我們的生活和習慣中,統計的影響是這樣巨大,以致統計的重要性無論怎樣強調也不過分。」甚至有的科學有還把我們的時代叫做「統計時代」。顯然,20世紀統計科學的發展及其未來,已經被賦予了劃時代的意義。

社會統計學與數理統計學的統一

  據權威統計學史記載,從17世紀開始就有了「政 治 算 術」.「國勢學」,既初級的社會統計學,起源於英國.德國。幾乎同時在義大利出現了「賭博數學」,既初級的概率論。直到19世紀,由於概率論出現了大數法則和誤差理論,才形成了初級的數理統計學。也就是說 :社會統計學的形成早於數理統計學兩個世紀。由於社會統計學廣泛 地用於經濟和政治,所以得到了各國曆屆政府的極大重視,並得到系統的發展。而 數理統計學在20世紀40年代以後,由於概率論的發展,而得到飛速發展。經過近400年的變遷 ,目前世界上已形成社會統計學與數理統計學兩大體系。兩體系爭論不休,難分伯仲。筆者經過30年的學習與研究,發現了社會統計學與數理統計學的聯繫和區別。它們的關係與著名的牛頓力學與相對論的關係非常相似。相對論力學在接近光速時使用,而大多數情況是遠離光速的,此時使用牛頓力學既準確又方便。如果硬套相對論力學,則是殺雞用宰牛刀,費力不討好。社會統計學在描寫變數時使用;數理統計學在描寫隨機變數時使用。   我們知道變數與隨機變數是既有聯繫又有區別的,當變數取值的概率不是1時,變數就變成了隨機變數;當隨機變數取值 的概率為1 時,隨機變數就變成了變數。   變數與隨機變數的聯繫與區別搞清楚了,社會統計學與數理統計學的關係就搞清楚了。以後,在描述變數時,大膽地使用社會統計學;在描述隨機變數時,就用數理統計學。如果在描述變數時非用數理統計學,那就是殺雞用了宰牛刀。近70年,由於數理統計學的飛速發展,大有「吃掉」社會統計學的勢頭,尤其是以美國為代表的發達國家,幾乎認為統計學就是數理統計學。實際上,這是一個極大的誤區。筆者的研究已經說明了數理統計學永遠「吃不掉」社會統計學,今後的日子,將是社會統計學與數理統計學共存與互補。社會統計學與數理統計學的爭論可以結束了。    結束語 「社會統計學與數理統計學的統一」對近四百年歷史的統計學進行了科學的疏理,規範了整個統計學的發展,結束了一百年來社會統計學與數理統計學之間的爭論。由於經濟是通過統計學進行計量和分析的,所以社會統計學與數理統計學的統一,必將從整體上提高經濟學的分析水平。 作者簡介:王見定.國際統計學會會員.國際著名數學家。見百度百科數學家欄目。   「社會統計學與數理統計學的統一理論的重大意義   王見定教授指出:社會統計學描述的是變數,數理統計學描述的是隨機變數,而變數和隨機變數是兩個既有區別又有聯繫,且在一定條件下可以相互轉化的數學概念。王見定教授的這一論述在數學上就是一個巨大的發現。   我們知道「變數」的概念是17世紀由著名數學家笛卡爾首先提出,而「隨機變數」的概念是20世紀30年代以後由蘇聯學者首先提出,兩個概念的提出相差3個世紀。截至到王見定教授,世界上還沒有第二個人提出變數和隨機變數兩者的聯繫、區別以及相互的轉化。我們知道變數的提出造就了一系列的函數論、方程論、微積分等重大數學學科的產生和發展;而隨機變數的提出則奠定了概率論和數理統計等學科的理論基礎和促進了它們的蓬勃發展。可見變數、隨機變數概念的提出其價值何等重大,從而把王見定教授在世界上首次提出變數、隨機變數的聯繫、區別以及相應的轉化的意義稱為巨大、也就不視為過。   下面我們回到「社會統計學和數理統計學的統一」理論上來。王見定教授指出社會統計學描述的是變數,數理統計學描述的是隨機變數,這樣王見定教授準確地界定了社會統計學與數理統計學各自研究的範圍,以及在一定條件下可以相互轉化的關係,這是對統計學的最大貢獻。它結束了近400年來幾十種甚至上百種以上五花八門種類的統計學的混戰局面,使它們回到正確的軌道上來。   由於變數不斷地出現且永遠地繼續下去,所以社會統計學不僅不會消亡,而且會不斷發展狀大。當然數理統計學也會由於隨機變數的不斷出現同樣發展狀大。但是,對隨機變數的研究一般來說比對變數的研究複雜的多,而且直到今天數理統計的研究尚處在較低的水平,且使用起來比較複雜;再從長遠的研究來看,對隨機變數的研究最終會逐步轉化為對變數的研究,這與我們通常研究複雜問題研究轉化為若干簡單問題的研究的道理是一樣的。既然社會統計學描述的是變數,而變數描述的範圍是極其寬廣的,絕非某些數理統計學者所雲:社會統計學只作簡單的加、減、乘、除。從理論上講,社會統計學應該覆蓋除了數理統計學之外的絕大多數學學科的運作。所以王見定教授提出的「社會統計學與數理統計學統一」理論,從根本上糾正了統計學界長期存在的低估社會統計學的錯誤學說,並從理論上和應用上論證了社會統計學的廣闊前景。

英文版《社會統計學與數理統計學的統一》一書于2010年6月由中國經濟出版社出版,並陸續向國外發行。 該書對有近四百年歷史的統計學進行了科學的梳理,規範了整個統計學的發展,結束了一百多年來社會統計學與數理統計學之間的爭論。由於經濟是通過統計學進行計量和分析的,所以社會統計學與數理統計學的統一,必將從整體上提高經濟學的分析水平。 注:該書著者王見定教授是國際統計學會會員,國際著名數學家。 The book "The Unity of Social Statistics and Mathematical Statistics" was published by China Economic Publishing House in June 2010 and the book will be put on sale throughout the world.   編號:342705 出版社:中國經濟出版社 市場價:80 ISBN:978750179692   學科分支 一些學科大量地利用了應用統計學,以至它們自己已經各自獨立成為一門學科。

分支學科

  統計學史   理論統計學

《統計學——科學與工程應用》封面圖

統計調查分析理論   統計核算理論   統計監督理論   統計預測理論   統計邏輯學   統計法學   描述統計學   推斷統計學   經濟統計學   宏觀經濟統計學   微觀經濟統計學   管理統計學   科學技術統計學    農村經濟調查   社會統計學   教育統計學    文化與體育統計學   衛生統計學    司法統計學    社會福利與社會保障統計學   生活質量統計學    人口統計學   環境與生態統計學   自然資源統計學   環境統計學    生態平衡統計學   國際統計學    國際標準分類統計學   國際核算體系與方法論體系   國際比較統計學

其他學科

  生物統計學   商務統計學   工程統計學   心理統計學   化學統計學   檔案統計學   社會經濟統計學   水文統計學   統計考古學   數理統計學   統計語言學   統計物理學   化學統計學

延伸學科

  有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科包括:   農業科學   生物統計   商用統計   資料採礦(應用統計學以及圖形從資料中獲取知識)   經濟統計學   電機統計   統計物理學   人口統計   心理統計學   教育統計學   社會統計(包括所有的社會科學﹚   文獻統計分析   化學與程序分析(所有有關化學的資料分析與化工科學)   運動統計學,特別是棒球以及曲棍球   統計對於商業以及工業是一個基本的關鍵。他被用來了解與測量系統變異性,程序控制,對資料作出結論,並且完成資料取向的決策。在這些領域統計扮演了一個重要的角色。

統計學在檢驗過程中的應用

  統計學的中心問題就是如何根據樣本去探求有關總體的真實情況。因此,如何從一個總體中抽取一些元素組成樣本,什麼樣的樣本最能代表總體,這直接影響著統計的準確性。如果抽取元素的方法是使總體中的元素成分不改,所觀測到的數值是互相獨立的隨機變數,並有著和總體一樣的分佈,這樣的樣本是一個簡單的隨機樣本,它是總體的最好代表,而取得簡單隨機樣本的過程叫做簡單隨機取樣。   簡單隨機取樣就是重複進行同一隨機試驗,也就是指每次試驗都在同一組條件下進行,因而每次試驗得到什麼結果,其可能程度都是固定不變的。對於有限總體,簡單隨機抽樣意味著每次抽出一個元素后,放還再抽,若不放還,總體的成分將有所改變,那麼再抽時,出現各種結果的可能程度就相對地改變了。至於無限總體則沒有區分「放回」或「不放回」的必要。   [1]除以上述原則外,另一方面,獲得樣本的具體方法能否保證觀察值是獨立的,這是問題的關鍵,因此,一樣本的隨機與否還取決於獲得樣本的具體方法。   在具體進行取樣時,必鬚根據研究目的的不同,選擇不同的取樣方法。   ①單純隨機取樣法先把每個個體編號,然後用抽籤的方式從總體中抽取樣本。這種方法適用於個體間差異較小、所需抽選的個體數較少或個體的分佈比較集中的研究對象。   ②分區隨機取樣法將總體隨機地分成若幹部分,然後再從每一部分隨機抽選若幹個體組成樣本。這種抽樣法可以更有組織地進行,而且中選的個體在總體的分佈比單純隨機取樣更均勻。   ③系統取樣法先有系統地將總體分成若干組,然後隨機地從第一組決定一個起點,如每組15個元素,決定從第一組的第13個元素選起,那麼以後選定的單位即28,43,58,73等等。   ④分層取樣法根據對總體特性的了解,把總體分成若干層次或類型組,然後從各個層次中按一定比例隨機抽選。這種方法的代表性好,但若層次劃分得不正確,也不能獲得有高度代表性的樣本。

推薦閱讀