㈠ 衛生統計學的資料主要來源於哪些方面主要分哪幾個類型
2
准確性審查(邏輯審查與技術審查)和完整性審查;再擬定整理表,按照「同質
者合並,
非同質者分開」的原則對資料進行質量分組,
並在同質基礎上根據數值
大小進行數量分組;最後匯總歸納。
4
)、分析資料:其目的是計算有關指標,反映數據的綜合特徵,闡明事物的內
在聯系和規律。
統計分析包括統計描述和統計推斷。
前者是用統計指標與統計圖
(表)
等方法對樣本資料的數量特徵及其分布規律進行描述;
後者是指如何抽樣,
以及如何用樣本信息推斷總體特徵。
進行資料分析時,
需根據研究目的、
設計類
型和資料類型選擇恰當的描述性指標和統計推斷方法。
統計工作的四個步驟緊密相連、
不可分割,
任何一步的缺陷,
都將影響整個研究
結果。
3
、基本概念:
1
)、同質與變異。嚴格地講,同質是指被研究指標的影響因素完全相同。但在
醫學研究中,有些影響因素往往是難以控制的(如遺傳、營養等),甚至是未知
的。
所以,
在統計學中常把同質理解為對研究指標影響較大的、
可以控制的主要
因素盡可能相同。例如研究兒童的身高時,要求性別、年齡、民族、地區等影響
身高較大的、
易控制的因素要相同,
而不易控制的遺傳、
營養等影響因素可以忽
略。
同質基礎上的個體差異稱為
變異
。如同性別、同年齡、同民族、同地區的健康兒
童的身高、體重不盡相同。事實上,客觀世界充滿了變異,生物醫學領域更是如
此。
哪裡有變異,
哪裡就需要統計學。
若所研究的同質群體中所有個體一模一樣,
只需觀察任一個體即可,無須進行統計研究。
2
)、總體與樣本
任何統計研究都必須首先確定
觀察單位
,
亦稱個體。
觀察單位
是統計研究中最基
本的單位,可以是一個人、一個家庭、一個地區、一個樣品、一個采樣點等。
總體
是根據研究目的確定的同質觀察單位的全體,
或者說,
是同質的所有觀察單
位某種觀察值(變數值)的集合。例如欲研究山東省
2002
年
7
歲健康男孩的身
高,那麼,觀察對象是山東省
2002
年的
7
歲健康男孩,觀察單位是每個
7
歲健
康男孩,變數是身高,變數值(觀察值)是身高測量值,則山東省
2002
年全體
7
歲健康男孩的身高值構成一個總體。
它的同質基礎是同地區、
同年份、
同性別、
同為健康兒童。
總體又分為
有限總體
和
無限總體
。
有限總體是指在某特定的時間
與空間范圍內,
同質研究對象的所有觀察單位的某變數值的個數為有限個,
如上
例;無限總體是抽象的,無時間和空間的限制,觀察單位數是無限的,如研究碘
鹽對缺碘性甲狀腺病的防治效果,
該總體的同質基礎是缺碘性甲狀腺病患者,
同
用碘鹽防治;
該總體應包括已使用和設想使用碘鹽防治的所有缺碘性甲狀腺病患
者的防治效果,
沒有時間和空間范圍的限制,
因而觀察單位數無限,
該總體為無
限總體。
3
在實際工作中,
所要研究的總體無論是有限的還是無限的,
通常都是採用抽樣研
究。
樣本
是按照隨機化原則,
從總體中抽取的有代表性的部分觀察單位的變數值
的集合。如從上例的有限總體(山東省
2002
年
7
歲健康男孩)中,按照隨機化
原則抽取
100
名
7
歲健康男孩,
他們的身高值即為樣本。
從總體中抽取樣本的過
程為抽樣,抽樣方法有多種。抽樣研究的目的是用樣本信息推斷總體特徵。
統計學好比是總體與樣本間的橋梁,
能幫助人們設計與實施如何從總體中科學地
抽取樣本,
使樣本中的觀察單位數
(亦稱樣本含量)
恰當,
信息豐富,
代表性好;
能幫助人們挖掘樣本中的信息,推斷總體的規律性。
3
)、資料與變數及其分類
總體確定之後,
研究者應對每個觀察單位的某項特徵進行測量或觀察,
特徵稱為
變數。如「身高」、「體重」、「性別」、「血型」、「療效」等。變數的測定
值或觀察值稱為變數值或觀察值,亦稱為資料。
按變數的值是定量的還是定性的,
可將變數分為以下類型,
變數的類型不同,
其
分布規律亦不同,
對它們採用的統計分析方法也不同。
在處理資料之前,
首先要
分清變數類型。
1
)數值變數:其變數值是定量的,表現為數值大小,可經測量取得數值,多有
度量衡單位。如身高(
cm
)、體重(
kg
)、血壓(
mmHg kPa
)、脈搏(次
/min
)
和白細胞計數(×10 9 /L)等。這種由數值變數的測量值構成的資料稱為數值
變數資料,亦稱為定量資料。大多數的數值變數為連續型變數,如身高、體重、
血壓等;而有的數值變數的測定值只能是正整數,如脈搏、白細胞計數等,在醫
學統計學中把它們也視為連續型變數。
2
)分類變數:其變數值是定性的,表現為互不相容的類別或屬性。分類變數可
分為無序變數和有序變數兩類:
(
1
)無序分類變數是指所分類別或屬性之間無程度和順序的差別。它又可分為
①二項分類,如性別(男、女),葯物反應(陰性和陽性)等;②多項分類,如
血型(
O
、
A
、
B
、
AB
),職業(工、農、商、學、兵)等。對於無序分類變數的
分析,應先按類別分組,清點各組的觀察單位數,編制分類變數的頻數表,所得
資料為無序分類資料,亦稱計數資料。
(
2
)有序分類變數各類別之間有程度的差別。如尿糖化驗結果按-、±、+、
++、+++分類;療效按治癒、顯效、好轉、無效分類。對於有序分類變數,
應先按等級順序分組,清點各組的觀察單位個數,編制有序變數(各等級)的頻
數表,所得資料稱為等級資料。
變數類型不是一成不變的,根據研究目的的需要,各類變數之間可以進行轉化。
例如血紅蛋白量(
g/L
)原屬數值變數,若按血紅蛋白正常與偏低分為兩類時,
可按二項分類資料分析;若按重度貧血、中度貧血、輕度貧血、正常、血紅蛋白
4
增高分為五個等級時,
可按等級資料分析。
有時亦可將分類資料數量化,
如可將
病人的惡心反應以
0
、
1
、
2
、
3
表示,則可按數值變數資料(定量資料)分析。
4
、隨機事件與概率
醫學研究的現象,
大多數是隨機現象,
對隨機現象進行實驗或觀察稱為隨機試驗。
隨機試驗的各種可能結果的集合稱為隨機事件,
亦稱偶然事件,
簡稱事件。
例如
用相同治療方案治療一批某病的患者,治療轉歸可能為治癒、好轉、無效、死亡
四種結果,
對於一個剛入院的患者,
治療後究竟發生哪一種結果是不確定的,
可
能發生的每一種結果都是一個隨機事件。
對於隨機事件來說,在一次隨機試驗中,某個隨機事件可能發生也可能不發生,
但在一定數量的重復試驗後,
該隨機事件的發生情況是有規律可循的。
概率
是描
述隨機事件發生的可能性大小的數值,
常用
P
表示。
例如,
投擲一枚均勻的硬幣,
隨機事件
A
表示「正面向上」,
用
n
表示投擲次數;
m
表示隨機事件
A
發生的次
數;
f
表示隨機事件
A
發生的頻率(
f=m/n
),0≤m≤n, 0≤f≤1。
用不同的投擲次數
n
作隨機試驗,結果如下:m/n=8/10=0.8,
7/20=0.35,„„
,
249/500=0.498, 501/1000=0.501, 10001/2000=0.5000
,由此看出當投擲次數
n
足夠大時,f=m/n→0.5,稱
P
(A)=0.5
,或簡寫為:
P
=0.5
。當
n
足夠大時,可以
用
f
估計
P
。
隨機事件概率的大小在
0
與
1
之間,即
0<
P
<1
,常用小數或百分數表示。
P
越接
近
1
,
表示某事件發生的可能性越大;
P
越接近
0
,
表示某事件發生的可能性越
小。
P
=
1
表示事件必然發生,
P
=
0
表示事件不可能發生,它們是確定性的,不
是隨機事件,但可以把它們看成隨機事件的特例。
若隨機事件
A
的概率
P
(A)≤
a
,習慣上,當
a
=0.05
時,就稱
A
為小概率事件。
其統計學意義是小概率事件在一次隨機試驗中不可能發生。
例如,
某都市大街上
疾駛的汽車撞傷行人的事件的發生概率為
1/
萬,但大街上仍有行人,這是因為
「被撞」事件是小概率事件,
所以行人認為自己上街這「一次試驗」中不會發生
「被撞」事件。
「小概率」的標准
a
是人為規定的,
對於可能引起嚴重後果的事
件,如術中大出血等,可規定
a
=0.01
,甚至更小。
誤差
是指測定結果與真實結果之間的差值
。
對任何一個物理量進行的測量都不可能得出一個絕對
准確的數值,即用測量技術所能達到的最完善的方法,測出的數值也和真實值存在差異,這種測
量值和真實值的差異稱為誤差。
誤差的分類
誤差分為
絕對誤差
和
相對誤差
。
也可以根據誤差的來源分為
系統誤差
(又稱偏性)
和
隨機誤差
(又
稱機會誤差)。
5
1
、
絕對誤差是測量值對真值偏離的絕對大小,因此它的單位與測量值的單位相同。
2
、
相對誤差則是絕對誤差與真值的比值,因此它是一個百分數。一般來說,相對誤差更能
反映測量的可信程度
。
相對誤差
等於測量值減去真值的差的絕對值除以真值
,
再乘以百分之一百
。
3
、
系統誤差是由一些固有的因素(如測量方法的缺陷)產生的,理論上總是可以通過一定
的手段來消除。如天平的兩臂應是等長的,可實際上是不可能完全相等的;天平配置的相同質量
的砝碼應是一樣的,可實際上它們不可能達到一樣。
4
、
隨機誤差是由於在測定過程中一系列有關因素微小的隨機波動而形成的具有相互抵償性
的誤差(也稱為偶然誤差和不定誤差)。
請採納
如果你認可我的回答,敬請及時採納,
~如果你認可我的回答,請及時點擊【採納為滿意回答】按鈕
~~手機提問的朋友在客戶端右上角評價點【滿意】即可。
~你的採納是我前進的動力
~~O(∩_∩)O,記得好評和採納,互相幫助
㈡ 統計研究的基本方法有哪幾種
抽樣平均誤差是測定抽樣誤差的基本指標。它是隨機抽樣可變總體平均數(抽樣平均數的所有可能值)與全及平均數之間離差...這個指標反映抽樣平均數的所有可能值對全及平均數的平均離散程度,即反映誤差平均值的大小
分布數列是統計整理的一種重要形式,是統計描述和統計分析的一種重要方法,它可以說明總體的分布特徵、內部結構,並可據以研究總體某一標志值的平均水平及其變動的規律性。
1、統計學:是運用數理統計的基本原理和方法研究預防醫學和衛生事業管理中資料的收集,整理和分析的一門應用科學。具體地講,是按照設計方案去收集、整理、分析數據,並對數據結果進行解釋,從而做出比較正確的結論。
2、總體:是根據研究目的確定同質的所有觀察單位某種變數的集合。
3、變異:同一性質的事物,其觀察值(變數值)之間的差異。
4、抽樣研究:從所研究的總體中隨機抽取一部分有代表性的樣本進行研究,用樣本指標推論總體,最終達到了解總體的目的。這種用樣本指標推論總體參數的方法稱為抽樣研究。
5、統計描述:用統計圖表或計算統計指標的方法表達一個特定群體的某種現象或特徵。
6、統計推斷:根據樣本資料的特性對總體的特性作估計或推論的方法稱統計推斷,常用方法是參數估計和假設檢驗。
7、概率:是指某事件出現可能性大小的度量,以符號P表示。
8、醫學參考值范圍:參考值范圍又稱正常值范圍。醫學上常把包括絕大多數人某項指標的數值范圍稱為該指標的參考值范圍。
9、正態分布規律:實際工作中,經常需要了解正態曲線下橫軸上的一定區域的面積占總面積的百分數,用以估計該區間的觀察例數占總例數的百分數,或變數值落在該區間的頻數或概率。
10、可比性:是指對研究結果有影響的非處理因素在各處理組之間盡可能相
同或相近。
11、動態數列:是一系列按時間順序排列起來的統計指標,包括絕對數、相對數或平均數,用以說明事物在時間上的變化和發展趨勢。
12、抽樣誤差:在同一總體中隨機抽取樣本含量相同的若干樣本時,樣本指標之間的差異以及樣本指標與總體指標的差異。
13、標准誤:表示樣本均數間變異程度。
14、率的抽樣誤差:抽樣過程中產生的同一總體中均數之間的差異稱為均數的抽樣誤差,率之間的差異稱為率的抽樣誤差。
15、參數估計:是指用樣本指標(稱為統計量)估計總體指標(稱為參數)。
16、可信區間:總體參數的所在范圍通常稱為參數的可信區間或置信區間,即該區間以一定的概率(如95%或99%)包含總體參數。
17、I型錯誤:拒絕了實際撒謊能夠成立的H0,這類「棄真」的錯誤稱為I型錯誤。
18、II型錯誤:接受了實際撒謊能夠不成立的H0,這類「存偽」的錯誤稱為II型錯誤。
19、檢驗效能:1-b稱為檢驗效能又稱為把握度。它的含義是:當兩總體確實有差別時,按規定的檢驗水準a,能夠發現兩總體間差別的能力。
20、四格表資料:兩個樣本率的資料又稱為四格表資料,在四格表資料中兩個樣本的實際發生頻數和實際未發生頻數為基本數據,其他數據均可由這四個基本數據推算出來。
21、列聯表資料:對同一樣本資料按其兩個無序分類變數(行變數和列變數)歸納成雙向交叉排列的統計表,其行變數可分為R類,列變數可分為C類,這種表稱為R*C列聯表。
22、參數檢驗:是一種要求樣本來自總體分布型是已知的(如正態分布),在這種假設的基礎上,對總體參數(如總體均數)進行統計推斷的假設檢驗。
23、非參數檢驗:是一種不依賴總體分布類型,也不對總體參數(如總體均數)進行統計推斷的假設檢驗。
24、秩次:即通常意義上的序號,實際上就是將觀察值按順序由小到大排列,並用序號代替了變數值本身。
25、直線相關系數:它是說明具有直線關系的兩個變數間,相關關系的密切程度與相關方向的統計指標。相關系數沒有單位,取值范圍是-1〈=r〈=1,r的絕對值越大表明兩變數的關系越密切。
26、完全負相關:這是一種極為特殊的負相關關系,從散點圖上可以看出,由x與y構成的散點完全分布在一條直線上,x增加,y相應減少,算得的相關系數r=-1。
27、正相關:它是說明具有直線關系的兩個變數間,存在有正的相關方向,即當x增加時,y有相應增大的趨勢,所算得的相關系數r為正值。
28、等級相關:是對等級數據作相關分析,它又稱為秩相關,是一種非參數統計方法。
29、評價:是通過對某些標准來判斷觀測結果,並賦予這種結果以一定的意義和價值的過程。
30、綜合評價:是指人們根據不同的評價目的,選擇相應的評價形式,據此選擇多個因素或指標,並通過一定的數學模型,將多個評價因素或指標轉化為能反映評價對象總體特徵的信息。
31、優序法:為了比較某幾個事物或方案的優劣,在選定各項評價指標後,將待評價的對象或方案就各項評價指標的測量值大小分別排列,並分別對各序號(等級)以相應的評分值即優序數,然後綜合諸評價指標,分別計算評價對象的總賦優序數,並按總賦優序大小評定其優順序的方法即優序法。
32、Topsis:Topsis法常用於系統工程中有限方案多目標決策分析,此外,也可用於效益評價、衛生決策和衛生事業管理等多領域。
33、根本死因:WHO規定,根本死因是指:「(a)引起直接導致死亡的一系列病態事件的那些疾病或損傷,或者(b)造成致命損傷的事故或暴力的情況。」
34、衛生服務需要:是指人們因疾病影響健康,引起人體正常活動的障礙,實際應當接受各種衛生服務的需要(如預防保健、治療、康復)。
35、衛生服務調查統計:是衛生統計的主要內容之一,衛生服務調查統計是從衛生服務資料的設計、收集、整理、分析的角度,來闡述衛生服務研究的特點、研究方法和注意事項,以便使衛生服務研究服務更具有科學性。
36、衛生服務調查:是指對衛生服務狀況、人群健康的危險因素、人群衛生服務的需求和利用、衛生服務資源的分配和利用所進行的一種社會調查。
37、統計表:是以表格的形式列出統計指標,它是對資料進行統計描述時的一種常用手段。
38、統計圖:是以各種幾何圖形(如點、線、面或立體)顯示數據的大小、升降、分布以及關系等,它也是對資料進行統計描述時的一種常用手段。
39、均數的抽樣誤差:統計學上,對於抽樣過程中產生的同一總體中均數之間的差異稱為均數的抽樣誤差。
㈢ 怎麼表示變異性,(衛生統計學)
變異系數(CV)=標准差/均值
用來衡量觀測值變異性
㈣ 醫學統計方法有哪些
1. 多組率的比較用卡方檢驗(χ2檢驗,chi-square test)
直接用幾個率的數值比較,與直接用原始數據錄入比較,結果會有什麼不同?卡方值會受樣本量的影響,樣本越多,卡方值越大。
2.多組計量資料比較採用方差分析(F檢驗) ,不能用t檢驗。當方差分析結果為P<0.05時,只能說明k組總體均數之間不完全相同。若想進一步了解哪兩組的差別有統計學意義,需進行多個均數間的多重比較,即SNK-q檢驗 (多個均數兩兩之間的全面比較 )、LSD-t檢驗 (適用於一對或幾對在專業上有特殊意義的均數間差別的比較)和Dunnett檢驗 (適用於k-1個實驗組與一個對比組均數差別的多重比較 )。
3.非正態分布多組數據之間比較選用非參數檢驗、單樣本中位數檢驗(符號檢驗和 Wilcoxon 檢驗)、雙樣本中位數檢驗(Mann-Whitney 檢驗)、方差分析(Kruskal-Wallis、Mood 中位數和 Friedman 檢驗)
4.按血糖水平從低到高分成多組,進行多組之間死亡率的比較,由於死亡率同樣受年齡、性別、病史、血脂等因素的影響,所以需選取合適統計方法實現「調整年齡、性別等危險因素後,按血糖分組進行死亡率的比較(由血糖從低到高分成的4組)」。
①年齡是定量變數(是數值),調整年齡的方法可在Logistic回歸中運用,連續性變數年齡加入covariate中,當成協變數,就可以調整年齡,age-adjusted odds ratio就能得到了。
②性別性別是二分類變數,不是定量變數,不可在LOGISTIC回歸里比較。調整性別可在卡方檢驗中採取分層的方法比較。
如果為多分類LOGISTIC回歸,在選擇用multinomianl LOGISTIC回歸中,可選入年齡等進入covariate,觀察年齡的配比情況。可把性別選入factors(自變數)。這樣可以實現調整年齡、性別等危險因素。
5.回顧性研究(1)臨床妊娠率和女性年齡的關系+(2)男性影響臨床妊 娠的精子參數比較:
數據類型及變數的說明:y:計量
擬採用的分析方法:卡方檢驗
擬採用的分析軟體:spss
原始數據附件及格式:word表
能否用其他方法統計分析:可用卡方分割,調整檢驗水準(根據比較的次數N,校正後的檢驗水準為0.05/N)。
6.重復t檢驗:多個樣本均數間的兩兩比較(又稱多重比較)不宜用t檢驗,因為重復數次,t檢驗將增加第一類錯誤的概率,使檢驗效率降低。此時宜用方差分析,並在此基礎上用兩兩比較方法(如.SNK、LSD、Duncan法等)。
對於同一對均數間的差異,用t檢驗無顯著性,而兩兩比較可能有顯著性,可見錯誤選用統計方法將推出錯誤結論。
㈤ 《衛生統計學》好難啊,有什麼好的學習、復習方法嗎
借鑒一下別人的學習方法:
《衛生統計學》是提高預防專業學生觀察問題、解決問題,提高學生科研素質的一門專業課,它是21世紀公衛醫生在從事預防工作和科學研究過程中必須掌握和了解的基本知識。《衛生統計學》是《生物統計》的一門分支學科,《生物統計》屬於《數理統計》的范疇。《數理統計》是研究自然和社會領域隨機現象數量規律的一門應用數學,它包括研究數理統計原理、方法的純粹「數理統計」和數理統計的方法在不同專業領域的應用而形成的數十門「專業統計」,《生物統計》應屬於後者。在《衛生統計學》的學習過程中,應注意如下問題:
1、正確、全面的理解統計學的一些基本概念和基本思想:如前所述,《衛生統計》應屬「專業統計」,由於「專業統計」主要強調統計方法的實際應用,對方法的原理一般不做過多介紹,所以學生在本課程的學習過程中會對一些公式、方法、概念難以理解,會有許許多多的「為什麼」,因而感到課程難學難懂,對課程難以全面把握。針對這一問題,從應用的角度從發,學生應重點理解基本的統計學概念、原理、基本思想,對公式的來源可不做過多的深究。上課認真聽講,課後加強與老師、同學的交流,對正確理解概念、基本思想將起到事半功倍的作用。
2、淡化繁瑣、復雜的計算:隨著信息技術的飛速發展,計算機隨處可見,各種數據處理軟體和統計軟體唾手可得,這就使得我們能從繁瑣復雜的統計計算中解脫出來。但其負面作用是計算機和統計軟體的盲目使用,不管是什麼研究類型的數據都簡單地交給計算機處理,用計算機取代統計,造成大量統計方法的濫用和誤用。醫學研究的許多數據關繫到人群的健康,統計方法的誤用會導致嚴重的倫理問題。這就提示我們要注重「統計方法」的選擇、重視「數據質量」的保證和統計結果的「表達」。
3、結合實踐、勤於練習:由於《衛生統計學》前後章節內容聯系非常密切,前一章節學習的好壞對後續章節的學習將產生較大影響,這就要求學生對每一章節的內容都能較好的掌握。實現這點的較好方法是及時的對每一章節的例題、練習親自完成一遍,特別是分析思考題。由於課本的練習題並非完全意義的實際問題(已經整理處理),所以要想把所學統計方法解決實際科研問題,還必須有施展這些方法的舞台,由於條件限制,在校學生不可能從事完整的一項科研工作,但學生課余時間可通過網路或圖書館閱讀醫學雜志上的科研論文,了解別人的統計設計思路和統計分析方法,經常參加碩士研究生的開題報告和論文答辨。相信通過這一系列的學習,你對基本的統計方法的運用必將是得心應手、游刃有餘。
統計過程是一項使信息變成知識、知識有利於科學進步的過程。在這一過程在你將領會到統計學的精髓和奧秘,同時你也將體會到統計思維和推理的快樂,因為一項科學的統計過程,就是醫學進步的過程。
㈥ 衛生統計學的介紹
統計學(statistics)是研究數據的收集、整理和分析的一門科學,幫助人們分析所佔有的信息,達到去偽存真、去粗取精、正確認識世界的一種重要手段。 衛生統計學(health statistics)是應用數理統計學的原理與方法研究居民健康狀況以及衛生服務領域中數據的收集、整理和分析的一門科學。
㈦ 高分求~~~<統計學研究的對象和方法>論文開題報告
統計學研究對象和研究方法 一、統計學的研究對象 一般來說,統計學的研究對象是自然、社會客觀現象總體的數量關系。正是因為統計學的 這一研究的特殊矛盾,使它成為了一門萬能的科學。不論是自然領域,還是社會經濟領域,客觀 現象總體的數量方面,都是統計學所要分析和研究的。 二、統計研究的特點 統計學研究對象的特點有如下幾點: 1、數量性。統計學的研究對象是自然、社會經濟領域中現象的數量方面,這一特點是統計學(定 量分析學科)與其他定性分析學科的分界線。數量性是統計學研究對象的基本特點,因為,數字 是統計的語言,數據資料是統計的原料。一切客觀事物都有質和量兩個方面,事物的質與量總是 密切聯系、 共同規定著事物的性質。 沒有無量的質, 也沒有無質的量。 一定的質規定著一定的量, 一定的量也表現為一定的質。但在認識的角度上,質和量是可以區分的,可以在一定的質的情況 下,單獨地研究數量方面,通過認識事物的量進而認識事物的質。因此,事物的數量是我們認識 客觀現實的重要方面,通過分析研究統計數據資料,研究和掌握統計規律性,就可以達到我們統 計分析研究的目的。 2、總體性。統計學的研究對象是自然、社會經濟領域中現象總體的數量方面,即統計的數量研 究是對總體普遍存在著的事實進行大量觀察和綜合分析, 得出反映現象總體的數量特徵和資料規 律性。 自然、 社會經濟現象的數據資料和數量對比關系等一般是在一系列復雜因素的影響下形成 的。 在這些因素當中, 有起著決定和普遍作用的主要因素, 也有起著偶然和局部作用的次要因素。 由於種種原因,在不同的個體中,它們相互結合的方式和實際發生的作用都不可能完全相同。所 以,對於每個個體來說,就具有一定的隨機性質,而對於有足夠多數個體的總體來說又具有相對 穩定的共同趨勢,顯示出一定的規律性。例如,對工資的統計分析,我們並不是要分析和研究個 別人的工資,而是要反映、分析和研究一個地區、一個部門、一個企業事業單位的總體的工資情 況和顯示出來的規律性。 統計研究對象的總體性, 是從個體的實際表現的研究過渡到對總體的數 量表現的研究的。 3、具體性。統計研究對象是自然、社會經濟領域中具體現象的數量方面。即它不是純數量的研 究,是具有明確的現實涵義的,這一特點是統計學與數學的分水嶺。數學是研究事物的抽象空間 和抽象數量的科學,而統計學研究的數量是客觀存在的、具體實在的數量表現。統計研究對象的 這一特點,也正是統計工作必須遵循的基本原則。正因為統計的數量是客觀存在的、具體實在的 數量表現,它才能獨立於客觀世界,不以人們的主觀意志為轉移。統計資料作為主觀對客觀的反 映, 只有如實地反映具體的已經發生的客觀事實, 才能為我們進行統計分析研究提供可靠的基礎, 才能分析、探索和掌握事物的統計規律性。否則,虛假的統計數據資料是不能成為統計數據資料 的,因為它違背了統計研究對象的這一特點。 4、變異性。統計研究對象的變異性是指構成統計研究對象的總體各單位,除了在某一方面 必須是同質的以外, 在其他方面又要有差異, 而且這些差異並不是由某種特定的原因事先給定的。 就是說, 總體各單位除了必須有某一共同標志表現作為它們形成統計總體的客觀依據以外, 還必 須要在所要研究的標志上存在變異的表現。否則,就沒有必要進行統計分析研究了。 三、統計學研究方法 統計學根據研究對象的性質和特點,形成了它自己專門的研究方法,這些基本方法是:實 驗設計法、大量觀察法、統計描述法和統計推斷法。 (一)實驗設計 所謂實驗的統計設計就是指設計實驗的合理程序,使得收集得到的數據符合統計分析方法的要 求,以便得出有效的客觀的結論。它主要適用於自然科學研究和工程技術領域的統計數據搜集。 (二)大量觀察法 大量觀察法是統計學所特有的方法。 所謂大量觀察法, 是指對所研究的事物的全部或足夠數量進 行觀察的方法。 社會現象或自然現象都受各種社會規律或自然規律相互交錯作用的影響。 在現象 總體中,個別單位往往受偶然因素的影響,如果任選其中之一進行觀察,其結果不足以代表總體 的一般特徵;只有觀察全部或足夠的單位並加以綜合,影響個別單位的偶然因素才會相互抵消, 現象的一般特徵才能顯示出來。 大量觀察的意義在於可使個體與總體之間在數量上的偏誤相互抵 消。 (三)統計描述 統計描述是指對由實驗或調查而得到的數據進行登記、審核、整理、歸類、計算出各種能反映總 體數量特徵的綜合指標,並加以分析從中抽出有用的信息,用表格或圖形把它表示出來。統計描 述是統計研究的基礎,它為統計推斷、統計咨詢、統計決策提供必要的事實依據。統計描述也是 對客觀事物認識的不斷深化過程。它通過對分散無序的原始資料的整理歸納,運用分組法、綜合 指標法和統計模型法得到現象總體的數量特徵, 揭露客觀事物內在數量規律性, 達到認識的目的。 (四)統計推斷 統計在研究現象的總體數量關系時, 需要了解的總體對象的范圍往往是很大的, 有時甚至是無限 的,而由於經費、時間和精力等各種原因,以致有時在客觀上只能從中觀察部分單位或有限單位 進行計算和分析,根據局部觀察結果來推斷總體。在一定置信程度下,根據樣本資料的特徵,對 總體的特徵做出估計和預測的方法稱為統計推斷法。 統計推斷是現代統計學的基本方法, 在統計 研究中得到了極為廣泛的應用, 它既可以用於對總體參數的估計, 也可以用作對總體某些分布特 征的假設檢驗。從這種意義上來說,統計學是在不確定條件下做出決策或推斷的一種方法。 四、統計工作過程 一般來說主要包括統計設計、統計調查、統計整理、統計分析、統計預測這樣五個階段。其 中心階段為調查、整理和分析三個階段。 統計學的研究對象和方法 一、統計的含義 統計一詞有著豐富的內涵。一般講到「統計」,可以從三個方面理解,即統 計實踐、統計資料和統計理論。 (一)統計實踐活動 統計是適應社會經濟發展的需要和國家管理的需要而產生和發展的。 統計實 踐活動就是人們有目的搜集、 整理和分析實際資料的工作過程, 涉及社會、 經濟、 文化、科技等各個方面。統計作為一種社會實踐活動,已有四、五千年的歷史。 據考證,在我國原始社會的末期及奴隸社會形成的過程中,已經出現了統計的萌 芽,「結繩記事」是最早的統計調查活動,並且將所記之事分為「大事」和「小 事」,以「結」的大小來表示。這說明原始人類已經開始有目的積累資料了。中 國奴隸制社會的統計活動的主要內容是「丁口」和「田畝」,即人口和耕地,其 目的主要是為了戰爭和貢賦。經過漫長的封建社會,統計活動的范圍逐漸拓寬, 內容也逐漸豐富,除了人口和耕地統計之外,財產統計、產量、倉儲統計、交通 運輸統計、礦冶統計、物價統計、軍費統計、驛傳統計、財政統計、海關統計等 也慢慢產生和發展,並在漫長的歲月里積累了一定的統計資料。但由於封建社會 戰亂頻繁,災害連連,因此,積累並保存起來的統計資料連貫性較差,且基本不 具有可比性。民國時期的統計已經逐步按行業進行,具備了一定規模。新中國成 立後,統計實踐得到了極大的發展,如今的統計活動,已涉及國民經濟和社會生 活的各個方面,取得了很大的成績,積累了豐富的資料,為我國的經濟建設和社 會發展做出了重大貢獻。 (二)統計資料 統計資料是經過統計調查和統計整理以後得到的反應社會經濟實際的統計 成果,是人類活動各數量方面客觀情況的記錄,包括數據資料和文字資料,以數 據資料為主。統計數字、統計分析報告、統計台帳、統計表、統計圖等都是統計 資料。例如,漢和帝末年全國總人口 5,300 多萬,墾田數 732 萬多頃;康熙年間 人口數為 27,355,462 人(公元 1721 年),墾田數達 7,336,450.5 頃;1997 年全國 農業總產出 174,498,000 千元, 工業總產出 615,301,208 千元等等, 都是統計資料。 目前,我們搜集和積累的統計資料已經十分豐富,大量的統計資料多以各種統計 公報、《統計年鑒》、資料庫以及光碟等的形式公布和收藏。 (三)統計理論 統計理論是對統計實踐活動的理論概括和總結, 是闡述統計實踐活動的基本 理論和基本方法,統計理論的系統化和科學化結晶成統計學。統計學目前已經發 展成一個涉及范圍廣泛、內容豐富多彩的學科體系,包括數理統計學、經濟統計 學、社會統計學和自然科學方面的統計學等等。 統計實踐、統計資料和統計理論三者之間存在著密切的聯系。統計實踐是基 礎,統計資料和統計理論都是在統計實踐的基礎上產生和發展的。統計資料來源 於統計實踐,沒有統計實踐就沒有統計資料,同時統計資料又服務於統計實踐, 沒有一定數量的、積累起來的統計資料,新的統計工作將難以做好。統計理論是 對統計實踐活動的理論抽象和總結,理論來源於實踐,但又反過來指導統計實踐 活動,使統計實踐活動更科學、更有效,使取得的統計資料更符合客觀實際,更 具有使用價值。統計實踐的不斷發展,不但可以獲得更加豐富多彩的統計資料, 也會不斷豐富統計理論,促進統計理論的發展和完善。因此,統計一詞的三種含 義是相互聯系的,不能將它們分割開來。統計實踐與統計學的不斷發展和不斷豐 富的過程,也是統計不斷實踐、認識、再實踐、再認識的過程。 二、統計學的研究對象 關於統計學的性質和研究對象問題,是我國統計理論界長期以來爭論較多、 分歧較大的問題,本書無意參與這種爭論,我們取「統計學是一門方法論科學」 這樣的理念,認為統計學主要是研究方法論的,並且,本書將統計學界定在社會 經濟統計學這樣的框架之內。 在這樣的前提下, 我們討論統計學的研究對象問題。 在討論這一問題時,將統計的研究對象和統計學的研究對象加以區分是有益的。 (一)統計認識的對象 從哲學的意義出發,任何事物都存在質和量兩個方面,是質和量的統一,研 究一種事物可以從量的方面進行,也可以從質的方面進行,對事物量的方面的研 究是在對事物的質的方面有所把握的基礎上進行的。 統計是從量的方面對社會經 濟現象進行觀察研究的,即統計的認識對象是社會經濟現象的數量方面。雖然統 計是研究社會經濟現象的數量方面的, 但它對現象數量方面的研究並不是孤立進 行的,而是在質與量的相互聯系中研究量的,如果離開了事物質的方面,為研究 量而研究量,那就不是統計學了。統計研究事物數量方面的目的,在於通過對事 物量的方面的觀察和量變規律的研究, 逐步把握事物的質和對事物質的方面的認 識。因此,統計對社會經濟現象數量方面的認識包括量的規模、現象之間的數量 聯系、現象數量的變化規律、現象質與量互變的數量界限等,而對事物量的這些 方面的研究,都不是僅對個別事物觀察所能得到的,必需通過對現象的大規模研 究才能有效,因此,統計的研究對象具有如下的特點: 1. 總體性。統計認識社會經濟現象的數量方面必須是對總體現象的認識, 而非對個體現象的認識。因為,只有通過對總體的數量方面的觀察,才能發現現 象存在的共性和規律性。例如,我們可以通過對一個國家或地區的眾多工業企業 的研究,了解工業企業的生產能力、生產規模、產品結構和工業品滿足社會需要 的程度等方面的情況。但如果只對該國或該地區的個別工業企業進行觀察,則無 論我們的工作做得多麼細致, 也不可能得到整個工業產品的結構及其滿足需要程 度的信息,因為它不具備代表性。 統計對社會經濟現象的研究要求具有總體性, 是基於滿足統計研究的目的來 考慮的。但強調總體性的要求,並不排斥統計對社會經濟個體現象觀察的重視。 事實上,統計對總體事物的研究是從對個體的觀察開始的,例如在人口統計中, 如果沒有對一個自然人各方面情況的仔細觀察和記錄, 就得不到對人口總體的總 人數、性別比例、地區分布、出生率、平均壽命等方面的數量認識。因此,統計 對個體現象進行觀察的目的,是為了認識總體的數量特徵。 2. 社會性。統計對象的社會性可以從三個方面進行考察,一是統計的認識 對象是社會經濟現象的數量方面,因而統計本身也就有了社會性。二是統計認識 的主體是社會的人,人的階級性(社會性)決定了認識立場和認識結論上的社會 性。三是一切社會經濟活動都和人的利益有關,不同的人群有著不同的利益和利 益關系,因此人們相互間的利益分割和利益沖突,必將在統計上顯示出來。統計 為一定的階級和一定的社會集團服務,古今中外,概莫能外。因此,我們說,統 計具有社會性。 (二)統計學的研究對象 如前所述,統計學是統計實踐活動的理論概括和總結,並反過來指導統計實 踐活動,因此,統計學的研究對象可以表述為:社會經濟總體現象的數量特徵及 其規律性、統計認識活動過程本身和認識方法。 三、統計學的研究方法 每門學科都有其特定的研究對象,不同的研究對象,需要用不同的方法去研 究。 當然, 同一種研究方法可以用於不同的研究對象。 統計學有自己的研究方法。 這里所討論的是統計學研究中使用的最基本的方法。 (一)大量觀察法 大量觀察法是統計學(包括數理統計學、經濟統計學、社會統計學、其他統 計學等)中的特有方法。它是指統計在研究社會經濟現象等的數量方面時,必須 對總體現象中的全部或足夠多數的個體進行觀察, 以達到對現象總體數量特徵及 其規律性的認識。社會經濟總體現象是復雜性的,它是在各種錯綜復雜的因素影 響下形成的,總體中的個體之間存在著數量上的差異,如果統計僅對少數個體進 行觀察,就會失之偏頗,得不出合乎實際的結論來。概率論證明:隨著觀察次數 (個體)的逐步增多,樣本指標和總體指標之間的離差將縮小,樣本平均數將逐 步逼近總體平均數,樣本的分布將逐步趨同於總體的分布。因此,只有被觀察的 個體「足夠多」的時候,才能消除偶然因素影響造成的誤差,樣本對總體才有足 夠的代表性,用樣本指標推斷總體指標時,才具有較高的可靠性。「足夠多」意 味著樣本容量要比較大,理論認為,樣本容量 30 以上為大樣本。但在實際中, 人們為了確保統計結果的可靠性,往往選取更多的個體進行觀察,具體數目可由 抽樣原理計算確定。 (二)統計分組法 統計分組既是統計資料整理的方法,也是統計分析的基本方法之一。根據統 計研究問題的目的不同, 可以選擇不同的分組標准對總體進行不同的分組以反映 總體的構成和現象之間的依存關系。例如要研究我國國有企業的有關情況,選擇 「企業規模」為標准進行分組,結果可以反映國有企業中大、中、小型企業的數 量和比例;選擇「盈虧狀況」進行分組,可以觀察國有企業的虧損面及虧損額, 發現問題的嚴重性,等等。 (三)綜合指標法 所謂綜合指標法, 就是根據大量觀察獲得的資料, 計算、 運用各種綜合指標, 以反映總體一般數量特徵的統計分析法。通常使用的綜合指標主要有總量指標、 相對指標、平均指標、變異指標等。這些指標各自從不同的角度對總體的特徵進 行刻劃,將其結合運用,可以更加全面、深入地分析社會經濟總體現象的數量方 面。 (四)時間數列分析法 這是一種分析社會經濟現象在較長時間上發生、 發展情況及變化趨勢的統計 方法。一般來說,現象在較長歷史時期內,會發生較大的變化,這種變化是受多 種因素影響形成的,這些因素有些是可以量化的、可以預期的,有些是難以或不 能量化和預期的,前者可以用統計的方法進行分析,後者則不能。影響時間數列 變化的因素主要有:長期趨勢、季節變化、循環波動、偶然性因素等等。通過適 當的方法對這些因素進行必要的測算和分析,是統計研究的重要方面。 (五)指數分析法 現象的總體是復雜的,其發展變動受其構成要素變動的影響,但這些構成要 素往往不可以直接相加, 很難進行直接的觀察比較, 因此需要逐個因素進行分析, 分析它們的變化對總體變動的影響程度和影響方向。 例如多種不同類型商品價格 的總變動受各種商品價格變動的影響, 多種產品總成本的變動受每種產品單位成 本變動的影響, 社會勞動生產率的變動受各部門、 各行業勞動生產率變動的影響, 等等。指數分析法就是用來解決此類問題的。 (六)相關分析法 現象是復雜的,同時現象之間也是相互聯系的。有些現象相互間存在著確定 的聯系,當某一現象變動一定量時,相關現象隨之變動,且變動的量是確定的。 比如在價格既定的條件下, 鮮蛋的銷售量和銷售額之間的關系, 就是確定的聯系。 但有些現象之間存在的是一種不確定的關系,如施肥量和作物產量之間的關系、 工業品生產批量和單位成本之間的關系、人們身高和體重之間的關系等等,這些 現象之間的關系是密切的,但卻是不固定的。它們相關的程度和方向是視情況不 同而不同的,相關分析就是要研究這些現象之間相互關系的程度和方向,為對現 象之間關系的進一步研究分析奠定基礎。 (七)抽樣推斷法 抽樣推斷法,是指按照隨機原則從總體中選擇一少部分單位進行調查,並根 據登記結果對總體的數量特徵做出有一定正確性和一定把握性的估計的統計方 法。這種方法主要用於難以進行全面調查的場合(如總體規模巨大或總體為無限 總體等)和不宜或不能進行全面調查的場合(如對部分工業品質量性能的破壞性 試驗等)。當然在可以進行全面調查或進行其他非全面調查的場合,抽樣調查仍 然具有獨到特點。比如人口調查,可以用普查的方法取得全面資料,也可以用抽 樣的方法推斷全面的情況。抽樣推斷所依據的雖然是少數單位的情況,但其目的 卻在於取得總體的數量特徵。目前,抽樣的方法在經濟、社會、醫療衛生、體育、 科研等許許多多的領域都得到了廣泛的應用, 而且在各種非全面統計調查方法中 居於主導地位。 統計制度和統計工作過程 一、統計制度 統計制度在不同的國家和地區、或一個國家的不同歷史發展階段上,都是不 同的。例如,美國沒有專門的國家統計局,其統計資料分別由不同的政府部門負 責搜集和公布,如有關經濟方面的資料由美國商業部提供,勞動工資方面的資料 由美國勞工部負責搜集和公布等。這和中國有別。本節對我國的統計制度和統計 工作做些簡單介紹。 (一)統計管理體制 新中國成立後,在中央財經委員會計劃局內設立了統計處,負責規劃全國的 財經統計工作。1952 年,成立國家統計局,領導全國的統計工作。從那時起, 國家建立了由國家統計局,各省、自治區、直轄市統計局,市、縣、區統計局等 組成的政府專門統計系統和各級政府職能部門及大中型企業內設的專業統計機 構,共同進行國民經濟和社會各方面的統計工作,實行統一領導、分級管理的管 理體制,政府統計部門受上級統計部門和同級人民政府的雙重領導。這基本上保 證了各級政府管理決策及社會各方面對統計資料的需求。 現在我國所有的官方統 計數字一律由政府統計部門會同有關部門搜集、由各級政府統計局公布。這保證 了全國統計數字的權威性和協調統一。 (二)統計調查制度 新中國的統計調查制度是從 1950 年開始的。1950 年 3 月在中財委統計總處 的領導下,進行了第一次全國工業普查,此後全國各種統計調查報表制度先後建 立起來,而且多是定期報表,如《工業統計報表制度》 《運輸郵電統計報表制度》 《物資統計報表制度》《基本建設統計報表制度》《貿易統計報表制度》《農業 統計報表制度》《勞動統計報表制度》《文教衛生統計報表制度》和各項專門調 查等。在新中國統計調查的歷史上,曾出現過一些問題,50 年代初期濫發統計 報表就是其中的一例。據統計,那時中央政府各部門和各級地方政府部門共發放 各種統計表格 34,993 種。「文革」期間,統計制度受到了很大的破壞,統計報 表到 1975 年才得以恢復。80 年代以後,人們開始思考統計制度的改革問題,從 統計隊伍來說,政府統計部門重新組建了農調隊,成立了城調隊,90 年代又成 立了企調隊。從調查方法制度上來講,過去實行的全面統計報表制度,已不能滿 足經濟改革開放對統計的要求,必需進行改革。以定期普查和抽樣調查為主、多 種調查方法相結合,是我國現行的統計調查體系的基本特徵。調查方法制度是隨 社會、經濟的發展和政治、經濟管理體制的改革而不斷改革和完善的。今後,民 間統計機構和統計業務可能會有較大發展,並作為政府統計的必要補充,共同承 擔滿足社會各方面對統計需求的任務。 (三)統計法制 統計法制是保證統計工作依法進行、保證統計資料及時、客觀、真實地反映 社會經濟現實的必要手段。中國第一個具有法律意義的統計文件是 1950 年東北 人民政府批准公布的《東北統計報告暫行規定》。1953 年,中央人民政府政務 院以命令的形式發出了《關於充實統計機構加強統計工作的決定》,它為在全國 有組織、有領導地建立統一的、系統的、科學的統計工作鋪平了道路,並對以後 的統計工作建設產生了深遠的影響。1954 年,在治理濫發統計表格的基礎上, 頒發了《關於制定及審批調查統計報表的暫行辦法》和《關於調查統計報表制訂 送審的幾項規定》,在一定程度上規范了統計報表制度。1962 年,中共中央、 國務院發布了《關於加強統計工作的決定》,要求在領導上、業務上、組織上加 強統計工作,同一切虛報、瞞報統計數字的違法行為作斗爭。1963 年 3 月國務 院發布了《統計工作試行條例》,這是新中國的第一個統計法規,具有重要的現 實意義和深遠的歷史意義。1983 年 12 月 8 日《中華人民共和國統計法》正式公 布,並於 1984 年 1 月 1 日起實施。《中華人民共和國統計法》是我國統計史上 第一部正式法規,該法規的頒布,標志著我國統計工作真正開始走上法制軌道。 現在許多地方政府也已制定了統計法規性的條例, 《河南省統計工作管理條例》 如 等,使得統計工作的法制管理真正切實可行。沒有規矩,不成方圓。在社會主義 市場經濟條件下,統計業務越來越多,統計工作涉及的方面越來越廣,統計主體 也將由「一元」發展成「多元」。在這個過程中,將會不斷有新的情況和新的問 題出現,因此統計法制建設須將得到不斷的加強和完善。 二、統計工作過程 從理論上講, 一項完整的統計工作可分為四個階段, 即統計設計、 統計調查、 統計整理和統計分析。 統計設計,是根據統計研究對象的特點和研究的目的、任務,對統計工作的 各個方面和各個環節的通盤考慮和安排,是統計認識過程的第一階段,即定性認 識的階段。統計設計之所以必要,是因為統計是一項需要高度集中統一的工作, 沒有預先的科學的設計,沒有具體的工作規范,就難以達到預期的目的。因此在 一項大規模的統計活動開始前,必需進行統計設計。 統計調查,是根據統計研究的對象和目的要求,根據統計設計的內容、指標 和指標體系的要求,有計劃、有目的、有組織地搜集統計原始資料的工作過程, 是統計認識過程的第二個階段,是定量認識的階段。統計用數字說話,而各種統 計數字都直接來自於統計調查, 管理者和決策者都需要根據大量翔實的統計信息 進行管理和決策,科研工作者也需要根據統計調查得到的資料進行科學研究。調 查是統計的基礎,沒有調查,就沒有發言權。調查的方式方法主要有統計報表制 度、普查、抽樣調查、典型調查、重點調查等。 統計整理,是指根據統計研究的目的,將統計調查得到的原始資料(和次級 資料)進行科學的分類和匯總,使其條理化、系統化的工作過程,是統計認識過 程的第三階段。 這個階段的主要任務就是為統計分析階段准備能在一定程度上說 明總體特徵的統計資料。但在實際工作中,統計整理與統計調查和統計分析並非 總是截然分開的,而是相互交織在一起的,它是統計調查的繼續,也是統計分析 的開始。統計調查和統計整理都是一種定量認識活動。 統計分析,是統計認識過程的最後階段,是在統計整理的基礎上,根據研 究目的和任務, 利用科學的統計分析方法, 對統計研究對象的數量方面進行計算、 分析的工作過程。統計認識的結論要從分析中得出,因此,這一階段雖然是對統 計資料的計算分析,但其目的卻是要揭示統計研究的對象的狀況、特點、問題、 規律性等,所以這是統計認識的定性階段。 因此,從認識的順序來看,統計設計、統計調查、統計整理和統計分析這 四個階段, 是從定性認識開始, 經過定量認識, 再到定性認識的循環往復的過程, 即定性認識(統計設計)→定量認識(統計調查和統計整理)→定性認識(在定 量認識的基礎上進行的統計分析)的過程。 再次重申, 統計認識過程的這四個階段的劃分, 在很大程度上只是理論上的, 相對的,實踐中,統計工作過程是很難這樣分開的。
㈧ 衛生統計學檢驗方法的選擇
不同的葯是分類型變數,形成率是數值型變數,應該用方差分析。
㈨ 醫學科研中常用的統計學方法有哪些
正確的統計學分析一定要建立在明確的研究目的和研究設計的基礎之上,那些事先沒有研究目的和研究設計,事後找來一堆數據進行統計分析都是不可取的。 在醫學論文的撰、編、審、讀過程中經常遇到的問題是研究的題目與課題設計、論文內容不符,包括文章的方法解決不了論文的目的、文章的結果說明不了論文的題目、文章的討論偏離了論文的主題;還有是目的不明確、設計不合理。如題目過小,論文不夠字數,而一些無關緊要的變數指標或結果被分析被討論;又如題目過大,論文的全部內容不足以說明研究的目的,使論文的論點難以立足。 所以,合理明確的論文題目或目的以及研究設計方案是撰、編、審、讀者應當關注的首要問題。此外,樣本含量是否滿足,抽樣是否隨機,偏倚是否控制等,也是不可忽視的問題。
2、建好分析用的資料庫
建好資料庫是正確統計分析的前提和基礎,甚至決定了論文分析結果的成敗。對於編、審、讀者來講,一般由於篇幅的限制,往往得不到資料庫數據,而只有作者在資料庫數據基礎上經統計描述計算後給出的諸如各指標均數 x、標准差 s 或中位數 M、百分位數 Px 的「二手」數據,或將研究對象小或特徵屬性分組,清點各組觀察單位出現的個數或頻數的頻數表數據等。 無論是否能夠得到資料庫數據,作者在統計分析過程中一定依據資料庫數據進行計算,得出結果。如果對「二手」數據或頻數表數據的結果等存在疑惑,編輯、審稿專家或讀者有權要求作者提供資料庫數據以檢查其完整性、准確性和真實性,確保研究數據的質量。假若在投稿須知中對資料庫數據作出必要的要求,無疑對於保證刊物的發表質量有著積極的意義