亚洲精品中文字幕无乱码_久久亚洲精品无码AV大片_最新国产免费Av网址_国产精品3级片

考研備考 百文網(wǎng)手機(jī)站

考研統(tǒng)計(jì)學(xué)有哪些知識(shí)要點(diǎn)

時(shí)間:2021-12-04 15:30:13 考研備考 我要投稿

考研統(tǒng)計(jì)學(xué)有哪些知識(shí)要點(diǎn)

  考研的小伙伴們?cè)谶x擇了統(tǒng)計(jì)學(xué)這個(gè)專業(yè)的時(shí)候,要掌握好它的知識(shí)要點(diǎn),才能更好進(jìn)行復(fù)習(xí)。小編為大家精心準(zhǔn)備了考研統(tǒng)計(jì)學(xué)重要考點(diǎn),歡迎大家前來閱讀。

考研統(tǒng)計(jì)學(xué)有哪些知識(shí)要點(diǎn)

  考研統(tǒng)計(jì)學(xué)知識(shí)點(diǎn):簡(jiǎn)單回歸

  1.相關(guān)分析:對(duì)兩個(gè)變量之間線性關(guān)系的描述與度量,它要解決的問題包括

  § 變量之間是否存在關(guān)系?

  § 如果存在關(guān)系,它們之間是什么樣的關(guān)系?

  § 變量之間的強(qiáng)度如何?

  § 樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?

  2.回歸分析:從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式;對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著;利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度

  3.回歸分析與相關(guān)分析的區(qū)別

  相關(guān)分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測(cè)因變量的變化

  相關(guān)分析中所涉及的變量 x 和 y 都是隨機(jī)變量;回歸分析中,因變量 y 是隨機(jī)變量,自變量 x 可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量

  相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量 x 對(duì)變量 y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制

  4.一元線性回歸模型

  描述因變量 y 如何依賴于自變量 x 和誤差項(xiàng)e 的方程稱為回歸模型

  一元線性回歸模型可表示為

  y = b0 +b1 x + e

  y 是 x 的線性函數(shù)(部分)加上誤差項(xiàng)

  線性部分反映了由于 x 的變化而引起的 y 的變化

  誤差項(xiàng) e 是隨機(jī)變量

  l 反映了除 x 和 y 之間的線性關(guān)系之外的隨機(jī)因素對(duì) y 的影響

  l 是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性

  b0 和 b1 稱為模型的參數(shù)

  5.利用回歸方程預(yù)測(cè)時(shí)應(yīng)注意

  1. 在利用回歸方程進(jìn)行估計(jì)或預(yù)測(cè)時(shí),不要用樣本數(shù)據(jù)之外的x值去預(yù)測(cè)相對(duì)應(yīng)的y值

  2. 因?yàn)樵谝辉性回歸分析中,總是假定因變量y與自變量x之間的關(guān)系用線性模型表達(dá)是正確的。但實(shí)際應(yīng)用中,它們之間的關(guān)系可能是某種曲線

  3. 此時(shí)我們總是要假定這條曲線只有一小段位于x測(cè)量值的范圍之內(nèi)。如果x的取值范圍是在xL和xU之間,那么可以用所求出的利用回歸方程對(duì)處于xL和xU之間的值來估計(jì)E(y)和預(yù)測(cè)y。如果用xL和xU之間以外的值得出的估計(jì)值和預(yù)測(cè)值就會(huì)很差

  6.離差平方和

  總平方和(SST)

  反映因變量的 n 個(gè)觀察值與其均值的總離差

  回歸平方和(SSR)

  反映自變量 x 的變化對(duì)因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和

  殘差平方和(SSE)

  反映除 x 以外的其他因素對(duì) y 取值的影響,也稱為不可解釋的平方和或剩余平方和

  7.估計(jì)標(biāo)準(zhǔn)誤差

  實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根(自由度n-2)

  反映實(shí)際觀察值在回歸直線周圍的分散狀況

  對(duì)誤差項(xiàng)e的標(biāo)準(zhǔn)差s的估計(jì),是在排除了x對(duì)y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量

  反映用估計(jì)的回歸方程預(yù)測(cè)y時(shí)預(yù)測(cè)誤差的大小。

  考研統(tǒng)計(jì)學(xué)要點(diǎn):多元回歸

  1.多重共線性

  回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)

  多重共線性帶來的問題有

  可能會(huì)使回歸的結(jié)果造成混亂,甚至?xí)逊治鲆肫缤?/p>

  可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響,特別是各回歸系數(shù)的正負(fù)號(hào)有可能同我們預(yù)期的正負(fù)號(hào)相反

  2.多重共線性的識(shí)別

  檢測(cè)多重共線性的最簡(jiǎn)單的一種辦法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)

  若有一個(gè)或多個(gè)相關(guān)系數(shù)顯著,就表示模型中所用的自變量之間相關(guān),存在著多重共線性

  如果出現(xiàn)下列情況,暗示存在多重共線性

  模型中各對(duì)自變量之間顯著相關(guān)。

  當(dāng)模型的線性關(guān)系檢驗(yàn)(F檢驗(yàn))顯著時(shí),幾乎所有回歸系數(shù)的t檢驗(yàn)卻不顯著

  回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反。

  3.變量選則過程

  在建立回歸模型時(shí),對(duì)自變量進(jìn)行篩選

  選擇自變量的原則是對(duì)統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn)

  將一個(gè)或一個(gè)以上的自變量引入到回歸模型中時(shí),是否使得殘差平方和(SSE)有顯著地減少。如果增加一個(gè)自變量使SSE的'減少是顯著的,則說明有必要將這個(gè)自變量引入回歸模型,否則,就沒有必要將這個(gè)自變量引入回歸模型

  確定引入自變量是否使SSE有顯著減少的方法,就是使用F統(tǒng)計(jì)量的值作為一個(gè)標(biāo)準(zhǔn),以此來確定是在模型中增加一個(gè)自變量,還是從模型中剔除一個(gè)自變量

  變量選擇的方法主要有:向前選擇、向后剔除、逐步回歸、最優(yōu)子集等

  4.向前選擇

  從模型中沒有自變量開始

  對(duì)k個(gè)自變量分別擬合對(duì)因變量的一元線性回歸模型,共有k個(gè),然后找出F統(tǒng)計(jì)量的值最高的模型及其自變量(P值最小的),并將其首先引入模型

  分別擬合引入模型外的k-1個(gè)自變量的線性回歸模型

  如此反復(fù)進(jìn)行,直至模型外的自變量均無統(tǒng)計(jì)顯著性為止

  5.向后剔除

  先對(duì)因變量擬合包括所有k個(gè)自變量的回歸模型。然后考察p(p

  考察p-1個(gè)再去掉一個(gè)自變量的模型(這些模型中每一個(gè)都有k-2個(gè)的自變量),使模型的SSE值減小最少的自變量被挑選出來并從模型中剔除

  如此反復(fù)進(jìn)行,一直將自變量從模型中剔除,直至剔除一個(gè)自變量不會(huì)使SSE顯著減小為止

  6.逐步回歸

  將向前選擇和向后剔除兩種方法結(jié)合起來篩選自變量

  在增加了一個(gè)自變量后,它會(huì)對(duì)模型中所有的變量進(jìn)行考察,看看有沒有可能剔除某個(gè)自變量。如果在增加了一個(gè)自變量后,前面增加的某個(gè)自變量對(duì)模型的貢獻(xiàn)變得不顯著,這個(gè)變量就會(huì)被剔除

  按照方法不停地增加變量并考慮剔除以前增加的變量的可能性,直至增加變量已經(jīng)不能導(dǎo)致SSE顯著減少

  在前面步驟中增加的自變量在后面的步驟中有可能被剔除,而在前面步驟中剔除的自變量在后面的步驟中也可能重新進(jìn)入到模型中

  7.虛擬自變量

  用數(shù)字代碼表示的定性自變量

  虛擬自變量可有不同的水平

  只有兩個(gè)水平的虛擬自變量。比如,性別(男,女)

  有兩個(gè)以上水平的虛擬自變量,貸款企業(yè)的類型(家電,醫(yī)藥,其他)

  虛擬變量的取值為0,1

  回歸模型中使用虛擬自變量時(shí),稱為虛擬自變量的回歸

  當(dāng)虛擬自變量只有兩個(gè)水平時(shí),可在回歸中引入一個(gè)虛擬變量,比如,性別

  一般而言,如果定性自變量有k個(gè)水平,需要在回歸中模型中引進(jìn)k-1個(gè)虛擬變量

  例:引進(jìn)虛擬變量時(shí),回歸方程可寫:

  E(y) =b0+ b1x1+ b2x2

  女( x2=0):E(y|女性) =b0 +b1x1

  男(x2=1):E(y|男性) =(b0 + b2 ) +b1x1

  b0的含義表示:女性職工的期望月工資收入

  (b0+ b2)的含義表示:男性職工的期望月工資收入

  b1含義表示:工作年限每增加1年,男性或女性工資的平均增加值

  b2含義表示:男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值 (b0+ b2) - b0= b2

  考研統(tǒng)計(jì)學(xué)難點(diǎn):主成分和因子分析

  1.(1)概念:在研究實(shí)際問題時(shí),往往需要收集多個(gè)變量。但這樣會(huì)使多個(gè)變量間存在較強(qiáng)的相關(guān)關(guān)系,即這些變量間存在較多的信息重復(fù),直接利用它們進(jìn)行分析,不但模型復(fù)雜,還會(huì)因?yàn)樽兞块g存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時(shí)要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類問題的有效方法。它們能夠提取信息,使變量簡(jiǎn)化降維,從而使問題更加簡(jiǎn)單直觀

  (2)主成分分析:研究如何通過少數(shù)幾個(gè)主成分(principal component)來解釋多個(gè)變量間的內(nèi)部結(jié)構(gòu)。即從原始變量中導(dǎo)出少數(shù)幾個(gè)主分量,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)

  主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋。常被用來尋找判斷事物或現(xiàn)象的綜合指標(biāo),并對(duì)綜合指標(biāo)所包含的信息進(jìn)行適當(dāng)?shù)慕忉尅?主成分所代表的原始變量的信息用其方差來表示,一般要求所選主成分的方差總和占全部方差的80%以上就可以了。如果原來的變量之間的相關(guān)程度高,降維的效果就會(huì)好一些,所選的主成分就會(huì)少一些。特征根反映了主成分對(duì)原始變量的影響程度,表示引入該主成分后可以解釋原始變量的信息。特征根又叫方差,某個(gè)特征根占總特征根的比例稱為主成分方差貢獻(xiàn)率。一般情況下,當(dāng)特征根小于1時(shí),就不再選作主成分了,因?yàn)樵撝鞒煞值慕忉屃Χ冗不如直接用原始變量解的釋力度大。)

  (3)因子分析:與主成分分析類似,它們都是要找出少數(shù)幾個(gè)新的變量來代替原始變量。

  不同之處:主成分分析中的主成分個(gè)數(shù)與原始變量個(gè)數(shù)是一樣的,即有幾個(gè)變量就有幾個(gè)主成分,只不過最后我們確定了少數(shù)幾個(gè)主成分而已。而因子分析則需要事先確定要找?guī)讉(gè)成分,也稱為因子(factor),然后將原始變量綜合為少數(shù)的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的關(guān)系,一般來說,因子的個(gè)數(shù)會(huì)遠(yuǎn)遠(yuǎn)少于原始變量的個(gè)數(shù)。

  因子分析可以看作是主成分分析的推廣和擴(kuò)展,但它對(duì)問題的研究更深入、更細(xì)致一些。實(shí)際上,主成分分析可以看作是因子分析的一個(gè)特例

  簡(jiǎn)言之,因子分析是通過對(duì)變量之間關(guān)系的研究,找出能綜合原始變量的少數(shù)幾個(gè)因子,使得少數(shù)因子能夠反映原始變量的絕大部分信息,然后根據(jù)相關(guān)性的大小將原始變量分組,使得組內(nèi)的變量之間相關(guān)性較高,而不同組的變量之間相關(guān)性較低。因此,因子分析屬于多元統(tǒng)計(jì)中處理降維的一種統(tǒng)計(jì)方法,其目的就是要減少變量的個(gè)數(shù),用少數(shù)因子代表多個(gè)原始變量

  (4)因子數(shù)量的確定

  用公因子方差貢獻(xiàn)率提取:與主成分分析類似,一般累計(jì)方差貢獻(xiàn)率達(dá)到80%以上的前幾個(gè)因子可以作為最后的公因子

  用特征根提取:一般要求因子對(duì)應(yīng)的特征根要大于1,因?yàn)樘卣鞲∮?說明該共因子的解釋力度太弱,還不如使用原始變量的解釋力度大

  實(shí)際應(yīng)用中,因子的提取要結(jié)合具體問題而定,在某種程度上,取決于研究者自身的知識(shí)和經(jīng)驗(yàn)

  (5)主成分分析和因子分析都是多元分析中處理降維的兩種統(tǒng)計(jì)方法。只有當(dāng)原始數(shù)據(jù)中的變量之間具有較強(qiáng)的相關(guān)關(guān)系時(shí),降維的效果才會(huì)明顯,否則不適合進(jìn)行主成分分析和因子分析

  主成分和因子的選擇標(biāo)準(zhǔn)應(yīng)結(jié)合具體問題而定。在某種程度上取決于研究者的知識(shí)和經(jīng)驗(yàn),而不是方法本身

  即使得到了滿意的主成分或因子,在運(yùn)用它們對(duì)實(shí)際問題進(jìn)行評(píng)價(jià)、排序等分析時(shí),仍然要保持謹(jǐn)慎,因?yàn)橹鞒煞趾鸵蜃赢吘故歉叨瘸橄蟮牧浚瑹o論如何,它們的含義都不如原始變量清晰

  因子分析可以看作是主成分分析的推廣和擴(kuò)展,而主成分分析則可以看作是因子分析的一個(gè)特例。目前因子分析在實(shí)際中被廣泛應(yīng)用,而主成分分析通常只作為大型統(tǒng)計(jì)分析的中間步驟,幾乎不再單獨(dú)使用。


【考研統(tǒng)計(jì)學(xué)有哪些知識(shí)要點(diǎn)】相關(guān)文章:

學(xué)好統(tǒng)計(jì)學(xué)的方法有哪些11-13

java基礎(chǔ)要點(diǎn)有哪些09-26

科目二考試要點(diǎn)有哪些07-21

科目一考試要點(diǎn)有哪些04-15

雅思寫作試題有哪些檢查要點(diǎn)11-10

新手上路有哪些注意要點(diǎn)04-03

科目四考試復(fù)習(xí)要點(diǎn)有哪些10-01

科目二考試有哪些關(guān)鍵要點(diǎn)07-02

科目一理論考試要點(diǎn)有哪些10-29

考研英語常見短語有哪些08-19