色吊丝永久性观看网站,欧美日韩一区二区三区视频播放 ,欧美在线,亚洲综合,日本人牲交bbbxxxx,欧美性猛交ⅹxxx乱大交妖精

信用卡視角下的回歸模型

寫在前面:


犬子留學(xué)前在跟我交流中提到,他不想學(xué)信用卡。我對他說,我并沒有指望所謂的“子承父業(yè)”,只是我用了很多信用卡業(yè)務(wù)中的案例給他講了一些問題。經(jīng)過幾年的學(xué)習(xí)后,他發(fā)現(xiàn)在他的專業(yè)課中,越來越多地接觸到了與信用卡有關(guān)的知識,于是自己主動與我探討一些信用卡領(lǐng)域的話題,這讓我既感到驚訝,又感到高興。我不是一個(gè)強(qiáng)求孩子做什么、學(xué)什么的父親,只是希望他學(xué)什么都能找到自己的快樂,并在快樂中尋找自己未來的方向。既然他自己對信用卡產(chǎn)生了濃厚的興趣,作為從業(yè)二十載的我來說,還有什么比這個(gè)更值得我欣慰的呢!經(jīng)過鼓勵,他終于開辟了自己的公眾號,也第一次以他自己的視角,寫出他學(xué)習(xí)有關(guān)知識之后對于信用卡的思考。雖然這篇文章與我研究的方向截然不同,還非常稚嫩,為他開辟專欄,期待信用卡行業(yè)中的相關(guān)領(lǐng)域的叔叔阿姨、哥哥姐姐們給予指正和輔導(dǎo)。


金屬質(zhì)感分割線


ISLR(3.3)-信用卡視角下的回歸模型


在真實(shí)世界中,線性回歸模型中不只有定量變量,還有定性變量。


1. 信用卡數(shù)據(jù)集中的潛在客戶信息

image.png

預(yù)測變量的類別 = 2

假設(shè)我們想調(diào)查研究【男性和女性客戶的信用卡債務(wù)差異】,暫時(shí)忽略其他變量


如果一個(gè)定性預(yù)測變量(factor)只有兩個(gè)類別(levels)

建立一個(gè)啞變量(dummy variable)擁有兩個(gè)可能的取值

基于性別變量(gender)創(chuàng)建一個(gè)新變量

image.png


Incorporate this variable as a predictor in the regression equation:


image.png

此時(shí)? 可以解釋為男性的平均信用卡債務(wù), 是女性的平均信用卡債務(wù),因此? 即是男性和女性之間信用卡債務(wù)的平均差異

image.png


上圖列出了「0/1編碼」的系數(shù)估計(jì)值和與模型相關(guān)的其他信息,啞變量的高「p-value」表明兩性之間的信用卡平均債務(wù)差異「并沒有」統(tǒng)計(jì)學(xué)證據(jù)


無論使用哪種編碼方式,在最后的預(yù)測中,男性和女性的信用卡債務(wù)數(shù)額是不變的

不同的編碼方式的唯一區(qū)別在于對系數(shù)的解釋不同

預(yù)測變量的類別 > 2

假設(shè)我們想調(diào)查研究【不同種族背景和信用卡債務(wù)的關(guān)系】,暫時(shí)忽略其他變量


如果一個(gè)定性預(yù)測變量有多個(gè)類別(亞洲人、白人、非裔美國人)

建立一個(gè)啞變量不夠,需要兩個(gè):

image.png


建立多元回歸模型:

image.png


?是非裔美國人的信用卡平均債務(wù),因?yàn)槭菦]有啞變量的類別,作為「baseline」


「 & 」 被解釋為亞洲人和白種人與非裔美國人的平均信用卡債務(wù)「差異」

image.png

據(jù)估計(jì),盡管亞洲人和白種人分別比非裔美國人的信用卡債務(wù)(531美元)少18.69美元和12.50美元:


但是兩個(gè)啞變量單獨(dú)的系數(shù)估計(jì)的p值非常大

「沒有」統(tǒng)計(jì)學(xué)證據(jù)證明不同的種族背景有真正的信用卡的債務(wù)差異

不同的啞變量的編碼會影響變量的系數(shù)和p值,但不會改變F值:


用F-test假設(shè)檢驗(yàn)image.png? 得到「p-value=0.96」

無法拒絕債務(wù)和族群背景無關(guān)的假設(shè)


2. 線性模型的擴(kuò)展

線性回歸模型提供了可解釋的結(jié)果,但同時(shí)有很多高度限制性的假設(shè)在實(shí)踐中被違背:


「可加性(additive)」: 的變化對? 產(chǎn)生的影響與其它預(yù)測變量的取值無關(guān)

「線性(linear)」: 無論? 取何值,其變化一個(gè)單位對應(yīng)的? 的變化是恒定的

通過放寬這兩個(gè)假設(shè)的方法來擴(kuò)展線性模型


去除可加性假設(shè)

營銷中的協(xié)同(synergy)效應(yīng),即統(tǒng)計(jì)學(xué)中的交互作用(interaction):


在兩種媒體上「均分預(yù)算」可能比將資金全部投入其中一種媒體更能「增加銷售量」

在擴(kuò)展線性模型中,加入 「交互項(xiàng) 」 來放寬可加性假設(shè):


image.png


?的變化將影響 ,所以? 對? 的效應(yīng)不再是常數(shù)


假設(shè)希望用定量的收入()和定性的學(xué)生身份()預(yù)測信用卡債務(wù):


「若沒有交互項(xiàng)」

image.png



模型為數(shù)據(jù)擬合了兩條平行線,斜率為


在這種情況下,平行線意味著income增加對balance的影響不依賴信用卡持有者是否為學(xué)生

這意味著模型可能有嚴(yán)重的局限性,因?yàn)槭聦?shí)上「是否是學(xué)生的身份」影響著收入的變化「是否」對信用卡債務(wù)產(chǎn)生「很大的影響」

「加入交互項(xiàng)」

image.png



兩條回歸直線有不同的截距和斜率:


學(xué)生回歸線的斜率低于非學(xué)生回歸線的斜率

與非學(xué)生群體相比,收入增加在學(xué)生群體中引起的信用卡債務(wù)的增加會更緩慢,數(shù)額更少

image.png

非線性關(guān)系(當(dāng)理想遇到現(xiàn)實(shí))

多項(xiàng)式回歸直接擴(kuò)展線性模型,使之能對非線性關(guān)系進(jìn)行擬合

image.png「油耗和馬力的非線性關(guān)系」

由數(shù)據(jù)可視化推測油耗和馬力是非線性相關(guān)的:


使用預(yù)測變量的轉(zhuǎn)化值將非線性因素加工進(jìn)線性模型中

數(shù)據(jù)點(diǎn)呈現(xiàn)出二次方的曲線形狀,嘗試二次項(xiàng)(注意:仍是線性!)模型可能會提供更好的擬合(: 0.606 =>0.688):

image.png

嘗試馬力的三次、四次甚至五次項(xiàng)納入模型后,發(fā)現(xiàn)最后的擬合有不必要的波動

目前還不清楚添加的多項(xiàng)式函數(shù)是否真的帶來了更好的數(shù)據(jù)擬合(是否會導(dǎo)致過擬合?)

3. 參考:

Introduction to Statistical Learning (ISL)

《老董聊卡》

TOGO: 信用卡額度和信用評級的高度共線性問題


- 正文結(jié)束 -
首頁 信用卡 用卡攻略 信用卡視角下的回歸模型

上一篇:

下一篇:

為您推薦

微信號:

點(diǎn)擊復(fù)制