pbootcms网站模板|日韩1区2区|织梦模板||网站源码|日韩1区2区|jquery建站特效-html5模板网

R語言 出現(xiàn)矩陣/缺失值的解決方案

這篇文章主要介紹了R語言 出現(xiàn)矩陣/缺失值的解決方案,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

缺失值處理一般包括三步:

1. 識別缺失數(shù)據(jù);

2. 檢查導(dǎo)致數(shù)據(jù)缺失的原因;

3. 刪除包含缺失值的實例或用合理的數(shù)值代替(插補)缺失值。

1.判斷缺失值

函數(shù)is.na()、is.nan()和is.infinite()可分別用來識別缺失值、不可能值和無窮值。每個返回結(jié)果都是

TRUE或FALSE

na表示缺失值

nan表示NOT A NUMBER

infinite表示+-Inf

一定要親手試x = 0/0,以及x = 1/0


>x <- NA
> is.na(x)
[1] TRUE
> is.nan(x)
[1] FALSE
> is.infinite(x)
 [1] FALSE

函數(shù)complete.cases()可用來識別矩陣或數(shù)據(jù)框中沒有缺失值的行

超級好用


#加載數(shù)據(jù)集
>data(sleep,package = "VIM")
#沒有缺失值的行
>sleep[complete.cases(sleep),]
#列出有一個或多個缺失值的行
>sleep[!complete.cases(sleep),]

2.圖形探究缺失數(shù)


#自己生成圖形
>library("VIM")
>aggr(sleep,prop = FALSE,numbers = TRUE)

matrixplot()函數(shù)可生成展示每個實例數(shù)據(jù)的圖形


#自己生成圖形
marginplot(sleep[c("Gest","Dream")],phc=c(20),col=c("darkgray","red","blue"))

3.刪除缺失值

函數(shù)complete.cases()可以用來存儲沒有缺失值的數(shù)據(jù)框或者矩陣形式的實例(行):


#可以把mydata替換成sleep,延續(xù)上面的代碼
>newdata <- mydata[complete.cases(mydata),]

同樣的結(jié)果可以用na.omit函數(shù)獲得:


#可以把mydata替換成sleep,延續(xù)上面的代碼
>newdata <- na.omit(mydata)

兩行代碼表示的意思都是:mydata中所有包含缺失數(shù)據(jù)的行都被刪除,然后結(jié)果才存儲到newdata中,以后擬合就用新數(shù)據(jù)newdata.

處理含缺失值的數(shù)據(jù)集時,成對刪除常作為行刪除的備選方法使用。對于成對刪除,觀測只是當(dāng)它含缺失數(shù)據(jù)的變量涉及某個特定分析時才會被刪除:


>cor(sleep,use = "pairwise.complete.obs")

3.1補全缺失值

函數(shù)mice()首先從一個包含缺失數(shù)據(jù)的數(shù)據(jù)框開始,然后返回一個包含多個(默認為5個)完整數(shù)據(jù)集的對象。

每個完整數(shù)據(jù)集都是通過對原始數(shù)據(jù)框中的缺失數(shù)據(jù)進行插補而生成的。

由于插補有隨機的成分,因此每個完整數(shù)據(jù)集都略有不同。

然后,with()函數(shù)可依次對每個完整數(shù)據(jù)集應(yīng)用統(tǒng)計模型(如線性模型或廣義線性模型),最 后 ,pool()函數(shù)將這些單獨的分析結(jié)果整合為一組結(jié)果。

最終模型的標(biāo)準(zhǔn)誤和p值都將準(zhǔn)確地反映出由于缺失值和多重插補而產(chǎn)生的不確定性。


>library(mice)
>data("sleep",package = "VIM")
>imp <- mice(sleep,seed = 1234)
#imp <- mice(sleep)
>fit <- with(imp,lm(Dream~Span+Gest))
fit
>pooled <- pool(fit)
>summary(pooled)
imp
>dataset2 <- complete(imp,action = 2)
>cor(sleep,use = "pairwise.complete.obs")

dataset2 is the newData

下圖為完整缺失值處理圖片:

補充:R語言讀取數(shù)據(jù)空值

一、Txt文件

1. 文件中的內(nèi)容有雙引號,空值的時候是一對雙引號

filename.txt 文件內(nèi)容形如:

"ID" "ITEM"

"1080254842" "漢字"

"1080254842" "中文"

"1080594798" ""

"1080594798" ""

導(dǎo)入數(shù)據(jù):


test <-read.table("filename.txt",header=TRUE)

空值部分并不是NA,R語言不會把他識別為NA,改為下面的語句,即可解決。


test <-read.table("filename.txt",header=TRUE,na.strings = "")

2. 文件中內(nèi)容無雙引號,空值即直接空白,形如下面:

ID ITEM

1080254842 漢字

1080254842 中文

1080594798

1080594798

導(dǎo)入數(shù)據(jù):


test <-read.table("filename.txt",header=TRUE)

會出現(xiàn)錯誤:Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :3行沒有2元素

第三行第二元素沒有。

修改為如下即可:


test <-read.table("filename.txt",header=TRUE,fill=TRUE)

導(dǎo)入數(shù)據(jù)成功,但是,空值仍然不是NA,還需加上na.strings = "",


test <-read.table("filename.txt",header=TRUE, fill=TRUE, na.strings = "")

成功導(dǎo)入。

二、csv文件


test <-read.csv("test.csv",header=TRUE,sep=",",na.strings = "")

其中:

header =TRUE,表示把第一行作為標(biāo)題。

sep=",",因為csv文件的列是用逗號分開的,加上sep=",",幫助R通過識別逗號來分割列。如果沒加,會出現(xiàn)原本多列數(shù)據(jù)導(dǎo)入后變?yōu)橐涣械那闆r。

na.strings = "":處理缺失值問題。

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持html5模板網(wǎng)。如有錯誤或未考慮完全的地方,望不吝賜教。

【網(wǎng)站聲明】本站部分內(nèi)容來源于互聯(lián)網(wǎng),旨在幫助大家更快的解決問題,如果有圖片或者內(nèi)容侵犯了您的權(quán)益,請聯(lián)系我們刪除處理,感謝您的支持!

相關(guān)文檔推薦

這篇文章主要介紹了R語言入門教程之刪除指定數(shù)據(jù)的方法,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
這篇文章主要介紹了R語言及其IDE(RStudio)下載安裝詳細流程,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
這篇文章主要給大家介紹了關(guān)于R語言數(shù)據(jù)可視化學(xué)習(xí)之圖形參數(shù)修改的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下
這篇文章主要給大家介紹了關(guān)于R語言利用plot()函數(shù)畫圖的基本用法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來
這篇文章主要介紹了R語言中對數(shù)據(jù)框的列名重命名的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)
這篇文章主要介紹了詳解R語言中的表達式、數(shù)學(xué)公式、特殊符號,本文給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下
主站蜘蛛池模板: 电加热导热油炉-空气加热器-导热油加热器-翅片电加热管-科安达机械 | 西门子气候补偿器,锅炉气候补偿器-陕西沃信机电工程有限公司 | 工业胀紧套_万向节联轴器_链条-规格齐全-型号选购-非标订做-厂家批发价格-上海乙谛精密机械有限公司 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | 深圳3D打印服务-3D打印加工-手板模型加工厂-悟空打印坊 | 组织研磨机-高通量组织研磨仪-实验室多样品组织研磨机-东方天净 传递窗_超净|洁净工作台_高效过滤器-传递窗厂家广州梓净公司 | 汽液过滤网厂家_安平县银锐丝网有限公司| 济南电缆桥架|山东桥架-济南航丰实业有限公司 | 建筑资质代办-建筑资质转让找上海国信启航 | 武汉森源蓝天环境科技工程有限公司-为环境污染治理提供协同解决方案 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 盘扣式脚手架-附着式升降脚手架-移动脚手架,专ye承包服务商 - 苏州安踏脚手架工程有限公司 | 压滤机-洗沙泥浆处理-压泥机-山东创新华一环境工程有限公司 | 济南铝方通-济南铝方通价格-济南方通厂家-山东鲁方通建材有限公司 | 棉柔巾代加工_洗脸巾oem_一次性毛巾_浴巾生产厂家-杭州禾壹卫品科技有限公司 | 酒吧霸屏软件_酒吧霸屏系统,酒吧微上墙,夜场霸屏软件,酒吧点歌软件,酒吧互动游戏,酒吧大屏幕软件系统下载 | 会议会展活动拍摄_年会庆典演出跟拍_摄影摄像直播-艾木传媒 | 托盘租赁_塑料托盘租赁_托盘出租_栈板出租_青岛托盘租赁-优胜必达 | 优宝-汽车润滑脂-轴承润滑脂-高温齿轮润滑油脂厂家 | 济南办公室装修-厂房装修-商铺装修-工装公司-山东鲁工装饰设计 | 365文案网_全网创意文案句子素材站 | 中医治疗皮肤病_潍坊银康医院「山东」重症皮肤病救治平台 | 民用音响-拉杆音响-家用音响-ktv专用音响-万昌科技 | 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | 书信之家_书信标准模板范文大全| 招商帮-一站式网络营销服务|互联网整合营销|网络推广代运营|信息流推广|招商帮企业招商好帮手|搜索营销推广|短视视频营销推广 | 喷播机厂家_二手喷播机租赁_水泥浆洒布机-河南青山绿水机电设备有限公司 | 玉米深加工机械,玉米加工设备,玉米加工机械等玉米深加工设备制造商-河南成立粮油机械有限公司 | 鑫铭东办公家具一站式定制采购-深圳办公家具厂家直销 | 翻斗式矿车|固定式矿车|曲轨侧卸式矿车|梭式矿车|矿车配件-山东卓力矿车生产厂家 | SMC-ASCO-CKD气缸-FESTO-MAC电磁阀-上海天筹自动化设备官网 | 代做标书-代写标书-专业标书文件编辑-「深圳卓越创兴公司」 | hc22_hc22价格_hc22哈氏合金—东锜特殊钢| 江苏大隆凯科技有限公司 | 三佳互联一站式网站建设服务|网站开发|网站设计|网站搭建服务商 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 嘉兴泰东园林景观工程有限公司_花箱护栏 | 橡胶接头_橡胶软接头_可曲挠橡胶接头-巩义市创伟机械制造有限公司 | 盘煤仪,盘料仪,盘点仪,堆料测量仪,便携式激光盘煤仪-中科航宇(北京)自动化工程技术有限公司 | 黑龙江京科脑康医院-哈尔滨精神病医院哪家好_哈尔滨精神科医院排名_黑龙江精神心理病专科医院 | 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 中空玻璃生产线,玻璃加工设备,全自动封胶线,铝条折弯机,双组份打胶机,丁基胶/卧式/立式全自动涂布机,玻璃设备-山东昌盛数控设备有限公司 |