公正推薦[問題類型]:
R 語言讀取長短不一的序列資料問題
[軟體熟習度]:
入門(對 R 語法不太熟習)
[問題論述]:
今朝想讀取 22 萬筆序列資料(input.csv)以下花式:
a翻譯社b,c翻譯社a,gcc翻譯社aka,c,t
a,b翻譯社c,g,gcc,a,nv,qc,c翻譯社ntt,ntt1,ntt2,g翻譯社ncc,nv
a,sgt,c翻譯社a,org翻譯社com,ggc翻譯社bbc,qc,c,b,ncc翻譯社gov,gov翻譯社gov,ntt1,ntt2,fb,app翻譯社la,d,e,fb翻譯社fe
t,
a翻譯社b,c翻譯社a,gcc,d,sgt,c翻譯社fet,1394,1394,1394翻譯社fet,fet翻譯社org
a,sgt翻譯社c,org
...
每筆資料長短不同,最長為 10,143 個項目;最短 2 個項目翻譯
若是直接用 read.csv 或 read.table 讀取的話沒法將全部的數列儲存為 data.frame,
最大只有 71 行,別的就是本來同一行的資料會被拆成 2 行。
> dim(input)
[1] 210220 71
# 只能讀 71 行,且資料少 48,333 筆
> view(input)
57 a b a c c c 1394 c c c org c c c c 1394 ..
.
58 skt skt skt skt
# 57翻譯社 58 在原始資料為統一筆(列)
想請問有沒有更好的資料讀取體例?
後續想接 seqHMM 設立建設隱馬可夫模子, seqHMM 會呼叫 seqdef {TraMineR} 將 data.fra
me 轉換成模子的輸入花式
感謝列位先輩的協助。感激 =)
--
Sent from my Windows
本文出自: https://www.ptt.cc/bbs/R_Language/M.1496627319.A.360.html有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931
- Sep 10 Mon 2018 07:58
[問題] R 說話讀取序列資料
文章標籤
全站熱搜
留言列表
發表留言