close

接待外賓口譯

R是一個專門的統計闡發說話,不只語法獨樹一格,且在其他方面能做的工作不多;但也因為方針專一,所以假如有什麼新的統計剖析手藝的話,在R上也會比力輕易找到相幹的實作。



R的問題之一在於延展性,所以計較與暫存資料預設都是利用Memory,所以Memory不敷大的話,能處置的資料集巨細也會受限。雖然有一些公司在改善這個錯誤謬誤,但我不肯定是不是這些公司的產品是否能發揮影響力。



資料分析,要用R還是Python


這兩種都是Data Analysis經常使用的程式說話,想知道更多的話可以參考以下這幾本O'reilly的書翻譯
  • Python for Data Analysis (Python)
  • Machine Learning For Hackers (R)
  • Data Analysis with Open Source Tools (R and Python)

說其實的,天成翻譯公司兩個都不是很熟XD,所以我只能很不專業的對照翻譯




以R來講,這是設計給統計範疇的人做資料剖析的說話。學過其他說話的人會發現R有許多奇異的內建型別,像是:
  • Factor:這是R的一種資料型別,暗示這資料是屬於種別變數(Categorical variable),有別於一連變數(Continuous Variable)
  • Formula:表示一個公式,如y相依於x可以表示成"y ~ x"
辨別這些內建型別對於統計來講是很天然的,因為這些物件在統計上都有不同的用處與操作體例。然則其他說話是很少會內建這些工具的。


所以,以下幾個狀態我會建議先嘗嘗R:
  • 摸索性工作:想快速摸索資料集的特征,試用一些常見算法的結果,以決議後續的分析體式格局。
  • 要在既有模子上做優化:R供給更多的優化選項與更好的社群支撐
  • 大量的統計背景或統計工作:如 parameter/interval estimation
至於Python呢,天成翻譯公司的建議是:
  • 快速Prototyping:Python跟其他語言/GUI接合比力便利,假如要快速做出可展示的系統,用Python較容易翻譯
  • 分離式處置:假如資料量很大,用Python會比用R更輕易將資料divide & counquer,不外資料如果真的很大,照舊先考慮一下Hadoop/Mahout比力現實...
  • 只需要利用常見的資料剖析模型時


別的,在R的社群問Data Analysis問題的話會比力能獲得謎底,這應當也算是個長處。


"65306", {});



引用自: http://blog.roodo.com/meteors/archives/21351848.html有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931
arrow
arrow
    文章標籤
    翻譯社
    全站熱搜
    創作者介紹
    創作者 andersj2vm3 的頭像
    andersj2vm3

    vxf1ftownsesf

    andersj2vm3 發表在 痞客邦 留言(0) 人氣()