运维开发网

r

0
  • 在RHEL 6.5上安装RPostgreSQL libpq-fe.h错误

    我有RHEL 6.5服务器,安装了R(3.1.1)& RStudioServer(0.98.1062) 我已经安装了postgresql-9.3并处理了一个大型数据库.为了将R连接到PostgreSQL,我以前使用过RPostgreSQL(仍然在我的CentOS 7工作站上).但是,尝试[详细]

    2020-03-17 14:45 分类:Linux
  • 如何使用Python(scikit-learn)计算FactorAnalysis得分?

    我需要进行探索性因子分析,并使用 Python计算每个观察的分数,假设只有1个潜在因素.似乎sklearn.decomposition.FactorAnalysis()是要走的路,但遗憾的是[详细]

    2020-03-17 11:18 分类:Python
  • SparkR

    简介 SparkR是一个提供从R中使用Spark的轻量级前端的R包。在Spark1.6以后,SparkR提供了分布式数据框,它支持selection,filtering,aggregation等操作。也支持使用MLlib分布式机器学习。 SparkR数据框 类似于R中的数据框,数据源有结构化数...[详细]

    2020-03-16 16:37 分类:大数据
  • 我们如何将整数分成R中其组成数字的向量

    我认为一个例子应该让事情变得清晰. 我有 a_1 = 6547 我想要一些将a_1变换为以下a_2的函数 a_2 = c(6, 5, 4, 7) 转换为字符然后拆分就可以了 a <- 6547 as.numeric(strsplit(as.character(a), "")[[1]]) ## [1] 6 5 4 7[详细]

    2020-03-16 13:27 分类:编程语言
  • [原]数据科学教程:R语言与NoSQL

    介绍 现代化数据科学中的 DataFrame 概念源起R语言,而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不过在实际的网络数据通讯中,类似DateFrame这样的格式却并不是主流,真正主流的方式其实是JSON(JavaScript Object Notation)...[详细]

    2020-03-13 20:46 分类:大数据
  • R或Python中的CHAID决策树

    我已经使用SPSS生成一个CHAID树.它对连续变量进行自动分级并返回卡方值和自由度,这在R.Below的汇总函数中找不到是一个部分样本输出.[详细]

    2020-03-13 18:38 分类:Python
  • R中的文本处理和预处理有哪些强大的工具?

    我经常使用Hadley的包装字符串来清理杂乱的生态数据(标准化物种名称,格式不佳的标签等).最近我开始学习sed和awk,并被这些工具的强大程度所震撼,特别是在处理大量数据文件时.[详细]

    2020-03-13 13:06 分类:Linux
  • R-3.1.1 编译安装2

    1:下载解压 [jifeng@feng03 r]$ wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.1.1.tar.gz --2015-09-29 21:53:37-- http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.1.1.tar.gz Resolving mirror.bjtu.edu.[详细]

    2020-03-11 20:17 分类:大数据
  • 在Python中长时间运行的决策树模型

    我正在使用R中的rpart包运行我的决策树模型.这是我正在做的, >使用read.csv加载我的数据>删除不需要的列>将我的数据集拆分为训练和测试>在训练集上拟合我的模型 – 这一整天都在运行.[详细]

    2020-03-11 18:19 分类:Python
  • 2014年大数据市场趋势十大预测

    2014年大数据市场趋势十大预测 大数据是2013年热度最高的技术词汇,这一年大数据市场也实现了高速增长,越来越多的企业开始拥抱大数据解决方案,而随着生态系统的日益成熟,Hadoop也不再是天才技术人员的玩具,而是数据科学家和业务人员手...[详细]

    2020-03-10 15:22 分类:大数据