运维开发网

从scala中的数据框添加两列

运维开发网 https://www.qedev.com 2020-07-28 16:42 出处:网络 作者:运维开发网整理
我有两列年龄和薪水存储在DF中.我只想编写一个 scala代码来逐列添加这些值.我试过了 val age_1 = df.select("age") val salary_1=df.select("salary") val add = age_1+salary_1 给我错误.请帮忙 在下面的spark是SparkSession的一个实例,因此导入必须在spark实例化之后. 这里可以通过导入spar
我有两列年龄和薪水存储在DF中.我只想编写一个 scala代码来逐列添加这些值.我试过了

val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1

给我错误.请帮忙

在下面的spark是SparkSession的一个实例,因此导入必须在spark实例化之后.

这里可以通过导入spark implicits来使用$-notation

import spark.implicits._

然后使用$-notation

val add = df.select($"age" + $"salary")

最终的scala代码:

import spark.implicits._
val add = df.select($"age" + $"salary")

Apache doc

0

精彩评论

暂无评论...
验证码 换一张
取 消