温馨提示:本文翻译自stackoverflow.com,查看原文请点击:其他 - How to concatenate spark dataframe columns using Spark sql in databricks
apache-spark apache-spark-sql azure-databricks

其他 - 如何在Databricks中使用Spark SQL连接Spark DataFrame列

发布于 2020-04-20 11:04:49

我在数据框中有两列分别称为“ FirstName”和“ LastName”,如何将这两列连接为一个。

  |Id  |FirstName|LastName|
  |  1 |    A    |   B    |
  |    |         |        |
  |    |         |        |

我要这样

|Id |FullName |
| 1 |    AB   |     
|   |         |       
|   |         | 

我的查询看起来像这样,但是会引发错误

val kgt=spark.sql("""
Select Id,FirstName+' '+ContactLastName AS FullName from tblAA """)

kgt.createOrReplaceTempView("NameTable")

查看更多

提问者
Yonas Haile
被浏览
8
venus 2020-02-05 17:38

这里我们使用Spark SQL解决方案:

spark.sql("select Id, CONCAT(FirstName,' ',LastName) as FullName from NameTable").show(false)

要么

spark.sql( " select Id, FirstName || ' ' ||LastName as FullName from NameTable ").show(false)