spark生成表格套用公式是什么

這期內容當中小編將會給大家?guī)碛嘘Pspark生成表格套用公式是什么,文章內容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都網站制作、做網站、企業(yè)官網、英文網站、手機端網站、網站推廣等服務,滿足客戶于互聯(lián)網時代的封丘網站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網解決方案。努力成為您成熟可靠的網絡建設合作伙伴!

IndexABCD
110288
29   
38   

簡化業(yè)務描述后,需求為:

有表格如上,A列及第一行可以直接給出,其余空白字段要求按公式算出。

公式:

1) B[x] = A[x]-1

2) C[x] = A[x] - B[x]

3) D[x] = (C[x]+D[x-1])/2   //(上一行同列+本行前一列)/2

計算后的表格值應為:

IndexABCD
110288
29725
38444.5

代碼

import org.apache.spark.rdd.RDD
import org.apache.spark.sql.types._
import org.apache.spark.sql.{Row, SparkSession}

val schema = StructType(
  List(
    StructField("ID", DoubleType, true),
    StructField( "A", DoubleType, true),
    StructField( "B", DoubleType, true),
    StructField( "C", DoubleType, true),
    StructField( "D", DoubleType, true)
  )
)


val data1: RDD[Row] = spark.sparkContext.parallelize(
  Seq(
    Row(1.0,10.0,2.0,8.0,8.0)
  )
)

val df1 = spark.createDataFrame(data1, schema)
df1.createOrReplaceTempView("df1")

val data2: RDD[Row] = spark.sparkContext.parallelize(
  Seq(
    Row(1.0,9.0,null,null,null)
  )
)

val df2 = spark.createDataFrame(data2, schema)
df2.createOrReplaceTempView("df2")

def func_1(x: Int) = {
  x - 1
}

def func_2(x:Int,y:Int):Int = {
  x - func_1(y)
}

def func_3(x:Int,y:Int,z:Int):Int = {
  (x+func_2(y,z))/2
}

spark.udf.register("func_1", func_1 _)
spark.udf.register("func_2", func_2 _)
spark.udf.register("func_3", func_3 _)

spark.sql(
    """
      |select 
      |    df2.ID,
      |    df2.A,
      |    func_1(df1.D) as B,
      |    func_2(df2.A,df1.D) as C,
      |    func_3(df1.D,df2.A,df1.D) as D 
      |from df2 inner join df1 on df1.ID = df2.ID
      |
    """.stripMargin).show()

上述就是小編為大家分享的spark生成表格套用公式是什么了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

當前標題:spark生成表格套用公式是什么
網站URL:http://bm7419.com/article46/pcogeg.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供網站設計、定制網站、標簽優(yōu)化軟件開發(fā)、域名注冊商城網站

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網站優(yōu)化