加入兩個用 textFile() 讀取的檔案

加入 Spark:

  • 閱讀 textFile 1

    val txt1=sc.textFile(path="/path/to/input/file1") 
    

    例如:

      A B
      1 2
      3 4
    
  • 閱讀 textFile 2

    val txt2=sc.textFile(path="/path/to/input/file2") 
    

    例如:

      A C
      1 5
      3 6
    
  • 加入並列印結果。

    txt1.join(txt2).foreach(println)
    

    例如:

      A B C
      1 2 5
      3 4 6
    

上面的連線基於第一列。