spark

pyspark文件读写示例-(CSV/JSON/Parquet-单个或多个)

本文列举一些pyspark文件读写的示例代码 # 创建或获取会话 import pyspark from pyspark.sql import SparkSession spark = SparkSession.builder.appName('Python Spark SQL example').getOrCreate() 读取单个文件 CSV csv_path = '/home/ghost/workdata/patients.csv' df_patient = spark.read.format('csv')\ .option('header', 'true')\ .option('inferSchema', 'true')\ .load(csv_path) # 打印 dataframe 架构 df_patient.printSchema() root |-- patient_id:...