​​【信息科学与工程学】【数据科学】数据科学领域 第十二篇 大数据主要算法02

Apache Spark 函数、参数、算法及跨领域技术整合

一、Apache Spark 核心函数分类与参数列表

1. 转换操作(Transformations)函数

函数类别 函数名称 参数列表 用途 返回类型 是否惰性执行
映射函数 map f: T => U, preservesPartitioning: Boolean = false 对每个元素应用函数 RDD[U]
扁平映射 flatMap f: T => TraversableOnce[U] 对每个元素应用函数并扁平化结果 RDD[U]
过滤 filter f: T => Boolean 过滤满足条件的元素 RDD[T]
映射分区 mapPartitions f: Iterator[T] =&g
© 版权声明

相关文章