scala-集合

集合

Scala的集合有三大类:

序列Seq、集Set、映射Map

所有的集合都扩展自Iterable特质。对于几乎所有的集合类

Scala都同时提供了可变和不可变的版本

可变集合

可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。

不可变集合

永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。

但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变,

所以这里的不可变并不是变量本身的值不可变,而是变量指向的那个内存地址不可变

集合特质

— scala.collection.immutable

image

— scala.collection.mutable

image

数组(array)

严格意义上,数组不是集合

scala中给数组一个特定的类型:Array

构建Scala中的数组,其实等同于构造Java的数组

不可变数组

基本语法

  • 数组定义

    // 集合分为两大类:可变集合,不可变集合
    // Scala默认提供的集合都是不可变。
    //        val array = new Array[String](3)
    //        array(0) = "a"
    //        array(1) = "a"
    //        array(2) = "a"
    // 使用集合的伴生对象构建集合,并同时初始化
    val array1 = Array(1,2,3,4)
    val array2 = Array(5,6,7,8)
    //val array2 = Array.apply(1,2,3,4)
    
  • 数组赋值

    • 修改某个元素的值

      arr01(3) = 10
      val i = 10
      arr01(i/3) = 20
      
    • 采用方法的形式修改数组的值

      arr01.update(0,1)
      
  • 遍历数组

    • 查看数组

      println(arr01.mkString(","))
      
    • 普通遍历

      for (i <- arr01) {
      	println(i)
      }
      
    • 简化遍历

      def printx(elem:Int): Unit = {
      	println(elem)
      }
      arr01.foreach(printx)
      arr01.foreach((x)=>{println(x)})
      arr01.foreach(println(_))
      arr01.foreach(println)
      

基本操作

  • 添加数组元素,创建新数组
val arr1 = Array(1,2,3,4)
val arr3: Array[Int] = arr1 :+ 5
println( arr1 eq arr3 ) // false
arr3.foreach(println)
// 12345
  • 添加集合
val arr1 = Array(1,2,3,4)
val arr2 = Array(5,6,7,8)
val arr5: Array[Int] = arr1 ++ arr2    
arr5.foreach(println)
// 12345678
  • 多维数组
var myMatrix = Array.ofDim[Int](3,3)
myMatrix.foreach(list=>println(list.mkString(",")))
//    0,0,0
//    0,0,0
//    0,0,0
  • 合并数组
val arr1 = Array(1,2,3,4)
val arr2 = Array(5,6,7,8)
// 合并数组
val arr6: Array[Int] = Array.concat(arr1, arr2)
arr6.foreach(println)
// 12345678
  • 创建指定范围的数组
// 创建指定范围的数组
val arr7: Array[Int] = Array.range(0,2)
arr7.foreach(println)
// 01
  • 创建并填充指定数量的数组
val arr8:Array[Int] = Array.fill[Int](5)(-1)
arr8.foreach(println)

可变数组

基本语法

  • 创建可变数组
val buffer = new ArrayBuffer[String]()
val buffer = ArrayBuffer("a", "b", "c")
println(buffer)
// ArrayBuffer(a, b, c)
  • 增加数据
buffer.append("a", "b", "c", "d")
// ArrayBuffer(a, b, c, a, b, c, d)
buffer.appendAll(Array("a", "b", "c"))
// ArrayBuffer(a, b, c, a, b, c, d, a, b, c)


val buffer1 = ArrayBuffer(1,2,3,4)
val buffer2 = ArrayBuffer(5,6,7,8)
val buffer3: ArrayBuffer[Int] = buffer1 += 5
println( buffer1 eq buffer3 ) // true

// 使用 ++ 运算符会产生新的集合数组
val buffer4: ArrayBuffer[Int] = buffer1 ++ buffer2
// 使用 ++= 运算符会更新之前的集合,不会产生新的数组
val buffer5: ArrayBuffer[Int] = buffer1 ++= buffer2
println( buffer1 eq buffer4 ) // false
println( buffer1 eq buffer5 ) // true
  • 修改数据
buffer.update(0, "e")
buffer(0) = "e"
  • 删除数据
val buffer = ArrayBuffer("a", "b", "c")
buffer.remove(2) // ArrayBuffer(a, b)
val buffer = ArrayBuffer("a","b","c","a","b","c","d")
buffer.remove(2,2) // ArrayBuffer(a, b, b, c, d)


val strings: ArrayBuffer[String] = buffer - "a"
println(buffer eq strings)
println(buffer)
println(strings)

// false
// ArrayBuffer(a, b, c)
// ArrayBuffer(b, c)
  • 查询数据
println(buffer(3))
  • 循环集合
for ( i <- buffer ) {
println(i)
}

可变数组和不可变数组转换

val buffer = ArrayBuffer(1,2,3,4)
val array = Array(4,5,6,7)

// 将不可变数组转换为可变数组
val buffer1: mutable.Buffer[Int] = array.toBuffer
// 将可变数组转换为不可变数组
val array1: Array[Int] = buffer.toArray

数组方法

val array = Array(1,2,3,4)

println(array.size) // 4
println(array.length) // 4
println(array.isEmpty) // false
println(array.contains(2)) // true  判断集合中是否包含某个元素
println(array.distinct.mkString(",")) // 1,2,3,4
println(array.reverse.mkString(",")) // 4,3,2,1

println(array.mkString(",")) // 1,2,3,4
array.foreach(println)
// 1
// 2
// 3
// 4
val iterator = array.iterator  // 生成迭代器
while (iterator.hasNext){
println(iterator.next())
}
// 1
// 2
// 3
// 4


val array = ArrayBuffer(1,2,3,4)

// 从集合中获取部分数据
println(array.head) // 1
println(array.tail) // ArrayBuffer(2, 3, 4)
println(array.tails) // <iterator>
println(array.last) // 4
println(array.init) // 初始 ArrayBuffer(1, 2, 3) 返回当前序列中不包含最后一个元素的序列(去尾)
println(array.inits) // <iterator> 对集合中的元素进行 init 操作,该操作的返回值中, 第一个值是当前序列的副本,包含当前序列所有的元素,最后一个值是空的,对头尾之间的值进行init操作,上一步的结果作为下一步的操作对象

// 取前几个
println(array.take(3)) // ArrayBuffer(1, 2, 3)
println(array.reverse.take(2).reverse) // ArrayBuffer(3, 4)
println(array.takeRight(2)) // ArrayBuffer(3, 4)
println(array.drop(1)) // ArrayBuffer(2, 3, 4)
println(array.dropRight(1)) // ArrayBuffer(1, 2, 3)


val array = ArrayBuffer(1,2,3,4,5)

println(array.sum) // 15 加法
println(array.max) // 5
println(array.min) // 1
println(array.product) // 120 乘法

LEFT与RIGHT计算

// 自定义数据操作的方法
// 集合的数据无论是多少,最基本的数据操作其实都是两两计算。
// map => reduce => 简化,规约(聚合)

def reduceFunction(x : Int, y : Int): Int = {
    x + y
}

//println(array.reduce(reduceFunction))
//println(array.reduce((x:Int, y:Int)=>{x + y}))
//println(array.reduce((x:Int, y:Int)=>x + y))
//println(array.reduce((x, y)=>x + y))
println(array.reduce(_ - _))  // -13

// reversed.reduceLeft[B]((x, y) => op(y, x))
// 【1,2,3,4, 5】
// 【5,4,3,2,1】
//  1 - (2 - (3 - (4 - 5)))
println(array.reduceRight(_ - _)) // 3
1 - ( 2 - ( 3 - ( 4 - 5 ) ) )
println(array.reduceLeft(_ - _)) // -13
( ( ( 1 - 2 ) - 3 ) - 4 ) - 5 

fold与scan

val array = ArrayBuffer(1,2,3,4)
val num = 5

// 折叠
println(array.fold(5)(_ - _)) // -5

// (((5 - 1) - 2) - 3) - 4
println(array.foldLeft(5)(_ - _)) // -5

// reversed.foldLeft(z)((x, y) => op(y, x))
// 【1,2,3,4】
// 【4,3,2,1】
//  1 - (2  - (3 - (4 - 5)))
println(array.foldRight(5)(_ - _)) // 3

println(array.scan(5)(_ - _)) // ArrayBuffer(5, 4, 2, -1, -5)
println(array.scanLeft(5)(_-_)) // ArrayBuffer(5, 4, 2, -1, -5)
println(array.scanRight(5)(_-_)) // ArrayBuffer(3, -2, 4, -1, 5)

map

val array = ArrayBuffer(1,2,3,4)

// TODO 功能函数:由集合对象提供函数执行自定义的功能
//  1. map => 映射(转换) => K->V
//     a => b

// map方法需要传递一个参数,这个参数的类型为函数类型: Int => B
def mapFunction( num:Int ): Int = {
    num * 2
}

println(array.map(mapFunction)) // ArrayBuffer(2, 4, 6, 8)

println(array.map(
    (num:Int) => {
        num * 2
		}
	)) // ArrayBuffer(2, 4, 6, 8)

println(array.map(_*2)) // ArrayBuffer(2, 4, 6, 8)

扁平化操作(flatten)

  • 将整体拆分成个体的操作,称之为扁平化
  • 扁平化操作只能对最外层进行操作
    val array = ArrayBuffer(
      ArrayBuffer(
        ArrayBuffer(1,2),ArrayBuffer(5,6)
      ), ArrayBuffer(
        ArrayBuffer(3,4),ArrayBuffer(7,8)
      )
    )
    println(array.flatten.flatten)
    // ArrayBuffer(1, 2, 5, 6, 3, 4, 7, 8)

split

        val array = Array(
            "Hello Scala", "Hello Hadoop"
        )

        println(array.flatten.mkString(","))
	    // H,e,l,l,o, ,S,c,a,l,a,H,e,l,l,o, ,H,a,d,o,o,p

        println(array.flatMap(
            str => {
                str.split(" ")
            }
        ).mkString(","))
        // Hello,Scala,Hello,Hadoop

filter

filter方法可以对集合中的每一条数据进行筛选过滤
满足条件(true)的数据保留,不满足条件(false)的数据丢弃

        val array = ArrayBuffer(1,2,3,4)
        val r = array.filter(
            num => {
                num % 2 != 0
            }
        )
        println(r) // ArrayBuffer(1, 3)

GroupBy

根据指定的规则对每一条数据进行分组

        val array = ArrayBuffer(1,2,3,4)
        // 根据指定的规则对每一条数据进行分组
        val r = array.groupBy(
            num => {
                if ( num % 2 == 0 ) {
                    "偶数"
                } else {
                    "奇数"
                }
                num % 2
            }
        )
        println(r) // Map(1 -> ArrayBuffer(1, 3), 0 -> ArrayBuffer(2, 4))
        val array2 = ArrayBuffer(
            "Hello", "Scala", "Hadoop", "Spark"
        )

        println(array2.groupBy(_.substring(0, 1)))
        // Map(S -> ArrayBuffer(Scala, Spark), H -> ArrayBuffer(Hello, Hadoop))

sortBy

排序:通过指定的规则对每一条数据进行排序处理, 默认为升序

        val array = ArrayBuffer("1", "11", "2", "3", "22")
        println(array.sortBy(
            num => num.toInt
        )) // ArrayBuffer(1, 2, 3, 11, 22)
        println(array.sortBy(num => num.toInt)(Ordering.Int.reverse)) // ArrayBuffer(22, 11, 3, 2, 1)

WordCount

        // TODO 1. 读取文件,获取原始数据
        //  line => Hello Scala
        val source: BufferedSource = Source.fromFile("data/word.txt")
        val lines: Array[String] = source.getLines().toArray
        source.close()

        // TODO 2. 将原始数据进行切分成一个一个的单词
        // "Hello Scala" => "Hello", "Scala"
        val words = lines.flatMap(
            line => {
                line.split(" ")
            }
        )

        // TODO 3. 对分词的结果进行分组操作(相同的单词放置在一起)
        // "Hello", "Hello" => { "Hello"=>List( Hello, Hello ) }
        val wordGroup: Map[String, Array[String]] = words.groupBy(word => word)

        // TODO 4. 对分组后的数据进行数量的统计
        // 如果数据在转换时,无需对key进行操作,只对v进行处理时,可以使用mapValues方法
        // { "Hello"=>List( Hello, Hello ) }
        // =>
        // { "Hello"=>2 }
        val wordCount = wordGroup.mapValues(
            v => {
                v.size
            }
        )
        
// fun2
//        val wordCount = wordGroup.map {
//            case (word, list) => {
//                (word, list.size)
//            }
//        }

        // TODO 5. 将统计结果打印在控制台
        println(wordCount)

简化代码

        val source: BufferedSource = Source.fromFile("data/word.txt")
        val lines: Array[String] = source.getLines().toArray
        source.close()

        val wordCount =
            lines
                .flatMap(_.split(" "))
                .groupBy(word => word)
                .mapValues(_.size)

        println(wordCount)

合并count01

        val list = List(
            ("Hello Scala", 4),
            ("Hello World", 2)
        )
        val list2 = list.map(
            t => {
                val line = t._1
                val cnt = t._2
                (line + " ") * cnt // 连词
            }
        )
        println(list2)
// List(Hello Scala Hello Scala Hello Scala Hello Scala , Hello World Hello World )

合并count02

        val list = List(
            ("Hello Scala", 4),
            ("Hello World", 2)
        )

        // ("Hello Scala", 4) => ("Hello", 4),("Scala", 4)
        // ("Hello World", 2) => ("Hello", 2),("World", 2)
        val list1 = list.flatMap(
            t => {
                val line = t._1
                val cnt = t._2

                val datas = line.split(" ") // Hello,Scala => (Hello, 4), (Scala, 4)
                datas.map(
                    word => {
                        (word, cnt)
                    }
                )

            }
        )
        val groupData: Map[String, List[(String, Int)]] = list1.groupBy(_._1)

        /*
           Map(
               Hello -> List((Hello,4), (Hello,2)),
               Scala -> List((Scala,4)),
               World -> List((World,2)))

           Map(
               Hello -> List(4, 2),
               Scala -> List(4),
               World -> List(2))

           Map(
               Hello -> 6,
               Scala -> 4,
               World -> 2
         */
        val groupData1 = groupData.mapValues(
            list => {
                list.map(_._2).sum
            }
        )

        println(groupData1)

Seq集合(List)

基本语法

  • 声明

    // 一般会从采用List
    val seq = Seq(1,2,3,4)
    val list = List(1,2,3,4)
    val list1 = List(5,6,7,8)
    
  • 数据操作

    val ints: List[Int] = list :+ 5
    println(list eq ints) // false
    val ints1: List[Int] = 5 +: list
    println(list) // List(1, 2, 3, 4)
    println(ints) // List(1, 2, 3, 4, 5)
    println(ints1) // List(5, 1, 2, 3, 4)
    
  • Nil 在集合中表示空集合

    val ints2 = 1 :: 2:: 3 :: Nil
    //Nil.::(3).::(2).::(1)
    val ints3 = 1 :: 2 :: 3 :: list1 ::: Nil
    println(Nil) // List()
    println(ints2) // List(1, 2, 3)
    println(ints3) // List(1, 2, 3, 5, 6, 7, 8)
    
  • 数据有序,可以放重复数据

    val list = List(1,3,4,2,1)
    println(list) // List(1, 3, 4, 2, 1)
    

方法

  • 插入

    val list = ListBuffer(1,3,4,2,1)
    val list2 = ListBuffer(1,3,4,2,1)
    
    list.append(1)
    println(list)
    list.appendAll(list2)
    println(list)
    list.insert(0,10)
    println(list)
    
    // ListBuffer(1, 3, 4, 2, 1, 1)
    // ListBuffer(1, 3, 4, 2, 1, 1, 1, 3, 4, 2, 1)
    // ListBuffer(10, 1, 3, 4, 2, 1, 1, 1, 3, 4, 2, 1)
    
  • 更新

    val list = ListBuffer(1,3,4,2,1)
    list.update(0, 5) // 改变自身
    println(list)
    list.updated(0, 6) // 创建新的
    println(list)
    println(list.updated(0, 6))
    //    ListBuffer(5, 3, 4, 2, 1)
    //    ListBuffer(5, 3, 4, 2, 1)
    //    ListBuffer(6, 3, 4, 2, 1)
    
  • 删除

    val list = ListBuffer(1,3,4,2,1)
    list.remove(1)
    println(list)
    list.remove(1,2)
    println(list)
    // ListBuffer(1, 4, 2, 1)
    // ListBuffer(1, 1)
    
  • 遍历

    val list = ListBuffer(1,3,4,2,1)
    println(list.mkString(","))
    val iterator = list.iterator
    while (iterator.hasNext) {
    	println(iterator.next())
    }
    list.foreach(println)
    //  1,3,4,2,1
    //  1
    //  3
    //  4
    //  2
    //  1
    //  1
    //  3
    //  4
    //  2
    //  1
    
  • 类型转换

    val list = ListBuffer(1,3,4,2,1)
    val list1 = list.toList
    val list2 = list1.toBuffer
    

Set集合

数据无序,不可重复

// update方法用于更新set集合
set.update(5, true)
println(set)
set.update(4, false)
println(set)
set.remove(3)

// Set(1, 5, 2, 3, 4)
// Set(1, 5, 2, 3)
// Set(1, 5, 2)

set.foreach(println) //遍历数据

交集与差集

    val set1 = mutable.Set(1,2,3,4)
    val set2 = mutable.Set(4,5,6,7)

    // 交集
    val set3: mutable.Set[Int] = set1 & set2
    println(set3.mkString(",")) // 4
    // 差集
    val set4: mutable.Set[Int] = set1 &~ set2
    println(set4.mkString(",")) // 1,2,3

Map集合

Map(映射)是一种可迭代的键值对(key/value)结构。所有的值都可以通过键来获取。Map 中的键都是唯一的。

数据无序,K不能重复的集合

  • 不可变Map

    val map = Map(
                "a" -> 1, "b" -> 2, "a" -> 3,"d" -> 4,"e" -> 5
            )
    val map1 = mutable.Map(
            "a" -> 1, "b" -> 2, "a" -> 3,"d" -> 4,"e" -> 5
            ) // K不能重复的集合
    map1.put("f", 6)
    println(map1) // Map(e -> 5, b -> 2, d -> 4, a -> 3, f -> 6)
    map1.update("a", 7)
    println(map1) // Map(e -> 5, b -> 2, d -> 4, a -> 7, f -> 6)
    map1.remove("e")
    println(map1) // Map(b -> 2, d -> 4, a -> 7, f -> 6)
    
            // java中从HashMap中获取一个不存在的key,会返回null
            //       HashMap允许放空键(Key)空值(Value)
            val map1 = mutable.Map(
                "a" -> 1, "b" -> 2, "a" -> 3,"d" -> 4,"e" -> 5
            )
            
            val maybeInt1: Option[Int] = map1.get("f")
    
            // Option类型专门为了解决空指针问题设计的
            // Option : 选项,对象只有2个 Some, None
            if ( maybeInt1.isEmpty ) {
                println("没有对应key的值, 提供默认值 : " + maybeInt1.getOrElse(0))
            } else {
                println("对应key的值为" + maybeInt1.get)
            }// print --> 没有对应key的值, 提供默认值 : 0
    		
            println("获取指定key的值:" + maybeInt1.getOrElse(0)) // print--> 获取指定key的值:0
            // 如果不存在,获取默认值
    
            println(map1.getOrElse("a", 0)) // 3
            //获取可能存在的key值, 如果不存在就使用默认值
    

Tuple元组

可以将无关的元素组合在一起,形成一个整体来进行访问,这种整体结构称之元素组合

因为元组中的数据没有关系,所以只能通过顺序号进行访问

val t : (Int, String, Int) = (1, "zhangsan", 30)
println(t._1) // 1
println(t._2) // zhangsan
println(t._3) // 30
// Tuple也是一个集合对象,所以也有类型
// (Int, String, Int)
// scala中元组也有专门的类型
val t1 : Tuple3[Int, String, Int] = (1, "zhangsan", 30)
// Tuple类型最多存放元素的数量为22个。但是类型没有约束的。
println(t) // (1,zhangsan,30)

如果元组中的元素只有2个,称之为对偶元组,也可以称之为键值对

        val kv = (1, "zhangsan")
        val map = Map(
            ("a", 1), ("b", 2), ("c", 3)
        )
        map.foreach(
            t => {
                println(t._1 + "=" + t._2)
            }
        )
        println(map)
        // a=1
        // b=2
        // c=3
        // Map(a -> 1, b -> 2, c -> 3)

将Map转换为List

val list: List[(String, Int)] = map.toList

不同省份的商品点击排行

        // 不同省份的商品点击排行
        // word(省份-商品) - count(1)
        val datas = List(
            ("zhangsan", "河北", "鞋"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "鞋"),
            ("zhangsan", "河南", "鞋"),
            ("lisi", "河南", "衣服"),
            ("wangwu", "河南", "鞋"),
            ("zhangsan", "河南", "鞋"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "鞋"),
            ("zhangsan", "河北", "鞋"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "帽子"),
            ("zhangsan", "河南", "鞋"),
            ("lisi", "河南", "衣服"),
            ("wangwu", "河南", "帽子"),
            ("zhangsan", "河南", "鞋"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "帽子"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "电脑"),
            ("zhangsan", "河南", "鞋"),
            ("lisi", "河南", "衣服"),
            ("wangwu", "河南", "电脑"),
            ("zhangsan", "河南", "电脑"),
            ("lisi", "河北", "衣服"),
            ("wangwu", "河北", "帽子")
        )
        // TODO 将原始数据进行结构的转换
        // (人,省份,商品) => (省份-商品, 1)
        val mapDatas = datas.map(
            t => {
                (t._2 + "-" + t._3, 1)
            }
        )
        // TODO 将转换结构后的数据进行分组
        val groupDatas: Map[String, List[(String, Int)]] = mapDatas.groupBy(_._1)

        // TODO 将分组后的数据进行统计聚合
        val cntDatas = groupDatas.mapValues(
            list => list.size
        )
        //println(cntDatas)
        // TODO 将聚合的结果进行结构的转换
        // 将相同省份的数据准备放在一起
        // (省份-商品, count) => (省份,(商品,count))
        val mapDatas1 = cntDatas.toList.map(
            kv => {
                val k = kv._1
                val cnt = kv._2
                val ks = k.split("-")
                (ks(0), (ks(1), cnt))
            }
        )
		//        println(mapDatas1)
        // 河北 => List( (衣服,20),(鞋,10), )
        // TODO 将转换结构后的数据进行排序(降序)
        val groupDatas1 =
            mapDatas1.groupBy(_._1).mapValues(
                list=> {
                    list.map(_._2).sortBy(_._2)(Ordering.Int.reverse).take(3)
                }
            )
        println(groupDatas1) 
        // Map(河南 -> List((鞋,6), (衣服,3), (电脑,2)), 河北 -> List((衣服,6), (鞋,4), (帽子,3)))

Queue队列

Scala也提供了队列(Queue)的数据结构,队列的特点就是先进先出。进队和出队的方法分别为enqueue和dequeue。

val que = new mutable.Queue[String]()
// 添加元素
que.enqueue("a", "b", "c")
val que1: mutable.Queue[String] = que += "d"
println(que eq que1) // true
// 获取元素
println(que.dequeue()) // a
println(que.dequeue()) // b 
println(que.dequeue()) // c

并行

Scala为了充分使用多核CPU,提供了并行集合(有别于前面的串行集合),用于多核环境的并行计算。

//        val result1 = (0 to 100).map{
//            x => {
//                Thread.currentThread.getName
//            }
//        } //      main, main, main, main, main, main, main,
        val result2 = (0 to 100).par.map{
             x =>  {
                 Thread.currentThread.getName // 查看线程名字
             }
        } //         scala-execution-context-global-23, scala-execution-context-global-13
        println(result1)
        println(result2)

常用方法

  • 快排

    val list = List(1,6,5,3,2,4)
    
    val tuple: (List[Int], List[Int]) = list.partition(
        num => {
            num > 3
        }
    )
    println(tuple._1)
    println(tuple._2)
    
  • 交集,并集,差集

    val list1 = List(1,2,3,4)
    val list2 = List(3,4,5,6)
    
    // 交集,并集,差集
    println(list1.intersect(list2))
    println(list1.union(list2))
    println(list1.diff(list2))
    
  • 滑动窗口

            val list1 = List(1,2,3,4,5,6,7,8)
    
            //println(list1.drop(1))
    
            //list1.head + list1.tail.head
    
            // 滑动窗口
            // 滚动窗口 当窗口大小等于步长是
            val iterator: Iterator[List[Int]] = list1.sliding(3, 3) //窗口大小,步长 
            while (iterator.hasNext) {
                val ints: List[Int] = iterator.next()
                println(ints)
            }
    
  • 拉链

            val list1 = List(1,2,3,4)
            val list2 = List(5,6,7,8,9, 10)
    
            // 所谓的拉链,其实就是将两个集合相同的位置的数据连接在一起
            val tuples: List[(Int, Int)] = list1.zip(list2)
            println(tuples) // List((1,5), (2,6), (3,7), (4,8))
    
            println(list2.zipWithIndex)  // 自己和自己的索引拉链
            // List((5,0), (6,1), (7,2), (8,3), (9,4), (10,5))
    
  • 两个map折叠

            val map1 = mutable.Map(
                ("a", 1), ("b", 2), ("c", 3)
            )
            val map2 = mutable.Map(
                ("a", 4), ("d", 5), ("c", 6)
            )
    
            val map3 = map2.foldLeft(map1)(
                (map, kv) => {
                    val key = kv._1
                    val cnt = kv._2
                    val oldCnt = map.getOrElse(key, 0)
                    map.update(key, oldCnt + cnt)
                    map
                }
            )
            println(map3) // Map(b -> 2, d -> 5, a -> 5, c -> 9)
    
  • 使用匿名函数时,给定的参数直接放回,不能使用下划线代替,必须完整,

    //        val newlist = list3.flatMap(
    //            list => { // 整体
    //                list  // 容器
    //            }
    //        )
    
            val words = list2.flatMap(
                str => {
                    str.split(" ") // 容器( Hello, Scala )
                }
            )
            
            
            // 简化规则
            def test( f : (String)=>Unit ): Unit = {
                f("zhangsan")
            }
    
            test( (s:String)=>{println(s)} )
            test( (s:String)=>println(s) )
            test( (s)=>println(s) )
            test( s=>println(s) )
            test( s => println(s) )
    
  • 分组

            val list1 = List(1,2,3,4)
            val list2 = List("Hello", "Hive", "Hadoop")
            val list4 = List(
                ("a", 1), ("a", 2), ("a", 3)
            )
    
            // Map[ 组名1=>分组集合1,组名2=>分组集合2 ]
            val list3 = list4.groupBy(
                t => t._1
            )
    
            println(list3) // Map(a -> List((a,1), (a,2), (a,3)))
            
            val list5 = List(1,4,3,2,5)
    
            // 1 4 3 2 5
            // 1 0 1 0 1
            // 4 2 1 3 5
            // List(4, 2, 1, 3, 5)
            //println(list5.sortBy(_ % 2))  // 取余后排序
    
  • 排序

            val user1 = new User()
            user1.age = 20
            user1.salary = 2000
            val user2 = new User()
            user2.age = 30
            user2.salary = 2000
            val user3 = new User()
            user3.age = 30
            user3.salary = 1000
    
            val users = List(
                user1, user2, user3
            )
    
            //println(users.sortBy(_.age)(Ordering.Int.reverse))
    
            // Tuple : 元组,可以默认排序,先比较第一个,如果相同,比较第二个,依此类推
    //        println(
    //            users.sortBy(
    //                user => {
    //                    ( user.age, user.salary )
    //                }
    //            )(Ordering.Tuple2[Int, Int]( Ordering.Int, Ordering.Int.reverse ))
    //        )
    
            // 自定义排序
            println(users.sortWith(
                (user1, user2) => {
                    // 将你期望的结果,返回为true
                    //user1.salary > user2.salary
                    if ( user1.age < user2.age ) {
                        true
                    } else if (user1.age == user2.age ) {
                        user1.salary < user2.salary
                    } else {
                        false
                    }
                }
            ))
    
    
        }
        class User {
            var age : Int = _
            var salary : Int = _
    
            override def toString: String = {
                return s"User[${age}, ${salary}]"
            }
        }
    
hmoban主题是根据ripro二开的主题,极致后台体验,无插件,集成会员系统
自学咖网 » scala-集合