scala source code of DeduplicatedCollectorRegistry

Project: spark-metrics (GitHub Link)

spark-metrics-master
- PrometheusSink.md
- src
  - main
    - scala
      - com
        banzaicloud
        spark
        metrics
        sink
        PrometheusSink.scala
        DeduplicatedCollectorRegistry.scala
        CollectorDecorator.scala
        SparkCollectorDecorators.scala
      - org
        apache
        spark
        banzaicloud
        metrics
        sink
        PrometheusSink.scala
  - test
    - scala
      - com
        banzaicloud
        spark
        metrics
        DeduplicatedCollectorRegistrySuite.scala
        sink
        PrometheusSinkSuite.scala
        SparkCollectorDecoratorsSuite.scala
      - org
        apache
        spark
        banzaicloud
        metrics
        sink
        PrometheusSinkSuite.scala
- .circleci
  - config.yml
- LICENSE
- project
  - build.properties
  - plugins.sbt
- maven-repo
  - releases
    - com
      - banzaicloud
        spark-metrics_2.11
        2.3-2.0.1
        spark-metrics_2.11-2.3-2.0.1.jar.sha1
        spark-metrics_2.11-2.3-2.0.1-sources.jar.sha1
        spark-metrics_2.11-2.3-2.0.1-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.0.1.pom.sha1
        spark-metrics_2.11-2.3-2.0.1.jar
        spark-metrics_2.11-2.3-2.0.1-sources.jar.md5
        spark-metrics_2.11-2.3-2.0.1-sources.jar
        spark-metrics_2.11-2.3-2.0.1-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.0.1.jar.md5
        spark-metrics_2.11-2.3-2.0.1.pom.md5
        spark-metrics_2.11-2.3-2.0.1.pom
        2.3-2.1.0
        spark-metrics_2.11-2.3-2.1.0.pom.md5
        spark-metrics_2.11-2.3-2.1.0-sources.jar
        spark-metrics_2.11-2.3-2.1.0.jar
        spark-metrics_2.11-2.3-2.1.0.pom.sha1
        spark-metrics_2.11-2.3-2.1.0-sources.jar.sha1
        spark-metrics_2.11-2.3-2.1.0.jar.sha1
        spark-metrics_2.11-2.3-2.1.0.jar.md5
        spark-metrics_2.11-2.3-2.1.0-sources.jar.md5
        spark-metrics_2.11-2.3-2.1.0-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.1.0-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.1.0.pom
        2.3-2.0.4
        spark-metrics_2.11-2.3-2.0.4-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.0.4-sources.jar.md5
        spark-metrics_2.11-2.3-2.0.4.jar.md5
        spark-metrics_2.11-2.3-2.0.4.jar.sha1
        spark-metrics_2.11-2.3-2.0.4-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.0.4.pom
        spark-metrics_2.11-2.3-2.0.4.jar
        spark-metrics_2.11-2.3-2.0.4-sources.jar.sha1
        spark-metrics_2.11-2.3-2.0.4.pom.sha1
        spark-metrics_2.11-2.3-2.0.4.pom.md5
        spark-metrics_2.11-2.3-2.0.4-sources.jar
        2.3-1.0.0
        spark-metrics_2.11-2.3-1.0.0.pom.md5
        spark-metrics_2.11-2.3-1.0.0-sources.jar.md5
        spark-metrics_2.11-2.3-1.0.0.jar.sha1
        spark-metrics_2.11-2.3-1.0.0-sources.jar.sha1
        spark-metrics_2.11-2.3-1.0.0.pom.sha1
        spark-metrics_2.11-2.3-1.0.0-javadoc.jar.sha1
        spark-metrics_2.11-2.3-1.0.0.jar
        spark-metrics_2.11-2.3-1.0.0-javadoc.jar.md5
        spark-metrics_2.11-2.3-1.0.0-sources.jar
        spark-metrics_2.11-2.3-1.0.0.pom
        spark-metrics_2.11-2.3-1.0.0.jar.md5
        2.3-1.1.0
        spark-metrics_2.11-2.3-1.1.0-javadoc.jar.sha1
        spark-metrics_2.11-2.3-1.1.0-sources.jar
        spark-metrics_2.11-2.3-1.1.0.pom.sha1
        spark-metrics_2.11-2.3-1.1.0-javadoc.jar.md5
        spark-metrics_2.11-2.3-1.1.0.jar.md5
        spark-metrics_2.11-2.3-1.1.0.jar.sha1
        spark-metrics_2.11-2.3-1.1.0.jar
        spark-metrics_2.11-2.3-1.1.0.pom.md5
        spark-metrics_2.11-2.3-1.1.0.pom
        spark-metrics_2.11-2.3-1.1.0-sources.jar.md5
        spark-metrics_2.11-2.3-1.1.0-sources.jar.sha1
        2.2.1-1.0.0
        spark-metrics_2.11-2.2.1-1.0.0-sources.jar
        spark-metrics_2.11-2.2.1-1.0.0-sources.jar.sha1
        spark-metrics_2.11-2.2.1-1.0.0.jar.md5
        spark-metrics_2.11-2.2.1-1.0.0.pom.md5
        spark-metrics_2.11-2.2.1-1.0.0.jar.sha1
        spark-metrics_2.11-2.2.1-1.0.0-sources.jar.md5
        spark-metrics_2.11-2.2.1-1.0.0-javadoc.jar.sha1
        spark-metrics_2.11-2.2.1-1.0.0.pom
        spark-metrics_2.11-2.2.1-1.0.0.pom.sha1
        spark-metrics_2.11-2.2.1-1.0.0.jar
        spark-metrics_2.11-2.2.1-1.0.0-javadoc.jar.md5
        2.3-2.0.0
        spark-metrics_2.11-2.3-2.0.0-sources.jar
        spark-metrics_2.11-2.3-2.0.0-sources.jar.md5
        spark-metrics_2.11-2.3-2.0.0.jar.sha1
        spark-metrics_2.11-2.3-2.0.0-sources.jar.sha1
        spark-metrics_2.11-2.3-2.0.0.jar
        spark-metrics_2.11-2.3-2.0.0.pom.sha1
        spark-metrics_2.11-2.3-2.0.0.jar.md5
        spark-metrics_2.11-2.3-2.0.0-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.0.0-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.0.0.pom.md5
        spark-metrics_2.11-2.3-2.0.0.pom
        2.3-2.0.3
        spark-metrics_2.11-2.3-2.0.3-sources.jar.md5
        spark-metrics_2.11-2.3-2.0.3-sources.jar
        spark-metrics_2.11-2.3-2.0.3-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.0.3-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.0.3.jar.sha1
        spark-metrics_2.11-2.3-2.0.3.jar
        spark-metrics_2.11-2.3-2.0.3.pom.sha1
        spark-metrics_2.11-2.3-2.0.3.pom.md5
        spark-metrics_2.11-2.3-2.0.3-sources.jar.sha1
        spark-metrics_2.11-2.3-2.0.3.pom
        spark-metrics_2.11-2.3-2.0.3.jar.md5
        2.3-2.0.2
        spark-metrics_2.11-2.3-2.0.2.jar.md5
        spark-metrics_2.11-2.3-2.0.2-javadoc.jar.md5
        spark-metrics_2.11-2.3-2.0.2.pom
        spark-metrics_2.11-2.3-2.0.2-sources.jar.sha1
        spark-metrics_2.11-2.3-2.0.2.jar
        spark-metrics_2.11-2.3-2.0.2-javadoc.jar.sha1
        spark-metrics_2.11-2.3-2.0.2-sources.jar
        spark-metrics_2.11-2.3-2.0.2.jar.sha1
        spark-metrics_2.11-2.3-2.0.2.pom.sha1
        spark-metrics_2.11-2.3-2.0.2.pom.md5
        spark-metrics_2.11-2.3-2.0.2-sources.jar.md5
        2.3-1.0.1
        spark-metrics_2.11-2.3-1.0.1.pom.sha1
        spark-metrics_2.11-2.3-1.0.1.jar.sha1
        spark-metrics_2.11-2.3-1.0.1-sources.jar
        spark-metrics_2.11-2.3-1.0.1-sources.jar.sha1
        spark-metrics_2.11-2.3-1.0.1-javadoc.jar.sha1
        spark-metrics_2.11-2.3-1.0.1.pom.md5
        spark-metrics_2.11-2.3-1.0.1.jar
        spark-metrics_2.11-2.3-1.0.1.pom
        spark-metrics_2.11-2.3-1.0.1-javadoc.jar.md5
        spark-metrics_2.11-2.3-1.0.1.jar.md5
        spark-metrics_2.11-2.3-1.0.1-sources.jar.md5
- README.md
- build.sbt
- .gitignore

package com.banzaicloud.spark.metrics

import java.{lang, util}
import java.util.Collections

import io.prometheus.client.{Collector, CollectorRegistry}

import scala.collection.JavaConverters._
import org.apache.spark.internal.Logging

import scala.util.{Failure, Try}

class DeduplicatedCollectorRegistry(parent: CollectorRegistry = CollectorRegistry.defaultRegistry)
  extends CollectorRegistry with Logging {
  private type MetricsEnum = util.Enumeration[Collector.MetricFamilySamples]

  override def register(m: Collector): Unit = {

    // in case collectors with the same name are registered multiple times keep the first one
    Try(parent.register(m)) match {
      case Failure(ex) if ex.getMessage.startsWith("Collector already registered that provides name:") =>
        // TODO: find a more robust solution for checking if there is already a collector registered for a specific metric
      case Failure(ex) => throw ex
      case _ =>
    }
  }

  override def unregister(m: Collector): Unit = parent.unregister(m)

  override def clear(): Unit = parent.clear()

  override def getSampleValue(name: String, labelNames: Array[String], labelValues: Array[String]): lang.Double = {
    parent.getSampleValue(name, labelNames, labelValues)
  }

  override def getSampleValue(name: String): lang.Double = parent.getSampleValue(name)

  override def metricFamilySamples(): MetricsEnum = {
    deduplicate(parent.metricFamilySamples())
  }

  override def filteredMetricFamilySamples(includedNames: util.Set[String]): MetricsEnum = {
    deduplicate(parent.filteredMetricFamilySamples(includedNames))
  }

  private def deduplicate(source: MetricsEnum): MetricsEnum = {
    val metrics = source.asScala.toSeq
    val deduplicated = metrics
      .groupBy(f => (f.name, f.`type`))
      .flatMap {
        case (_, single) if single.lengthCompare(2) < 0 =>

          single
        case ((name, metricType), duplicates) =>
          logDebug(s"Found ${duplicates.length} metrics with the same name '${name}' and type ${metricType}")
          duplicates.lastOption
      }
      .toList
      .asJava
    Collections.enumeration(deduplicated)
  }
}