Ordenamiento "instantaneo"

daniel

New member
Staff member
Ordenar tablas es probablemente el cuello de botella más pesado en operaciones de Big Data. Y es imposible de evitar ya que es necesario para:
  • Joins
  • Time series
  • Group by
  • Gestión de duplicados
  • "Time Travel"
Pero no siempre se tiene que hacer antes de esas operaciones: Anatella generalmente mantiene la información de ordenamiento en la metadata. Pero en algunos casos (después de un append, o después de varias operaciones que pueden afectar el orden), esa información se pierde.
Si no se ha cambiado el orden, pueden usar la opcion "Only Check Sort". En este caso, se valida el orden de forma gratis, sin ningun costo de calculo.
 

DanielSZ

Administrator
este pequeño script ilustra muy bien como eso puede afectar la velocidad
 

Attachments

  • Sort Example.zip
    1.1 KB · Views: 143
Top