Dentro de los muchos factores que podrían afectar la facturación de Amazon Redshift en una cuenta de AWS, vale la pena mencionar:
COPY
Al cargar datos utilizando el comando COPY, Redshift se encargará de comprimir los datos de acuerdo a su tipo (en cada caso), lo que representa un ahorro de espacio, mejoras en las consultas, y posible reducción de los nodos requeridos. El siguiente comando, por ejemplo, carga un archivo existente en un bucket de S3, especificando las credenciales y la región:
COPY
VENTAS
FROM
‘ruta_archivo_s3’
WITH CREDENTIALS
‘aws_access_key_id=XXX;aws_secret_access_key=YYY’
REGION
‘us-west-2’
IGNOREHEADER 1
CSV DELIMITER ‘,’
;
VACUUM
Debido a que Redshift no ‘recupera’ automáticamente el espacio de un registro borrado o actualizado, se debe ejecutar con cierta frecuencia el comando VACUUM para reordenar las tablas y así liberar cualquier espacio que no se esté utilizando.
Lo anterior representa una mejora en el desempeño y, posiblemente, pueda reducir el número de nodos que se requieran para almacenar los datos. Sólo el propietario de la tabla (o un superusuario) podría ejecutar este comando con resultados efectivos. De lo contrario el comando se ejecuta, pero sin efecto alguno.
Por ejemplo, con el siguiente comando se reordenan los registros de la tabla VENTAS sólo si menos del 75% de dichos registros están ya ordenados:
vacuum sort only VENTAS to 75 percent;