sábado, 7 de noviembre de 2015

Pivot PL/SQL - ORACLE 11G

En Oracle 11g una de las muchas funcionalidades incorporada en dicha versión es la solución a muchos de nuestro problemas, que en versiones anteriores teníamos que recurrir a la expresión CASE.

Recordemos que el operador Pivot se encarga de presentar información en un informe con referencias cruzadas con formato de planilla de cálculo a partir de cualquier tabla relacional usando código PL/SQL intermedio (dependiendo el caso que se presente), y almacena dichos datos en una tabla con referencias cruzadas de un determinado almacén (base de datos).

Además en el mundo de BI o OLAP un pivot es conocido como tablas de doble entrada, multidimensionales o simplemente conocidos con cross table (tablas cruzadas).

Consideracioness:
Son utilizadas asociadas a funciones de agrupamiento tales como SUM, COUNT, MIN, MAX, entre otros.
Se recomienda usar alias cuando se va a realizar más de una función agregada.
El título de la columna corresponderá a la lista de valores o alias de cada valor que agrega en el operador FOR.
Además se recomienda especificar el alias para que el valor tomará el alias.
No se recomienda usar funciones de agregación en el operador FOR, para esto se recomienda hacer uso de vistas.

Sintaxis:
Select * from nombre_tabla  -- Origen de datos
Pivot  --Operador Pivot
( fn_agregada_1() Alias_1,  -- Funciones agrupadas a mostrar
  Fn_agregada_2() Alias_2,
 For (campo_1 Alias_1 ,
      Campo_2 Alias_2  -- Campos donde se genera el pivot)
      In(Lista de valores)  -- Filtros para generar las columnas

 )
Para el siguiente ejemplo de nuestra implementación haciendo uso del operador Pivot haremos uso de la tabla employees de la Schema HR.

1. Construir query de origen de datos.


SELECT  DEPARTMENT_ID, TO_CHAR(HIRE_DATE,'YYYY'), SUM(SALARY)
FROM    EMPLOYEES
WHERE   DEPARTMENT_ID IS NOT NULL
AND     SALARY IS NOT NULL
AND     DEPARTMENT_ID BETWEEN 50 AND 100
GROUP BY DEPARTMENT_ID, TO_CHAR(HIRE_DATE,'YYYY')
ORDER BY DEPARTMENT_ID, TO_CHAR(HIRE_DATE,'YYYY');




Lo que nuestro query hace es mostrar los departamentos que se encuentra en el rango del 50 al 100 en determinados años y agrupados en ambos, así mismo muestra la suma del salario según los principales datos. En el siguiente caso nos pide mostrar la suma del salario por todos los año según el DEPARTMENT_ID. Para este caso, lo primero que se nos ocurre es transponer las filas a columnas.  

2. Recordemos a la implementa con la expresión CASE.


SELECT  DEPARTMENT_ID,
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2001' THEN SALARY ELSE 0 END) AS "AÑO-2001",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2002' THEN SALARY ELSE 0 END) AS "AÑO-2002",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2003' THEN SALARY ELSE 0 END) AS "AÑO-2003",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2004' THEN SALARY ELSE 0 END) AS "AÑO-2004",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2005' THEN SALARY ELSE 0 END) AS "AÑO-2005",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2006' THEN SALARY ELSE 0 END) AS "AÑO-2006",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2007' THEN SALARY ELSE 0 END) AS "AÑO-2007",
          SUM( CASE TO_CHAR(HIRE_DATE,'YYYY')
               WHEN '2008' THEN SALARY ELSE 0 END) AS "AÑO-2008"
FROM    EMPLOYEES
WHERE   DEPARTMENT_ID IS NOT NULL
AND     SALARY IS NOT NULL
AND     DEPARTMENT_ID BETWEEN 50 AND 100
GROUP BY DEPARTMENT_ID
ORDER BY DEPARTMENT_ID;



Todo bien hasta ahora, se logró lo que nos solicitaron, pero, que pasa sí es que tenemos muchos años más de lo que hasta ahora mostramos, es decir los años desde el 1980 al 2015, tendríamos que replica 35 veces nuestra función de agrupamiento de nuestra expresión CASE. 
   
3. Crear la vista con el query de origen de datos (no siempre es necesario crear vistas).


CREATE OR REPLACE VIEW V_EMPLOYEES_HIRE_DATE
AS
SELECT  DEPARTMENT_ID, TO_CHAR(HIRE_DATE,'YYYY') AS HIRE_DATE, SALARY
FROM    EMPLOYEES
WHERE   DEPARTMENT_ID IS NOT NULL
AND     SALARY IS NOT NULL
AND     DEPARTMENT_ID BETWEEN 50 AND 100;

4. Ahora veremos la implementación con el Operador Pivot, lograremos el mismo resultado pero con menos línea de código.

SELECT * FROM (SELECT  DEPARTMENT_ID, HIRE_DATE, SALARY
                FROM    V_EMPLOYEES_HIRE_DATE )
                PIVOT
                (SUM(SALARY)
                      FOR HIRE_DATE IN (2001,2002,2003,2004,2005,2006,2007,2008)
                      )
ORDER BY 2 DESC;

Lo que se logra con el operador Pivot es que los filtros para la construcción de las columnas, solo será cuestión de agregar nuevos valores (FOR HIRE_DATE IN (2001,...., nuevo_filtros)) en el operador FOR.