Descrição do Problema
Gasolinas podem ser obtidas através da mistura de correntes diversas. O processo de "blending" deve ser tal que garanta os requisitos físico-químicos dos produtos finais, estabelecidos pela ANP – Agência Nacional do Petróleo, segundo um custo mínimo. Os planejamentos e as programações de compra e de estocagem de correntes, assim como os de produção de gasolinas, baseiam-se em modelos matemáticos para o cálculo das propriedades físico-químicas da mistura, a partir das propriedades físico-químicas de seus componentes (ou correntes). Alguns destes modelos são funções fortemente não-lineares das frações de volume ou peso dos componentes na mistura, como por exemplo, o número de octanas, a pressão de vapor e as temperaturas de destilação. Esses modelos podem ser obtidos através de análises de variância (regressões). Neste tipo de análise procura-se determinar o modelo que "melhor se ajusta" à massa de dados coletada (o coeficiente de correlação R é usado para se avaliar o ajuste global da equação aos dados). Este modelo permite que se faça a predição (ou cálculo) da variável dependente (ou explicada) segundo um conjunto conhecido de valores das variáveis independentes (ou explicativas ou ainda fatores).
Uma alternativa ao uso de regressões é o treinamento de uma rede neural a partir da base de dados. Este tipo de tecnologia tem sua origem na área de inteligência artificial e procura espelhar as características de aprendizado e processamento do cérebro humano. No desenvolvimento de redes neurais, a base de dados é dividida em (A) uma parcela de treinamento, sobre a qual o modelo é desenvolvido e (B) uma parcela para comparação, que contém tipicamente 15% da base original, usada para a avaliação das precisões dos modelos de predição gerados.
A qualidade dos modelos de predição obtidos é função direta da "qualidade" da base de dados. Uma base de alta qualidade é aquela que apresenta um alto nível de independência nos valores das variáveis e uma base de baixa qualidade conterá valores para muitas variáveis que tendem a se mover conjuntamente, de forma que seus valores não são independentes entre si.
A análise pode se basear em dados históricos. Na inexistência destes históricos, o processo de levantamento de dados deve ser desenhado de forma tal a garantir a melhor precisão de ajuste possível segundo o menor esforço de coleta de informações necessário. Uma das técnicas mais largamente utilizadas em projetos desta natureza é a de "Experimento Fatorial". No experimento fatorial as amostras (ou unidades experimentais) são determinadas pela explosão combinatorial dos valores possíveis de cada um dos fatores que tem influência na propriedade de interesse: um experimento fatorial completo de k fatores requererá, por exemplo, 2k amostras (sob a hipótese de que cada fator é estratificado em 2 níveis). Em raras situações é possível realizar um experimento fatorial completo. Através de uma técnica de fracionamento do experimento é possível reduzir o universo amostral considerando-se as características físico-químicas dos componentes assim como as restrições técnicas e operacionais de produção.
O Desafio
Os recursos de um laboratório de ensaios de uma refinaria devem ser prioritariamente utilizados para a certificação de produtos acabados; ou seja, a verificação da conformidade do produto às normas ditadas pela ANP. Ocorre que, em virtude da significativa variabilidade encontrada nos processos relativos à produção de derivados de petróleo (craqueamento, reforma, blendagem, etc.), parte da disponibilidade desses equipamentos é usada em ensaios de produtos intermediários do processo.
A motivação fundamental deste projeto foi a geração, via redes neurais, de modelos de predição de propriedades de produtos intermediários da refinaria que permitissem uma diminuição no esforço de análise do laboratório com ensaios de processo e consequentes (1) redução no custo operacional do laboratório e (2) liberação dos recursos físicos e humanos do laboratório para ensaios de certificação dos produtos acabados da refinaria. Além disso, esses modelos propiciariam o posterior desenvolvimento de sistemas de planejamento de produção baseados em otimização.
O Projeto
As características analisadas no âmbito deste projeto foram as seguintes:
| Produto | Características |
| Gasolina | Densidade |
| Diesel | Densidade, Fulgor e Viscosidade |
| Óleo Combustível | Densidade, Fulgor e Viscosidade |
Para cada par característica-produto foram consideradas variáveis relativas (a) ao processo de destilação na torre e (b) à composição da mistura de óleos crus. As informações do processo levadas em conta no estudo da densidade da gasolina, por exemplo, foram as seguintes:
| Unidade | Nome |
| g/cm3 | Densidade da Gasolina |
| ºC | Temp. Saída Gás Atm #25 |
| ºC | Temp. Saída Diesel #21 |
| ºC | Temp. Saída Prato 13 E101 |
| ºC | Temp. Saída Prato 7 E101 |
| ºC | Temp. Topo E101 |
| ºC | Temp. Base E101 |
| ºC | Temperatura do F-101 |
| kgf/cm2 | Pressão de Gasoleo |
| m3/h | Vaz. Refluxo Topo E101 |
| m3/h | Vaz. Querosene E101 |
| m3/h | Vaz. óleo Tipo C p/ Estoc. |
| m3/h | Vaz. Diesel E101 |
| m3/h | Vaz. Gasoleo Atm p/ E102 |
| ºC | Temp. Saída Combinada B101 |
| M3/h | Vaz. Cru p/ E101 |
| g/cm3 | Dens. CRU para Unidade |
Antes do modelamento, as informações foram submetidas a um processo de "higienização", que visou diagnosticar e corrigir ou mesmo remover (na ausência de solução) dados claramente incorretos ("outliers") ou desemparelhados (registros incompletos). Em seguida foram definidos critérios para a seleção das variáveis de análise como, por exemplo, o expurgo de variáveis constantes e dependentes, o agrupamento de variáveis (procedimento do tipo stepwise) e mesmo o auxílio dos especialistas no processo.
Para o modelamento foi utilizada a técnica de redes neurais. Diferentes topologias de rede foram calibradas para escolher a que apresentasse o melhor desempenho sobre o conjunto de validação (maior coeficiente de determinação R2 e menor desvio padrão do erro). Na topologia das redes foram testadas funções de ativação do tipo tangente hiperbólica e linear, números de camadas escondidas (uma ou duas), e número de neurônios nas camadas escondidas. Baseado em testes preliminares optou-se por trabalhar com redes com uma única camada escondida, função de ativação do tipo tangente hiperbólica na camada escondida e função de ativação linear na camada de saída. Foi definido ainda um número de neurônios na camada escondida que apresentasse o menor erro quadrado médio sobre o conjunto de validação, ou máximo R2. Para a escolha dos pesos da rede, finalmente, adotou-se aquela que obteve o menor erro quadrado médio entre as diversas redes calibradas dentro da configuração escolhida.
Os Resultados

Para os modelos de previsão da densidade da gasolina (figura ilustrativa) e do diesel obteve-se um bom resultado, com um erro menor do que 2% do valor real em cerca de 95% das vezes. No caso da viscosidade do óleo combustível, os resultados não foram conclusivos, devido à possível presença de ruído na massa de dados. Para as demais análises, verificou-se a necessidade de um maior aprofundamento.
Versão PDF
Enviar por e-mail