USO DA TÉCNICA DE REDES NEURAIS ARTIFICIAIS COMO MODELO DE DISTRIBUIÇÃO DE VIAGENS – O CASO DO AÇÚCAR PARA A EXPORTAÇÃO Daniel Neves Schmitz Gonçalves Luiz Antonio Silveira Lopes Marcelino Aurelio Vieira da Silva USO DA TÉCNICA DE REDES NEURAIS ARTIFICIAIS COMO MODELO DE DISTRIBUIÇÃO DE VIAGENS – O CASO DO AÇÚCAR PARA A EXPORTAÇÃO Daniel Neves S. Gonçalves Luiz Antônio S. Lopes Instituto Militar de Engenharia Marcelino Aurélio V. da Silva Universidade Federal do Rio de Janeiro RESUMO A análise e a previsão de demanda de transporte de carga é um estudo necessário para se levantar as prioridades de investimentos no sistema de transporte de uma região, sendo uma ferramenta útil para auxiliar o planejamento estratégico. Porém, a explicação do comportamento dos fluxos de cargas entre as regiões não é simples, necessitando de considerações e ferramentas adequadas para sua previsão. As Redes Neurais Artificiais (RNA) podem ser um substituto potencial aos modelos estatísticos convencionais, por sua fácil interface dos programas com o usuário. Este artigo tem por finalidade utilizar a técnica de RNAs, para estimar a matriz origem-destino (OD) de açúcar no Brasil destinado à exportação, a fim de explicar a variabilidade dos fluxos entre os pares origens destinos, considerando as características dinâmicas existentes nas matrizes O-D, comparando os resultados com o modelo Gravitacional (MG) que é um modelo muito utilizado em planejamentos do Governo Brasileiro. A técnica de RNA mostrou-se superior ao MG, apresentando maior Coeficiente de Determinação e menor Índice de Dissimilaridade. ABSTRACT Analysis and forecast of freight transport demand is a study required to raise investment priorities in transport system of a region, being a useful tool to assist the strategic planning. However, the explanation of the behavior of cargo flows between regions is not simple, requiring appropriate tools and considerations for his prediction. Artificial Neural Networks (ANN) can be a potential substitute to conventional statistical models for its easy interface of the programs with the user. Soon, the present work aims at using the technique of ANNs, to estimate the origin-destination (O-D) from sugar in Brazil for export in order to explain the variability of flows between origins pairs destinations, considering the dynamic characteristics existing in the O-D matrices, comparing the results with the Gravitational Model (MG) which is a model widely used in the planning of the Brazilian Government. The technique of ANN was superior to the MG, with higher coefficient of determination and lower dissimilarity index. 1. INTRODUÇÃO Introduzida no período colonial, a cana-de-açúcar se transformou em uma das principais culturas da economia brasileira. O açúcar ocupa a segunda colocação dentre as commodities agrícolas exportadas pelo Brasil, ficando atrás apenas da soja (Bueno, 2012). O Brasil não é apenas o maior produtor de cana, é também o primeiro do mundo na produção de açúcar e etanol. Responsável por mais da metade do açúcar comercializado no mundo, o País deve alcançar taxa média de aumento da produção de 3,25%, até 2018/19, e colher 47,34 milhões de toneladas do produto, o que corresponde a um acréscimo de 14,6 milhões de toneladas em relação ao período 2007/2008. Estima-se o aumento na exportação saltarão de 21 milhões de toneladas em 2007/08 para 32,64 milhões em 2018/19, aumento de 11,6 milhões de toneladas, conforme dados Ministério da Agricultura, Pecuária e Abastecimento (2014). O conhecimento do comportamento dos fluxos atuais e futuros de açúcar no Brasil para exportação ajuda no planejamento de investimentos em infraestrutura para melhorar a cadeia logística do produto. Uma cadeia logística bem estruturada, com boas condições de infraestrutura, investimento e capital humano é essencial, uma vez que o transporte tem grande peso no custo de exportação do açúcar. Sendo assim, a logística determina o quão competitivo o produto brasileiro pode ser frente a concorrentes, ainda mais no caso do açúcar, commodity 1 de baixo valor agregado. O modal rodoviário que é mais utilizado no escoamento de açúcar, enfrenta entraves que aumentam os custos para os produtores, chegando a 40% de sua receita (Santos, 2012). Para o conhecimento do comportamento dos fluxos futuros de uma Matriz O-D são utilizados modelos de Distribuição de viagens (DV), correspondente a segunda etapa do método sequencial de quatro etapas, sendo a parte do processo de planejamento de transportes que relaciona certo número de viagens que se originam em cada zona da área de estudo com um determinado número de viagens que se destinam às outras zonas desta área (Ortuzar e Willumsen, 2011). A previsão da DV permite a estimativa da matriz O-D para uma zona de estudo. Um modelo utilizado pelo governo brasileiro para a análise e a previsão de viagens é o Modelo Gravitacional (MG), sendo utilizado pelo Plano Nacional de Integração Hidroviária (PNIH), Plano Nacional de Logística e Transportes (PNLT) e em estudos de Viabilidade Técnica Econômica e Ambiental (EVTEA). Logo, seria de grande valia, analisar outro modelo, a fim de possuir uma nova opção. Segundo Brondino (1999), nos problemas de previsão a modelagem através das RNA surge como um substituto potencial aos modelos estatísticos convencionais, por sua fácil interface dos programas com o usuário e a não necessidade de possuir conhecimento prévio da relação das variáveis envolvidas, ao contrário de modelos estatísticos utilizados para o mesmo fim. Com base nestas características, o artigo tem o objetivo de estimar matrizes O-D de açúcar para a exportação no Brasil através da técnica de RNA, partindo da hipótese de que é possível utilizar esta técnica como um dos modelos de DV e da premissa que é possível utilizar o método sequencial de quatro etapas no planejamento de transporte de carga. O trabalho está organizado em quatro seções, incluindo esta introdução. A Seção 2 apresenta a estrutura conceitual e Seção 3 descreve o procedimento utilizado e os resultados obtidos e a Seção 4 apresenta as considerações finais e sugestões para futuros estudos. 2. REFERENCIAL TEÓRICO Nesta seção são referenciados os conceitos provenientes da literatura que auxiliam na melhor compreensão do assunto abordado neste trabalho. 2.1. Distribuição de viagens Entende-se que para fazer um bom planejamento dos transportes, é necessário ter conhecimento dos conceitos e modelos de demanda, compreendendo como estes estão relacionados com as atividades da região. Assim, um método muito utilizado é o Método sequencial também conhecido como modelo de quatro etapas ou Modelo de Uso do Solo e Transportes (Campos, 2013). Segundo Souza e D'Agosto (2013), Campos (2013), Tedesco (2008) e Bruton (1979) as quatro etapas são: Geração de viagens, DV, Divisão modal e Alocação de viagens. Entende-se por DV a parte do processo de planejamento de transportes que relaciona certo número de viagens que se originam em cada zona da área de estudo com um determinado número de viagens que se destinam às outras zonas desta área (Ortuzar e Willumsen, 2011). A previsão da DV permite a estimativa da matriz O-D para uma zona de estudo. Da análise dos trabalhos de Bruton (1979), Novaes (1981), Willumsen (1981), Abrahamssom 2 (1998), Timms (2001), Sherali et al (2003), Grange, et al. (2010), Bertoncini (2010) e Souza e D'Agosto (2013) verificou-se que de acordo com o método escolhido os modelos podem ser divididos em: (i) modelos de fator de crescimento; (ii) inferência estatística; (iii) modelos gravitacionais e (iv) modelos entrópicos. Um modelo muito utilizado em estudos do governo brasileiro é o Modelo Gravitacional (MG). Os MGs estudados e aplicados em transportes tiveram sua origem em suposições de que os padrões de interação espacial são regidos por leis análogas à Lei da Gravitação Universal formulada por Newton em 1686, onde a força de gravidade que age entre dois corpos é diretamente proporcional à massa dos dois corpos e inversamente proporcional ao quadrado da distância entre eles (Bruton, 1979; Ortuzar e Willumsen, 2011; Campos, 2013). O MG é calibrado, dentre outras formas, por regressões estatísticas múltiplas, este considera que a taxa de geração de viagens a partir de uma dada zona de origem é proporcional à massa da mesma, expressa por uma variável como, por exemplo a produção agrícola (Aguiar Júnior, 2004). 2.2. Redes Neurais Artificiais De acordo com Corrêa (2008) o cérebro humano é considerado o mais fascinante processador composto por 100 bilhões de neurônios aproximadamente, conectados uns aos outros por meio de sinapses, formando uma grande rede, chamada de rede neural, que rege todos os movimentos e funções do organismo além de proporcionar uma grande capacidade de processamento e armazenamento de informações. O sonho de incontáveis gerações de pesquisadores tem sido entender o funcionamento do cérebro humano e construir uma máquina que possa reproduzilo, ainda que parcialmente (Haykin, 2001). Dentre as técnicas de Inteligência Artificial, uma das mais promissoras, uma vez que tem sido bastante divulgada e, portanto utilizada, é a Rede Neural Artificial (RNA), ou simplesmente Rede Neural (RN), atraindo diversos pesquisadores de enumeras áreas de conhecimento (Rodrigues Filho et a.l,1995). As RNAs são modelos matemáticos que tentam simular o funcionamento do cérebro humano com objetivo de resolver problemas da vida real. As RNAs são utilizadas nas mais diversas áreas de aplicação como previsão, classificação, controle entre outros (Brondino, 1999). Podese afirmar que RNAs são sistemas paralelos distribuídos, compostos por unidades de processamento simples (nós) que calculam determinadas funções matemáticas, que normalmente não são lineares (Alves et al., 2012). O neurônio artificial é uma unidade de processamento matematicamente simples, que recebe uma ou mais entradas e as transforma em saídas (Brondino, 1999). As RNAs são muito eficientes, particularmente, na resolução de problemas em que não se tem formulação analítica ou não se tem conhecimento explícito acessível ou os dados estão contaminados por ruído ou o próprio problema modifica-se com o passar do tempo (Raia Jr, 2000) Dentre as diversas topologias, pode-se mencionar a Multlayer Perceptron (MP), a mais conhecida e utilizada (Raia Jr, 2000) sendo estas uma generalização da rede perceptron, pertencendo à arquitetura feedforwards em que todas as saídas dos neurônios de uma camada são conectadas com todos os neurônios da camada posterior obedecendo à direção entrada e saída, não havendo conexões entre neurônios de uma mesma camada, seu treinamento é feito de forma supervisionada. O mecanismo utilizado para a aprendizagem no caso do MP é 3 conhecido como algoritmo backpropagation (Batista, 2012). Para a determinação dos pesos sinápticos é preciso realizar um processo de aprendizagem da rede, onde os dados são separados em três conjuntos: treinamento, teste e validação. A aprendizagem é o processo pelo qual os parâmetros de uma rede neural são ajustados através de uma forma continuada de estímulo pelo ambiente no qual a rede está operando, sendo o tipo específico de aprendizagem definido pela maneira particular como ocorrem os ajustes realizados nos parâmetros (Mendel e McLaren, 1970). Para realização do processo de determinação dos pesos sinápticos é necessário um algoritmo de otimização não-linear como por exemplo a Regra Delta Generalizada ou, mais comumente, backpropagation (BP). Para um primeiro passo de treinamento a rede produz uma saída, que apresentará diferença com o valor desejado representado pelo erro. O objetivo do processo de treinamento é buscar diminuir o valor do erro. Para isso, o valor dos pesos devem ser ajustados a cada novo passo do treinamento. A regra BP proporciona que os pesos da camada de saída sejam os primeiros a serem ajustados e, posteriormente, os pesos das demais camadas, de trás para frente (Brondino, 1999). Existem diversas variações do algoritmo BP, são elas: Gradient descent backpropagation; Gradient descent backpropagation com momentum; Gradient descent backpropagation com taxa adaptativa; Gradient descent backpropagation com momentum e taxa adaptativa; Levenberg-Marquardt backpropagation e Resilient backpropagation. Com objetivo limitar a saída do neurônio dentro de um intervalo de valores razoáveis a serem assumidos pela sua própria imagem funcional, existem as funções de ativação que de acordo com Batista (2012) estas podem ser divididas em dois grupos principais, sendo o primeiro aquelas que possuem pontos onde suas derivadas de primeira ordem são inexistentes (função Degrau, degrau bipolar e rampa simétrica) e o segundo grupo funções cujas suas derivadas de primeira ordem existem e são conhecidas em todos os pontos de seu domínio. As principais funções desse grupo são: função sigmoidal (logística), tangente hiperbólica, gaussiana e linear. 2.2.1. Aplicação da Técnica de Redes Neurais artificiais no transporte As redes neurais têm um potencial de aplicação muito vasto na área de transportes (Madalozo, Dyminski e Ribeiro, 1997). De acordo com Raia Jr (2000), um dos primeiros estudos de aplicação de RNAs na área de Engenharia de Transporte teria sido o de Nakatsuji e Kaku (1989), procurando resolver problemas relacionados com a Engenharia de Tráfego. Já no Brasil, isto aconteceu a partir da segunda metade da década de 1990 (Correa, 2008). Com intuito de ampliar o conhecimento da aplicação de RNA e criar um procedimento para atingir o objetivo proposto, foram analisados diversos trabalhos que utilizaram RNAs com aplicação no planejamento de transportes, especificamente quanto a previsão de demanda/viagens, a fim de identificar padrões para escolha dos parâmetros da rede, destes trabalhos, podemos destacar: Dougherty e Cobbett (1997); Kirby, Watson e Dougherty (1997); Raia Jr (2000); Dia (2001); Aguiar Júnior (2004); Junior, Moreira, Pessanha e Jacinto (2004); Madalozo, Dyminski e Ribeiro (2004). 3. PROCEDIMENTO PROSTO E SUA APLICAÇÃO Nesta seção é apresentado o procedimento adotado na elaboração do artigo proposto. O 4 fluxograma que pode ser observado na Figura 1 mostra as sete etapas do procedimento proposto para estimar matrizes O-D de carga. Os próximos subitens desta seção apresentarão os detalhes de cada etapa com os resultados da aplicação do caso de exportação de açúcar no Brasil. Figura 1: Procedimento para estimar matriz O-D de carga utilizando RNA 3.1. Definição e levantamento do tipo de carga a ser estudada e levantamento da série histórica. Na primeira etapa deve ser definido o tipo de carga a ser estudado, o recorte geográfico e o motivo do transporte da mesma. A partir das definições citadas deve-se levantar a série histórica do produto a fim de ampliar o conhecimento e de possuir dados para aplicação em modelos de previsão. O produto escolhido foi o açúcar destinado a exportação, por ser a segunda commodity agrícola mais exportada pelo Brasil e pelo fato de que o Brasil é o maior produtor do mundo na produção da mesma (Bueno, 2012 e MAPA, 2014). A série histórica do açúcar foi obtida no portal ALICE WEB (2013) do ano de 2002 à 2010, referentes ao fluxo de açúcar em toneladas, cuja origem são os municípios produtores e os destinos os portos para exportação, logo, não foram analisadas o fluxo para o abastecimento interno do país. Com isso foi possível montar a matriz O-D para cada ano. 3.2. Análise dos Dados Definido o tipo de carga a ser estudada e levantada sua série histórica deverão ser definidas as variáveis independentes que serão utilizadas como entrada para a RNA e estas devem ser normalizadas e trabalhadas de maneira a aumentar a precisão da técnica. Sistemas de informação Geográficas (SIG) podem ser utilizados para obtenção de dados caso seja necessário. 5 Por se tratar de estimativas de matrizes O-D de fluxos de carga tentou-se neste trabalho buscar uma analogia com os modelos gravitacionais e entrópicos. Para esses modelos as variáveis independentes são: Oi que representa a quantidade de carga em toneladas que saem de cada zona de tráfego de origem i; Dj a quantidade de carga em toneladas que chega em cada zona de tráfego j; e dij é a impedância ente a origem i e o destino j. A variável dependente é o Tij que é a quantidade de carga em tonelada que sai da origem i para o destino j. A impedância é qualquer variável que quanto maior o seu valor diminui a probabilidade de ocorrer viagens ou fluxos de carga ou pessoas como: distância, tempo, valor do frete, custos logísticos entre outros (Ortuzar e Willumsen, 2011). A impedância adotada na aplicação foi à distância rodoviária, uma vez que o modo rodoviário representa mais de 61,1% do transporte de carga no Brasil (CNT, 2012) e os dados obtidos não estão separados por modos de transportes. Para facilitar a análise os municípios de origem foram agrupados em mesorregiões, gerando um total de 900 pares de pontos, suas distâncias rodoviárias foram determinadas a partir do centroide destas, com o auxílio do software TransCAD© versão 5.0. Selecionados os dados de entrada (Produção, atração e distância), estes foram normalizados entre 0 e 1 através da equação 1. em que � � = x − í : Produção, atração e distância i; : menor valor; á�: maior�valor. á�− í (1) í 3.3. Arquitetura da Rede Neural Nesta etapa deve-se definir a ferramenta para aplicar a técnica de RNA. Uma vez definida, deve-se definir a topologia da rede, o número de camadas ocultas, algoritmo de aprendizado e a função de ativação de acordo com a funcionalidade e abrangência da ferramenta definida. A ferramenta escolhida para treinar a rede e estimar foi o software MathWorks MatLAB© que além de oferecer um ambiente completamente amigável, admite a utilização de ferramentas úteis ao desenvolvimento intuitivo de Redes Neurais (Araujo e Melo, 2006). Sua arquitetura aberta torna possível a utilização de programas acessórios que expandem as funcionalidades, conhecidos por toolbox, sendo um destes o Neural Network Toolbox (NNT), onde traz um conjunto de funções e uma interface gráfica para que se possa projetar, implementar, visualizar e simular redes (The Mathworks, 2002 e 2003 apud Aguiar Júnior, 2004). Na aplicação da RNA para o problema deste artigo, optou-se pela rede do tipo MP por ser a mais conhecida e utilizada na literatura (Raia Jr, 2000), decidiu-se avaliar o comportamento da RNA para uma camada oculta já que Batista (2012) ressalta que o aumento do número de camadas acarreta o aumento da complexidade e do tempo de processamento da rede. O algoritmo de treinamento escolhido foi Levenberg-Marquardt, pois segundo Araújo e Melo (2006) e Yuehua et al (2008) ele caracteriza-se como um dos métodos mais rápidos para o treinamento de RN Acíclicas de tamanho moderado, além disso é eficaz na minimização de funções com um pequeno número de parâmetros e o tempo de convergência da rede tende a ser 6 menor quando comparado aos outros modelos e possui elevada precisão. Como função de ativação optou-se pela tangente hiperbólica por ser a melhor opção para função de ativação dos neurônios, tanto na camada intermediária quanto na camada de saída nos estudos realizados por Aguiar Júnior (2004). Testes ainda preliminares não mostraram ganho de desempenho com mais de uma camada oculta e com outras funções de ativação e algoritmos de aprendizado. Após definir a arquitetura da rede, os dados obtidos foram divididos aleatoriamente em 70% para treinamento, 15% para teste e 15% para validação e foi removido o ano de 2010 com o objetivo de estima-lo no final do treinamento. 3.4. Determinação do número de neurônios Nesta etapa o número de neurônios na camada oculta deve ser determinado a partir de diversos testes, devendo este não ser muito pequeno, pois diminuiria a precisão do modelo e nem muito grande devido ao over-fitting. Não existe uma formula ou método na literatura que possa auxiliar na identificação do número de neurônios na camada oculta para o conjunto de treinamento. Para estipular este número, testou-se um intervalo de 1 à 15 neurônios avaliando seus respectivos R². O valor do R² referese ao ponto em que se deu a parada do treinamento na melhor situação. Conforme pode ser observado na figura 2, o maior R² obtido foi com 11 neurônios na camada intermediária, logo a rede possui 3 neurônios na camada de entrada, 11 na camada intermediária e 1 na camada de saída. 1,0000 0,9800 0,9600 R² 0,9400 0,9200 0,9000 0,8800 0,8600 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Número de Neurônios na camada oculta Figura 2: Determinação do número de Neurônios na camada intermediária 3.5. Estimativa para o ano futuro Nesta etapa, deverão ser realizadas as estimativas para o ano futuro com a RNA definida no passo anterior. Com objetivo de avaliar o desempenho da RNA definida do artigo, foi definido um MG. A Equação 2 mostra o modelo utilizado por da Silva e D´Agosto (2013). Os valores de ��� serão determinados na etapa 4, pois estes são os coeficiente de balanceamento. O modelo de tendência é definido adotando os valores do coeficiente de balanceamento iguais a 1 e encontrando os parâmetros epelo método dos mínimos quadrados ordinários 7 ��������������������������������������������������������������� = �. . . � .� (2) � 3.6. Balanceamento Para um período futuro em que se deseja estabelecer a matriz O-D, estima-se os valores de fluxos baseado na tendência observada e determinada no passo 4 e, em seguida, determina-se os coeficientes de balanceamento ( ��� ) por meio da formulação de um problema de otimização de multi-objetivos proposto por da Silva e D´Agosto (2013), uma vez que se tem como objetivo atender todas as restrições apresentadas na Tabela 1. A solução adotada para modelagem foi a formulação de modelo por programação por metas, utilizando o método dos pesos (da Silva e D´Agosto, 2013). Tabela 1: Função objetivo e restrições para o balanceamento da matriz O-D Restrição ∑ � = � �e ∑ � =�� � Função objetivo ��� { �+ + � − , �+ + �− , Função objetivo ponderada (Minimizar) = , , ,…, = , , ,…, As metas podem ser expressas da seguinte maneira: ∑ =1 � − �+ + �− = � , para todo j. ∑ =1 � − �+ + �− = � , para todo i. . ,Tij, �+ , �− , �+ e �− ≥ 0, para todo i e j. ∑ � � + + �− + ∑ � . � + + � − =1 =1 Sendo: a+ : desvio positivo do ∑I=1 T em relação à�D , para cada destino j; a− : desvio negativo do ∑ =1 � em relação à D , para cada destino j; p+ : desvio positivo do ∑ =1 � em relação à O , para cada origem i. p− : desvio negativo do ∑ =1 � em relação à O , para cada origem i. η ∶�peso do desvio ocorrido em relação à produção da origem i; ϑ : peso do desvio ocorrido em relação à atração do destino j. Para encontrar os valores dos coeficientes de balanceamento foi utilizado o software solver©. A busca pelos valores são um problema de otimização não-linear e o “solver©” utiliza o método do Gradiente Reduzido Generalizado (GRG) para resolver. 3.7. Análise dos erros das previsões Uma importante componente na construção de um modelo é a avaliação da capacidade de replicar um conjunto de dados conhecidos. Para avaliar esta capacidade, medidas estatísticas, conhecidas como goodness-of-fit, são utilizadas com objetivo de medir a proximidade entre o conjunto observado e o estimado pelo modelo, como pode ser visto nos trabalhos de Wilson (1970), Wilson (1976), Smith e Hutchinson (1981), Knudsen e Fotheringham (1986) e Sikdar e Hutchinson (1981). As medidas que mais se destacaram nos trabalhos citados anteriormente foram o Índice de Dissimilaridade (ID) e coeficiente de determinação (R2). A fim de validar o modelo proposto, foi estimada a mesma demanda utilizando o MG 8 tradicional. A escolha do MG se deu por ser muito utilizado em estudos do governo e por ser muito conhecido na literatura. A tabela 2 apresenta os valores das goodness-of-fit para todos os modelos estudados, aplicados na estimativa do ano de 2010. Tabela 2: Análise de desempenho dos modelos estudados Goodness-of-fit MG RNA R² (Tijp x Tijr) 0,851 0,904 ID (Tijp x Tijr) 24,13% 18,54% Tijp: são os valores dos fluxos estimados por cada modelo para o ano de 2010 Tijr: são os valores dos fluxos reais para o ano de 2010. As medidas estatísticas mostraram a precisão do modelo de RNA, onde a estimativa do ano de 2010 foi próxima a real. O modelo que utilizou a técnica de RNA possui um coeficiente de determinação de 0,904 o que indica que o modelo conseguiu explicar 90,4% dos valores observados já o MG apenas 85,1%. Em relação ao Índice de dissimilaridade o modelo de RNA possuiu apenas 18,54% enquanto o MG 24,13%. 4. CONSIDERAÇÕES FINAIS O presente trabalho procurou utilizar a técnica de RNAs como modelo de distribuição de viagens, do transporte de carga, a fim de mostrar mais uma opção para o cálculo do mesmo, aplicando a técnica proposta para a commodity açúcar destinada à exportação. O trabalho visa contribuir para o desenvolvimento de novas técnicas aplicadas no estudo de planejamento de transporte de carga, podendo ser utilizado em futuros estudos do governo. O procedimento proposto foi capaz de estimar a matriz O-D de fluxo de açúcar brasileiro destinado à exportação. O modelo de RNA construído e treinado com o software Mathwoks MatLAB/NNT©, permitiu conhecer a variação de demanda e destacou-se por apresentar maior precisão em relação ao MG, apresentando um coeficiente de determinação (R²) superior em 5,3% e possuindo Índice de Dissimilaridade (ID) 5,59% menor, mostrando então uma nova alternativa para o cálculo da DV já que a diferença de precisão é favorável ao modelo proposto, porém, este procedimento deve ser aplicado em outros produtos para comprovar sua eficácia. A matriz não é estática ao longo dos anos, ou seja, existem variações na quantidade de origens, destinos, distância média e a quantidade exportada com o tempo, caracterizando um comportamento dinâmico. Como trabalhos futuros, a investigação do comportamento da RNA quando se leva em consideração também a estrutura da rede multimodal brasileira, pois, ao modificar os padrões de oferta e consumo bem como a rede multimodal, os fluxos entre pares OD podem mudar. A forma de entrada dos dados influenciaram o desempenho e a arquitetura final da RNA, logo esta etapa deve ser bem planejada. Outro fator que influenciou o desempenho foi a quantidade de neurônios na camada intermediária, logo esta quantidade deve ser comparada e treinada inúmeras vezes. O balanceamento mostrou-se eficaz, aumentando a precisão de ambos os modelos. 9 Mesmo com sua elevada precisão, o modelo apresentou erros que podem ser melhorados com outras arquiteturas de redes, acrescentando camadas ocultas e alterando o algoritmo de aprendizado e/ou função de ativação. Agradecimentos Para a Confederação Nacional do Transporte (CNT), o Serviço Social do Transporte (SEST), o Serviço Nacional de Aprendizagem do Transporte (SENAT) e para o Instituto de Transporte e Logística (ITL) pelo apoio financeiro. REFERÊNCIAS BIBLIOGRÁFICAS Aguiar Júnior, S.R. (2004) Modelo RAPIDE: uma aplicação de mineração de dados e redes neurais artificiais para a estimativa da demanda por transporte rodoviário interestadual de passageiros no Brasil. Dissertação (Mestrado em Gestão do conhecimento e da Tecnologia da informação), Universidade Católica de Brasília, Brasília. Aguiar Júnior, H.P.A.; Moreira, T.C.; Pessanha, V.G. e Jacinto A.M. (2004) Previsão da demanda de passageiros no Sistema de Transporte Coletivo utilizando as Redes Neurais Artificiais e os Algoritmos Genéticos. IV Congresso Brasileiro de Computação - CBCOMP, Itajaí. Alves, V. F. b., Silva, A. N. R. e Waerden, P. (2012) Técnicas exploratórias para localizar potenciais usuários de transporte público urbano. Journal of Transport Literature, vol. 6, n. 3, pp; 180-203. Araújo, R.B. e Melo, P.L.S.V. (2006) Protótipo de Software para aprendizagem de Redes Neurais Artificiais. Anaiss do XXXIV COBENGE. Ed. Universidade de Passo Fundo. Passo fundo. Batista; B.C.F. (2012) Soluções de Equações Diferenciais usando Redes Neurais de Múltiplas camadas com os métodos da Descida mais íngreme e Levenberg-Marquardt. Dissertação (Mestrado em Matemática), Universidade Federal do Pará, Bélem. Bertoncini, B. (2010) Uma proposta de estimação da matriz OD a partir dos fluxos de tráfego observados nas interseções da rede de transporte. Tese (doutorado em Engenharia de Transportes), Escola de Engenharia de São Carlos da Universidade de São Paulo, São Paulo. Brondino, M. C. (1999) Estudo da influência da acessibilidade no valor de lotes urbanos através de redes neurais. Tese (Doutorado em Engenharia Civil - Transportes), Escola de Engenharia de São Carlos da Universidade de São Paulo, São Paulo. Bruton, M. J. (1979) Introdução ao planejamento dos transportes. São Paulo: Editora da universidade de São Paulo. Bueno, M. S. (2012) Análise da cadeia logística de exportação de açúcar. Trabalho de Iniciação Científica realizado no grupo ESALQ-LOG Campos, V. B. G. (2013) Planejamento de Transportes - conceitos e modelos. Rio de Janeiro: Editora interciência. Corrêa, F. (2008) Aplicação de redes neurais artificiais no setor de transportes no Brasil. Dissertação (Mestrado em Engenharia Urbana), Universidade Federal de São Carlos, São Paulo. da Silva, M. e D´Agosto, M. (2013) A model to estimate the origin-destination matrix for soybean exportation in Brazil. Journal of Transport Geography, vol .26, pp. 97-107. Dia, H. (2001) An object-oriented neural nerwork approach to short-tem traffic forecasting. European Journal of Operational Research, vol. 131, pp. 253-261. Dougherty, M.S. e Cobbett, M.R. (1997) Short-term inter-urban traffic forecastsusing neural networks. International Journal of Forecasting,vol. 12, pp. 21-31.. Grange, L., Fernández, E. e Cea, J. (2010) A consolidate model of trip distribution. Transportation Research Part E, vol. 46, pp. 61-75. Haykin, S. (2001) Redes Neurais: princípios e prática. 2ª ed. Porto Alegre: Bookman. Kaiser, M. S., Prata, P. A. e Ribeiro, G. M. (2007) Análise comparativa entre o TransCAD e heurísticas de agrupamento e de roteamento de veículos. XXI Associação Nacional de Pesquisa e Ensino em Tranporte, Rio de Janeiro. Disponível em: <www.cbtu.gov.br/estudos/pesquisa/anpet/PDF/3_186_AC.pdf >. Kirby, H.R., Watson, S.M e Dougherty, M.S. (1997) Should we use neural networks or statistical models for shortterm motorway traffic forecasting?, International Journal of Forecasting, vol 1, n. 1, pp. 43-50. Knudsen, D. C. e Fotheringham, A. S. (1986) Matrix Comparison, Goodness-of-Fit, and Spatial Interaction Modeling. International Regional Science Review, vol. 10, n.2, pp. 127-147. Madalozo, H.C. Dyminski, A.S. e Ribeiro, E.O. (2004) Análise de curvas horizontais de rodovias, para melhoramento de projeto e operação, utilizando redes neurais artificiais. Anais do 18° Congresso Brasileiro de Transporte e Trânsito -ANPET, Santa Catarina. 10 Mendel, M., e McLaren, R. (1970) Adaptive, Learning, and Pattern Recognition Systems: Theroy and Applications. Reinforcement-learning control and pattern recognition systems vol. 66, pp. 287-318. New York: Academic Press. MAPA (2014) Ministério da Agricultura, Pecuária e Abastecimento. Disponível em: <www.agricultura.gov.br/vegetal/culturas/cana-de-acucar>. Nakatsuji, T. e Kaku, T. (1989) Application of Neural Network Models to Traffic Engineering Problems. Proceedings of the Infrastructure Planning, vol. 12, pp. 297-403. Novaes, A. G. (1981) Modelos em Planejamento Urbano, Regional e de Transportes. São Paulo: Rdgard Blucher. Ortuzar, J. d., e Willumsen, L. G. (2011) Modelling Transport - 4th ed. New York: Wiley&Sons. Raia Jr, A. A. (2000) Acessibilidade e mobilidade na estimativa de um índice de potencial de viagens utilizando redes neurais artificiais e sistemas de informações geográficas. Tese (Doutorado em Engenharia Civil Transportes), Escola de Engenharia de São Carlos, Universidade de São Paulo, São Paulo. Rodrigues Filho, I. W.. Tafner, M. A., Xerez, M. (1995) Redes neurais artificiais: introdução e princípios de neurocomputação. Eko. Sherali, H., Narayanan, A. e Sivanandan, R. (2003) Estimation os origin-destination trip-tables on a partial set of traffic link volumes. Transportation Research Part B, vol. 37, n. 9, pp. 815-836. Sikdar, P. K. e Hutchinson, B. G. (1981) Empirical Studies of Work Trip Distribution Models. Transportation Research Part A, vol, 15, n. 3, pp. 233-243. Smith, D. P. e Hutchinson, G. B. (1981) Goodness of Fit Statistics for trip Distribution Models. Transpotation Research Part 4, vol. 15, n.4, pp. 295-303. Soares, P.P.S. e Nadal, J.(1999) Aplicação de uma Rede Neural Feedforward com Algoritmo de LevenbergMarquardt para Classificação de Alterações do Segmento ST do Eletrocardiograma.Proceeding of the IV Brazilian Conference on Neural Networks - pp. 384-389, ITA, São José dos Campos, São Paulo Souza, C. D. R. e D'Agosto, M. A. (2013) Modelo de quatro etapas aplicado ao planejamento de transporte de carga. Journal of Transport Literature, Vol. 7, n. 2, pp. 207-234. Timms, P. (2001) A philosophical context for methods to estimate origin-destination trip matrices using link counts. Transport Reviews, vol. 21, n. 3, pp. 269-301. Willumsen, L. (1981) Simplified transport models based on traffic counts. Transportation, vol, 10, pp. 257-278. Wilson, A. G. (1970) Entropy in Urban and Regional Modelling. London: Pion. Wilson, S. R. (1976) Statistical Notes on the Evaluation of Calibrated Gravity Models. Transportation Research, vol. 10, n.5, pp. 343-345. Willumsen, L. G. (1978) Estimation of on O_D matrix traffic counts - A review. Working Paper, Institute of Transport Studies, University of Leeds, disponível em <epronts.whiterose.ac.uk/2415/>. Yuehua, Z.H.U., Chen, Y., Geng, X. e Liu, L. (2008) Transport Modal Split of Commercial Sites Based on Artificial Neural Network. Journal of Transportation, Vol. 8, n. 1, February. Disponível em <http://www.sciencedirect.com>. 11