uso da técnica de redes neurais artificiais como modelo de

USO DA TÉCNICA DE REDES NEURAIS ARTIFICIAIS
COMO MODELO DE DISTRIBUIÇÃO DE VIAGENS – O
CASO DO AÇÚCAR PARA A EXPORTAÇÃO
Daniel Neves Schmitz Gonçalves
Luiz Antonio Silveira Lopes
Marcelino Aurelio Vieira da Silva
USO DA TÉCNICA DE REDES NEURAIS ARTIFICIAIS COMO MODELO DE
DISTRIBUIÇÃO DE VIAGENS – O CASO DO AÇÚCAR PARA A EXPORTAÇÃO
Daniel Neves S. Gonçalves
Luiz Antônio S. Lopes
Instituto Militar de Engenharia
Marcelino Aurélio V. da Silva
Universidade Federal do Rio de Janeiro
RESUMO
A análise e a previsão de demanda de transporte de carga é um estudo necessário para se levantar as prioridades
de investimentos no sistema de transporte de uma região, sendo uma ferramenta útil para auxiliar o planejamento
estratégico. Porém, a explicação do comportamento dos fluxos de cargas entre as regiões não é simples,
necessitando de considerações e ferramentas adequadas para sua previsão. As Redes Neurais Artificiais (RNA)
podem ser um substituto potencial aos modelos estatísticos convencionais, por sua fácil interface dos programas
com o usuário. Este artigo tem por finalidade utilizar a técnica de RNAs, para estimar a matriz origem-destino (OD) de açúcar no Brasil destinado à exportação, a fim de explicar a variabilidade dos fluxos entre os pares origens
destinos, considerando as características dinâmicas existentes nas matrizes O-D, comparando os resultados com o
modelo Gravitacional (MG) que é um modelo muito utilizado em planejamentos do Governo Brasileiro. A técnica
de RNA mostrou-se superior ao MG, apresentando maior Coeficiente de Determinação e menor Índice de
Dissimilaridade.
ABSTRACT
Analysis and forecast of freight transport demand is a study required to raise investment priorities in transport
system of a region, being a useful tool to assist the strategic planning. However, the explanation of the behavior
of cargo flows between regions is not simple, requiring appropriate tools and considerations for his prediction.
Artificial Neural Networks (ANN) can be a potential substitute to conventional statistical models for its easy
interface of the programs with the user. Soon, the present work aims at using the technique of ANNs, to estimate
the origin-destination (O-D) from sugar in Brazil for export in order to explain the variability of flows between
origins pairs destinations, considering the dynamic characteristics existing in the O-D matrices, comparing the
results with the Gravitational Model (MG) which is a model widely used in the planning of the Brazilian
Government. The technique of ANN was superior to the MG, with higher coefficient of determination and lower
dissimilarity index.
1. INTRODUÇÃO
Introduzida no período colonial, a cana-de-açúcar se transformou em uma das principais
culturas da economia brasileira. O açúcar ocupa a segunda colocação dentre as commodities
agrícolas exportadas pelo Brasil, ficando atrás apenas da soja (Bueno, 2012). O Brasil não é
apenas o maior produtor de cana, é também o primeiro do mundo na produção de açúcar e
etanol. Responsável por mais da metade do açúcar comercializado no mundo, o País deve
alcançar taxa média de aumento da produção de 3,25%, até 2018/19, e colher 47,34 milhões de
toneladas do produto, o que corresponde a um acréscimo de 14,6 milhões de toneladas em
relação ao período 2007/2008. Estima-se o aumento na exportação saltarão de 21 milhões de
toneladas em 2007/08 para 32,64 milhões em 2018/19, aumento de 11,6 milhões de toneladas,
conforme dados Ministério da Agricultura, Pecuária e Abastecimento (2014).
O conhecimento do comportamento dos fluxos atuais e futuros de açúcar no Brasil para
exportação ajuda no planejamento de investimentos em infraestrutura para melhorar a cadeia
logística do produto. Uma cadeia logística bem estruturada, com boas condições de
infraestrutura, investimento e capital humano é essencial, uma vez que o transporte tem grande
peso no custo de exportação do açúcar. Sendo assim, a logística determina o quão competitivo
o produto brasileiro pode ser frente a concorrentes, ainda mais no caso do açúcar, commodity
1
de baixo valor agregado. O modal rodoviário que é mais utilizado no escoamento de açúcar,
enfrenta entraves que aumentam os custos para os produtores, chegando a 40% de sua receita
(Santos, 2012).
Para o conhecimento do comportamento dos fluxos futuros de uma Matriz O-D são utilizados
modelos de Distribuição de viagens (DV), correspondente a segunda etapa do método
sequencial de quatro etapas, sendo a parte do processo de planejamento de transportes que
relaciona certo número de viagens que se originam em cada zona da área de estudo com um
determinado número de viagens que se destinam às outras zonas desta área (Ortuzar e
Willumsen, 2011). A previsão da DV permite a estimativa da matriz O-D para uma zona de
estudo.
Um modelo utilizado pelo governo brasileiro para a análise e a previsão de viagens é o Modelo
Gravitacional (MG), sendo utilizado pelo Plano Nacional de Integração Hidroviária (PNIH),
Plano Nacional de Logística e Transportes (PNLT) e em estudos de Viabilidade Técnica
Econômica e Ambiental (EVTEA). Logo, seria de grande valia, analisar outro modelo, a fim de
possuir uma nova opção.
Segundo Brondino (1999), nos problemas de previsão a modelagem através das RNA surge
como um substituto potencial aos modelos estatísticos convencionais, por sua fácil interface
dos programas com o usuário e a não necessidade de possuir conhecimento prévio da relação
das variáveis envolvidas, ao contrário de modelos estatísticos utilizados para o mesmo fim.
Com base nestas características, o artigo tem o objetivo de estimar matrizes O-D de açúcar para
a exportação no Brasil através da técnica de RNA, partindo da hipótese de que é possível utilizar
esta técnica como um dos modelos de DV e da premissa que é possível utilizar o método
sequencial de quatro etapas no planejamento de transporte de carga.
O trabalho está organizado em quatro seções, incluindo esta introdução. A Seção 2 apresenta a
estrutura conceitual e Seção 3 descreve o procedimento utilizado e os resultados obtidos e a
Seção 4 apresenta as considerações finais e sugestões para futuros estudos.
2. REFERENCIAL TEÓRICO
Nesta seção são referenciados os conceitos provenientes da literatura que auxiliam na melhor
compreensão do assunto abordado neste trabalho.
2.1. Distribuição de viagens
Entende-se que para fazer um bom planejamento dos transportes, é necessário ter conhecimento
dos conceitos e modelos de demanda, compreendendo como estes estão relacionados com as
atividades da região. Assim, um método muito utilizado é o Método sequencial também
conhecido como modelo de quatro etapas ou Modelo de Uso do Solo e Transportes (Campos,
2013). Segundo Souza e D'Agosto (2013), Campos (2013), Tedesco (2008) e Bruton (1979) as
quatro etapas são: Geração de viagens, DV, Divisão modal e Alocação de viagens. Entende-se
por DV a parte do processo de planejamento de transportes que relaciona certo número de
viagens que se originam em cada zona da área de estudo com um determinado número de
viagens que se destinam às outras zonas desta área (Ortuzar e Willumsen, 2011). A previsão da
DV permite a estimativa da matriz O-D para uma zona de estudo.
Da análise dos trabalhos de Bruton (1979), Novaes (1981), Willumsen (1981), Abrahamssom
2
(1998), Timms (2001), Sherali et al (2003), Grange, et al. (2010), Bertoncini (2010) e Souza e
D'Agosto (2013) verificou-se que de acordo com o método escolhido os modelos podem ser
divididos em: (i) modelos de fator de crescimento; (ii) inferência estatística; (iii) modelos
gravitacionais e (iv) modelos entrópicos.
Um modelo muito utilizado em estudos do governo brasileiro é o Modelo Gravitacional (MG).
Os MGs estudados e aplicados em transportes tiveram sua origem em suposições de que os
padrões de interação espacial são regidos por leis análogas à Lei da Gravitação Universal
formulada por Newton em 1686, onde a força de gravidade que age entre dois corpos é
diretamente proporcional à massa dos dois corpos e inversamente proporcional ao quadrado da
distância entre eles (Bruton, 1979; Ortuzar e Willumsen, 2011; Campos, 2013). O MG é
calibrado, dentre outras formas, por regressões estatísticas múltiplas, este considera que a taxa
de geração de viagens a partir de uma dada zona de origem é proporcional à massa da mesma,
expressa por uma variável como, por exemplo a produção agrícola (Aguiar Júnior, 2004).
2.2. Redes Neurais Artificiais
De acordo com Corrêa (2008) o cérebro humano é considerado o mais fascinante processador
composto por 100 bilhões de neurônios aproximadamente, conectados uns aos outros por meio
de sinapses, formando uma grande rede, chamada de rede neural, que rege todos os movimentos
e funções do organismo além de proporcionar uma grande capacidade de processamento e
armazenamento de informações. O sonho de incontáveis gerações de pesquisadores tem sido
entender o funcionamento do cérebro humano e construir uma máquina que possa reproduzilo, ainda que parcialmente (Haykin, 2001).
Dentre as técnicas de Inteligência Artificial, uma das mais promissoras, uma vez que tem sido
bastante divulgada e, portanto utilizada, é a Rede Neural Artificial (RNA), ou simplesmente
Rede Neural (RN), atraindo diversos pesquisadores de enumeras áreas de conhecimento
(Rodrigues Filho et a.l,1995).
As RNAs são modelos matemáticos que tentam simular o funcionamento do cérebro humano
com objetivo de resolver problemas da vida real. As RNAs são utilizadas nas mais diversas
áreas de aplicação como previsão, classificação, controle entre outros (Brondino, 1999). Podese afirmar que RNAs são sistemas paralelos distribuídos, compostos por unidades de
processamento simples (nós) que calculam determinadas funções matemáticas, que
normalmente não são lineares (Alves et al., 2012).
O neurônio artificial é uma unidade de processamento matematicamente simples, que recebe
uma ou mais entradas e as transforma em saídas (Brondino, 1999). As RNAs são muito
eficientes, particularmente, na resolução de problemas em que não se tem formulação analítica
ou não se tem conhecimento explícito acessível ou os dados estão contaminados por ruído ou o
próprio problema modifica-se com o passar do tempo (Raia Jr, 2000)
Dentre as diversas topologias, pode-se mencionar a Multlayer Perceptron (MP), a mais
conhecida e utilizada (Raia Jr, 2000) sendo estas uma generalização da rede perceptron,
pertencendo à arquitetura feedforwards em que todas as saídas dos neurônios de uma camada
são conectadas com todos os neurônios da camada posterior obedecendo à direção entrada e
saída, não havendo conexões entre neurônios de uma mesma camada, seu treinamento é feito
de forma supervisionada. O mecanismo utilizado para a aprendizagem no caso do MP é
3
conhecido como algoritmo backpropagation (Batista, 2012).
Para a determinação dos pesos sinápticos é preciso realizar um processo de aprendizagem da
rede, onde os dados são separados em três conjuntos: treinamento, teste e validação. A
aprendizagem é o processo pelo qual os parâmetros de uma rede neural são ajustados através
de uma forma continuada de estímulo pelo ambiente no qual a rede está operando, sendo o tipo
específico de aprendizagem definido pela maneira particular como ocorrem os ajustes
realizados nos parâmetros (Mendel e McLaren, 1970).
Para realização do processo de determinação dos pesos sinápticos é necessário um algoritmo
de otimização não-linear como por exemplo a Regra Delta Generalizada ou, mais comumente,
backpropagation (BP). Para um primeiro passo de treinamento a rede produz uma saída, que
apresentará diferença com o valor desejado representado pelo erro. O objetivo do processo de
treinamento é buscar diminuir o valor do erro. Para isso, o valor dos pesos devem ser ajustados
a cada novo passo do treinamento. A regra BP proporciona que os pesos da camada de saída
sejam os primeiros a serem ajustados e, posteriormente, os pesos das demais camadas, de trás
para frente (Brondino, 1999).
Existem diversas variações do algoritmo BP, são elas: Gradient descent backpropagation;
Gradient descent backpropagation com momentum; Gradient descent backpropagation com
taxa adaptativa; Gradient descent backpropagation com momentum e taxa adaptativa;
Levenberg-Marquardt backpropagation e Resilient backpropagation.
Com objetivo limitar a saída do neurônio dentro de um intervalo de valores razoáveis a serem
assumidos pela sua própria imagem funcional, existem as funções de ativação que de acordo
com Batista (2012) estas podem ser divididas em dois grupos principais, sendo o primeiro
aquelas que possuem pontos onde suas derivadas de primeira ordem são inexistentes (função
Degrau, degrau bipolar e rampa simétrica) e o segundo grupo funções cujas suas derivadas de
primeira ordem existem e são conhecidas em todos os pontos de seu domínio. As principais funções
desse grupo são: função sigmoidal (logística), tangente hiperbólica, gaussiana e linear.
2.2.1. Aplicação da Técnica de Redes Neurais artificiais no transporte
As redes neurais têm um potencial de aplicação muito vasto na área de transportes (Madalozo,
Dyminski e Ribeiro, 1997). De acordo com Raia Jr (2000), um dos primeiros estudos de
aplicação de RNAs na área de Engenharia de Transporte teria sido o de Nakatsuji e Kaku
(1989), procurando resolver problemas relacionados com a Engenharia de Tráfego. Já no Brasil,
isto aconteceu a partir da segunda metade da década de 1990 (Correa, 2008).
Com intuito de ampliar o conhecimento da aplicação de RNA e criar um procedimento para
atingir o objetivo proposto, foram analisados diversos trabalhos que utilizaram RNAs com
aplicação no planejamento de transportes, especificamente quanto a previsão de
demanda/viagens, a fim de identificar padrões para escolha dos parâmetros da rede, destes
trabalhos, podemos destacar: Dougherty e Cobbett (1997); Kirby, Watson e Dougherty (1997);
Raia Jr (2000); Dia (2001); Aguiar Júnior (2004); Junior, Moreira, Pessanha e Jacinto (2004);
Madalozo, Dyminski e Ribeiro (2004).
3. PROCEDIMENTO PROSTO E SUA APLICAÇÃO
Nesta seção é apresentado o procedimento adotado na elaboração do artigo proposto. O
4
fluxograma que pode ser observado na Figura 1 mostra as sete etapas do procedimento proposto
para estimar matrizes O-D de carga. Os próximos subitens desta seção apresentarão os detalhes
de cada etapa com os resultados da aplicação do caso de exportação de açúcar no Brasil.
Figura 1: Procedimento para estimar matriz O-D de carga utilizando RNA
3.1. Definição e levantamento do tipo de carga a ser estudada e levantamento da série
histórica.
Na primeira etapa deve ser definido o tipo de carga a ser estudado, o recorte geográfico e o
motivo do transporte da mesma. A partir das definições citadas deve-se levantar a série histórica
do produto a fim de ampliar o conhecimento e de possuir dados para aplicação em modelos de
previsão.
O produto escolhido foi o açúcar destinado a exportação, por ser a segunda commodity agrícola
mais exportada pelo Brasil e pelo fato de que o Brasil é o maior produtor do mundo na produção
da mesma (Bueno, 2012 e MAPA, 2014).
A série histórica do açúcar foi obtida no portal ALICE WEB (2013) do ano de 2002 à 2010,
referentes ao fluxo de açúcar em toneladas, cuja origem são os municípios produtores e os
destinos os portos para exportação, logo, não foram analisadas o fluxo para o abastecimento
interno do país. Com isso foi possível montar a matriz O-D para cada ano.
3.2. Análise dos Dados
Definido o tipo de carga a ser estudada e levantada sua série histórica deverão ser definidas as
variáveis independentes que serão utilizadas como entrada para a RNA e estas devem ser
normalizadas e trabalhadas de maneira a aumentar a precisão da técnica. Sistemas de
informação Geográficas (SIG) podem ser utilizados para obtenção de dados caso seja
necessário.
5
Por se tratar de estimativas de matrizes O-D de fluxos de carga tentou-se neste trabalho buscar
uma analogia com os modelos gravitacionais e entrópicos. Para esses modelos as variáveis
independentes são: Oi que representa a quantidade de carga em toneladas que saem de cada
zona de tráfego de origem i; Dj a quantidade de carga em toneladas que chega em cada zona de
tráfego j; e dij é a impedância ente a origem i e o destino j. A variável dependente é o Tij que é
a quantidade de carga em tonelada que sai da origem i para o destino j.
A impedância é qualquer variável que quanto maior o seu valor diminui a probabilidade de
ocorrer viagens ou fluxos de carga ou pessoas como: distância, tempo, valor do frete, custos
logísticos entre outros (Ortuzar e Willumsen, 2011).
A impedância adotada na aplicação foi à distância rodoviária, uma vez que o modo rodoviário
representa mais de 61,1% do transporte de carga no Brasil (CNT, 2012) e os dados obtidos não
estão separados por modos de transportes. Para facilitar a análise os municípios de origem
foram agrupados em mesorregiões, gerando um total de 900 pares de pontos, suas distâncias
rodoviárias foram determinadas a partir do centroide destas, com o auxílio do software
TransCAD© versão 5.0.
Selecionados os dados de entrada (Produção, atração e distância), estes foram normalizados
entre 0 e 1 através da equação 1.
em que
�
�
=
x − í
: Produção, atração e distância i;
: menor valor;
á�: maior�valor.
á�− í
(1)
í
3.3. Arquitetura da Rede Neural
Nesta etapa deve-se definir a ferramenta para aplicar a técnica de RNA. Uma vez definida,
deve-se definir a topologia da rede, o número de camadas ocultas, algoritmo de aprendizado e
a função de ativação de acordo com a funcionalidade e abrangência da ferramenta definida.
A ferramenta escolhida para treinar a rede e estimar foi o software MathWorks MatLAB© que
além de oferecer um ambiente completamente amigável, admite a utilização de ferramentas
úteis ao desenvolvimento intuitivo de Redes Neurais (Araujo e Melo, 2006). Sua arquitetura
aberta torna possível a utilização de programas acessórios que expandem as funcionalidades,
conhecidos por toolbox, sendo um destes o Neural Network Toolbox (NNT), onde traz um
conjunto de funções e uma interface gráfica para que se possa projetar, implementar, visualizar
e simular redes (The Mathworks, 2002 e 2003 apud Aguiar Júnior, 2004).
Na aplicação da RNA para o problema deste artigo, optou-se pela rede do tipo MP por ser a
mais conhecida e utilizada na literatura (Raia Jr, 2000), decidiu-se avaliar o comportamento da
RNA para uma camada oculta já que Batista (2012) ressalta que o aumento do número de
camadas acarreta o aumento da complexidade e do tempo de processamento da rede. O
algoritmo de treinamento escolhido foi Levenberg-Marquardt, pois segundo Araújo e Melo
(2006) e Yuehua et al (2008) ele caracteriza-se como um dos métodos mais rápidos para o
treinamento de RN Acíclicas de tamanho moderado, além disso é eficaz na minimização de
funções com um pequeno número de parâmetros e o tempo de convergência da rede tende a ser
6
menor quando comparado aos outros modelos e possui elevada precisão. Como função de
ativação optou-se pela tangente hiperbólica por ser a melhor opção para função de ativação dos
neurônios, tanto na camada intermediária quanto na camada de saída nos estudos realizados por
Aguiar Júnior (2004).
Testes ainda preliminares não mostraram ganho de desempenho com mais de uma camada
oculta e com outras funções de ativação e algoritmos de aprendizado. Após definir a arquitetura
da rede, os dados obtidos foram divididos aleatoriamente em 70% para treinamento, 15% para
teste e 15% para validação e foi removido o ano de 2010 com o objetivo de estima-lo no final
do treinamento.
3.4. Determinação do número de neurônios
Nesta etapa o número de neurônios na camada oculta deve ser determinado a partir de diversos
testes, devendo este não ser muito pequeno, pois diminuiria a precisão do modelo e nem muito
grande devido ao over-fitting.
Não existe uma formula ou método na literatura que possa auxiliar na identificação do número
de neurônios na camada oculta para o conjunto de treinamento. Para estipular este número,
testou-se um intervalo de 1 à 15 neurônios avaliando seus respectivos R². O valor do R² referese ao ponto em que se deu a parada do treinamento na melhor situação. Conforme pode ser
observado na figura 2, o maior R² obtido foi com 11 neurônios na camada intermediária, logo
a rede possui 3 neurônios na camada de entrada, 11 na camada intermediária e 1 na camada de
saída.
1,0000
0,9800
0,9600
R²
0,9400
0,9200
0,9000
0,8800
0,8600
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15
Número de Neurônios na camada oculta
Figura 2: Determinação do número de Neurônios na camada intermediária
3.5. Estimativa para o ano futuro
Nesta etapa, deverão ser realizadas as estimativas para o ano futuro com a RNA definida no
passo anterior. Com objetivo de avaliar o desempenho da RNA definida do artigo, foi definido
um MG. A Equação 2 mostra o modelo utilizado por da Silva e D´Agosto (2013). Os valores
de �� serão determinados na etapa 4, pois estes são os coeficiente de balanceamento. O
modelo de tendência é definido adotando os valores do coeficiente de balanceamento iguais a
1 e encontrando os parâmetros epelo método dos mínimos quadrados ordinários
7
�� = �.
.
.
� .�
(2)
�
3.6. Balanceamento
Para um período futuro em que se deseja estabelecer a matriz O-D, estima-se os valores de
fluxos baseado na tendência observada e determinada no passo 4 e, em seguida, determina-se
os coeficientes de balanceamento ( ��
) por meio da formulação de um problema de
otimização de multi-objetivos proposto por da Silva e D´Agosto (2013), uma vez que se tem
como objetivo atender todas as restrições apresentadas na Tabela 1. A solução adotada para
modelagem foi a formulação de modelo por programação por metas, utilizando o método dos
pesos (da Silva e D´Agosto, 2013).
Tabela 1: Função objetivo e restrições para o balanceamento da matriz O-D
Restrição
∑ � = � �e
∑ � =��
Função objetivo
�� {
�+ + � − ,
�+ + �− ,
Função objetivo ponderada
(Minimizar)
= , , ,…,
= , , ,…,
As metas podem ser expressas da seguinte maneira:
∑ =1 � − �+ + �− = � , para todo j.
∑ =1 � − �+ + �− = � , para todo i.
. ,Tij, �+ , �− , �+ e �− ≥ 0, para todo i e j.
∑ � � + + �− + ∑ � . � + + � −
=1
=1
Sendo: a+ : desvio positivo do ∑I=1 T em relação à�D , para cada destino j;
a− : desvio negativo do ∑ =1 � em relação à D , para cada destino j;
p+ : desvio positivo do ∑ =1 � em relação à O , para cada origem i.
p− : desvio negativo do ∑ =1 � em relação à O , para cada origem i.
η ∶�peso do desvio ocorrido em relação à produção da origem i;
ϑ : peso do desvio ocorrido em relação à atração do destino j.
Para encontrar os valores dos coeficientes de balanceamento foi utilizado o software solver©.
A busca pelos valores são um problema de otimização não-linear e o “solver©” utiliza o método
do Gradiente Reduzido Generalizado (GRG) para resolver.
3.7. Análise dos erros das previsões
Uma importante componente na construção de um modelo é a avaliação da capacidade de
replicar um conjunto de dados conhecidos. Para avaliar esta capacidade, medidas estatísticas,
conhecidas como goodness-of-fit, são utilizadas com objetivo de medir a proximidade entre o
conjunto observado e o estimado pelo modelo, como pode ser visto nos trabalhos de Wilson
(1970), Wilson (1976), Smith e Hutchinson (1981), Knudsen e Fotheringham (1986) e Sikdar
e Hutchinson (1981). As medidas que mais se destacaram nos trabalhos citados anteriormente
foram o Índice de Dissimilaridade (ID) e coeficiente de determinação (R2).
A fim de validar o modelo proposto, foi estimada a mesma demanda utilizando o MG
8
tradicional. A escolha do MG se deu por ser muito utilizado em estudos do governo e por ser
muito conhecido na literatura.
A tabela 2 apresenta os valores das goodness-of-fit para todos os modelos estudados, aplicados
na estimativa do ano de 2010.
Tabela 2: Análise de desempenho dos modelos estudados
Goodness-of-fit
MG
RNA
R² (Tijp x Tijr)
0,851
0,904
ID (Tijp x Tijr)
24,13%
18,54%
Tijp: são os valores dos fluxos estimados por cada modelo para o ano de 2010
Tijr: são os valores dos fluxos reais para o ano de 2010.
As medidas estatísticas mostraram a precisão do modelo de RNA, onde a estimativa do ano de
2010 foi próxima a real. O modelo que utilizou a técnica de RNA possui um coeficiente de
determinação de 0,904 o que indica que o modelo conseguiu explicar 90,4% dos valores
observados já o MG apenas 85,1%. Em relação ao Índice de dissimilaridade o modelo de RNA
possuiu apenas 18,54% enquanto o MG 24,13%.
4. CONSIDERAÇÕES FINAIS
O presente trabalho procurou utilizar a técnica de RNAs como modelo de distribuição de
viagens, do transporte de carga, a fim de mostrar mais uma opção para o cálculo do mesmo,
aplicando a técnica proposta para a commodity açúcar destinada à exportação. O trabalho visa
contribuir para o desenvolvimento de novas técnicas aplicadas no estudo de planejamento de
transporte de carga, podendo ser utilizado em futuros estudos do governo.
O procedimento proposto foi capaz de estimar a matriz O-D de fluxo de açúcar brasileiro
destinado à exportação. O modelo de RNA construído e treinado com o software Mathwoks
MatLAB/NNT©, permitiu conhecer a variação de demanda e destacou-se por apresentar maior
precisão em relação ao MG, apresentando um coeficiente de determinação (R²) superior em
5,3% e possuindo Índice de Dissimilaridade (ID) 5,59% menor, mostrando então uma nova
alternativa para o cálculo da DV já que a diferença de precisão é favorável ao modelo proposto,
porém, este procedimento deve ser aplicado em outros produtos para comprovar sua eficácia.
A matriz não é estática ao longo dos anos, ou seja, existem variações na quantidade de origens,
destinos, distância média e a quantidade exportada com o tempo, caracterizando um
comportamento dinâmico. Como trabalhos futuros, a investigação do comportamento da RNA
quando se leva em consideração também a estrutura da rede multimodal brasileira, pois, ao
modificar os padrões de oferta e consumo bem como a rede multimodal, os fluxos entre pares
OD podem mudar.
A forma de entrada dos dados influenciaram o desempenho e a arquitetura final da RNA, logo
esta etapa deve ser bem planejada. Outro fator que influenciou o desempenho foi a quantidade
de neurônios na camada intermediária, logo esta quantidade deve ser comparada e treinada
inúmeras vezes. O balanceamento mostrou-se eficaz, aumentando a precisão de ambos os
modelos.
9
Mesmo com sua elevada precisão, o modelo apresentou erros que podem ser melhorados com
outras arquiteturas de redes, acrescentando camadas ocultas e alterando o algoritmo de
aprendizado e/ou função de ativação.
Agradecimentos
Para a Confederação Nacional do Transporte (CNT), o Serviço Social do Transporte (SEST), o Serviço Nacional
de Aprendizagem do Transporte (SENAT) e para o Instituto de Transporte e Logística (ITL) pelo apoio financeiro.
REFERÊNCIAS BIBLIOGRÁFICAS
Aguiar Júnior, S.R. (2004) Modelo RAPIDE: uma aplicação de mineração de dados e redes neurais artificiais
para a estimativa da demanda por transporte rodoviário interestadual de passageiros no Brasil.
Dissertação (Mestrado em Gestão do conhecimento e da Tecnologia da informação), Universidade Católica
de Brasília, Brasília.
Aguiar Júnior, H.P.A.; Moreira, T.C.; Pessanha, V.G. e Jacinto A.M. (2004) Previsão da demanda de passageiros
no Sistema de Transporte Coletivo utilizando as Redes Neurais Artificiais e os Algoritmos Genéticos. IV
Congresso Brasileiro de Computação - CBCOMP, Itajaí.
Alves, V. F. b., Silva, A. N. R. e Waerden, P. (2012) Técnicas exploratórias para localizar potenciais usuários de
transporte público urbano. Journal of Transport Literature, vol. 6, n. 3, pp; 180-203.
Araújo, R.B. e Melo, P.L.S.V. (2006) Protótipo de Software para aprendizagem de Redes Neurais Artificiais.
Anaiss do XXXIV COBENGE. Ed. Universidade de Passo Fundo. Passo fundo.
Batista; B.C.F. (2012) Soluções de Equações Diferenciais usando Redes Neurais de Múltiplas camadas com os
métodos da Descida mais íngreme e Levenberg-Marquardt. Dissertação (Mestrado em Matemática),
Universidade Federal do Pará, Bélem.
Bertoncini, B. (2010) Uma proposta de estimação da matriz OD a partir dos fluxos de tráfego observados nas
interseções da rede de transporte. Tese (doutorado em Engenharia de Transportes), Escola de Engenharia
de São Carlos da Universidade de São Paulo, São Paulo.
Brondino, M. C. (1999) Estudo da influência da acessibilidade no valor de lotes urbanos através de redes neurais.
Tese (Doutorado em Engenharia Civil - Transportes), Escola de Engenharia de São Carlos da Universidade
de São Paulo, São Paulo.
Bruton, M. J. (1979) Introdução ao planejamento dos transportes. São Paulo: Editora da universidade de São
Paulo.
Bueno, M. S. (2012) Análise da cadeia logística de exportação de açúcar. Trabalho de Iniciação Científica
realizado no grupo ESALQ-LOG
Campos, V. B. G. (2013) Planejamento de Transportes - conceitos e modelos. Rio de Janeiro: Editora interciência.
Corrêa, F. (2008) Aplicação de redes neurais artificiais no setor de transportes no Brasil. Dissertação (Mestrado
em Engenharia Urbana), Universidade Federal de São Carlos, São Paulo.
da Silva, M. e D´Agosto, M. (2013) A model to estimate the origin-destination matrix for soybean exportation in
Brazil. Journal of Transport Geography, vol .26, pp. 97-107.
Dia, H. (2001) An object-oriented neural nerwork approach to short-tem traffic forecasting. European Journal of
Operational Research, vol. 131, pp. 253-261.
Dougherty, M.S. e Cobbett, M.R. (1997) Short-term inter-urban traffic forecastsusing neural networks.
International Journal of Forecasting,vol. 12, pp. 21-31..
Grange, L., Fernández, E. e Cea, J. (2010) A consolidate model of trip distribution. Transportation Research Part
E, vol. 46, pp. 61-75.
Haykin, S. (2001) Redes Neurais: princípios e prática. 2ª ed. Porto Alegre: Bookman.
Kaiser, M. S., Prata, P. A. e Ribeiro, G. M. (2007) Análise comparativa entre o TransCAD e heurísticas de
agrupamento e de roteamento de veículos. XXI Associação Nacional de Pesquisa e Ensino em Tranporte,
Rio de Janeiro. Disponível em: <www.cbtu.gov.br/estudos/pesquisa/anpet/PDF/3_186_AC.pdf >.
Kirby, H.R., Watson, S.M e Dougherty, M.S. (1997) Should we use neural networks or statistical models for shortterm motorway traffic forecasting?, International Journal of Forecasting, vol 1, n. 1, pp. 43-50.
Knudsen, D. C. e Fotheringham, A. S. (1986) Matrix Comparison, Goodness-of-Fit, and Spatial Interaction
Modeling. International Regional Science Review, vol. 10, n.2, pp. 127-147.
Madalozo, H.C. Dyminski, A.S. e Ribeiro, E.O. (2004) Análise de curvas horizontais de rodovias, para
melhoramento de projeto e operação, utilizando redes neurais artificiais. Anais do 18° Congresso Brasileiro
de Transporte e Trânsito -ANPET, Santa Catarina.
10
Mendel, M., e McLaren, R. (1970) Adaptive, Learning, and Pattern Recognition Systems: Theroy and
Applications. Reinforcement-learning control and pattern recognition systems vol. 66, pp. 287-318. New
York: Academic Press.
MAPA
(2014)
Ministério
da
Agricultura,
Pecuária
e
Abastecimento.
Disponível
em:
<www.agricultura.gov.br/vegetal/culturas/cana-de-acucar>.
Nakatsuji, T. e Kaku, T. (1989) Application of Neural Network Models to Traffic Engineering Problems.
Proceedings of the Infrastructure Planning, vol. 12, pp. 297-403.
Novaes, A. G. (1981) Modelos em Planejamento Urbano, Regional e de Transportes. São Paulo: Rdgard Blucher.
Ortuzar, J. d., e Willumsen, L. G. (2011) Modelling Transport - 4th ed. New York: Wiley&Sons.
Raia Jr, A. A. (2000) Acessibilidade e mobilidade na estimativa de um índice de potencial de viagens utilizando
redes neurais artificiais e sistemas de informações geográficas. Tese (Doutorado em Engenharia Civil Transportes), Escola de Engenharia de São Carlos, Universidade de São Paulo, São Paulo.
Rodrigues Filho, I. W.. Tafner, M. A., Xerez, M. (1995) Redes neurais artificiais: introdução e princípios de
neurocomputação. Eko.
Sherali, H., Narayanan, A. e Sivanandan, R. (2003) Estimation os origin-destination trip-tables on a partial set of
traffic link volumes. Transportation Research Part B, vol. 37, n. 9, pp. 815-836.
Sikdar, P. K. e Hutchinson, B. G. (1981) Empirical Studies of Work Trip Distribution Models. Transportation
Research Part A, vol, 15, n. 3, pp. 233-243.
Smith, D. P. e Hutchinson, G. B. (1981) Goodness of Fit Statistics for trip Distribution Models. Transpotation
Research Part 4, vol. 15, n.4, pp. 295-303.
Soares, P.P.S. e Nadal, J.(1999) Aplicação de uma Rede Neural Feedforward com Algoritmo de LevenbergMarquardt para Classificação de Alterações do Segmento ST do Eletrocardiograma.Proceeding of the IV
Brazilian Conference on Neural Networks - pp. 384-389, ITA, São José dos Campos, São Paulo
Souza, C. D. R. e D'Agosto, M. A. (2013) Modelo de quatro etapas aplicado ao planejamento de transporte de
carga. Journal of Transport Literature, Vol. 7, n. 2, pp. 207-234.
Timms, P. (2001) A philosophical context for methods to estimate origin-destination trip matrices using link
counts. Transport Reviews, vol. 21, n. 3, pp. 269-301.
Willumsen, L. (1981) Simplified transport models based on traffic counts. Transportation, vol, 10, pp. 257-278.
Wilson, A. G. (1970) Entropy in Urban and Regional Modelling. London: Pion.
Wilson, S. R. (1976) Statistical Notes on the Evaluation of Calibrated Gravity Models. Transportation Research,
vol. 10, n.5, pp. 343-345.
Willumsen, L. G. (1978) Estimation of on O_D matrix traffic counts - A review. Working Paper, Institute of
Transport Studies, University of Leeds, disponível em <epronts.whiterose.ac.uk/2415/>.
Yuehua, Z.H.U., Chen, Y., Geng, X. e Liu, L. (2008) Transport Modal Split of Commercial Sites Based on
Artificial Neural Network. Journal of Transportation, Vol. 8, n. 1, February. Disponível em
<http://www.sciencedirect.com>.
11