Solução de visão computacional: você conhece os custos?

Algumas decisões impactam diretamente nos investimentos e funcionalidades das soluções que utilizam Visão Computacional. Modelo da câmera utilizada na captação das imagens e recorrência dos episódios que serão observados, são alguns dos pontos capazes de aumentar significativamente o valor final do projeto, que deve seguir as reais necessidades da empresa.

Solução de visão computacional: você conhece os custos?

Depois de compreendermos as múltiplas possibilidades que soluções de Visão Computacional proporcionam, o próximo desafio da Pix University é fazer com que gestores mergulhem nos costs drivers, compreendendo quais recursos financeiros serão necessários para colocar o projeto em execução.

Ainda não aprendeu sobre Visão Computacional? Entenda aqui.

Em primeiro lugar, é preciso deixar claro que o céu é o limite quando o assunto são soluções baseadas em Inteligência Artificial (IA). Entretanto, ao longo da criação de um sistema de Visão Computacional uma série de decisões poderá ser tomada, sendo que cada uma delas poderá aumentar ou diminuir o investimento final da solução.

Não podemos esquecer que todo projeto deve ser escalável, ou seja, precisa ser executado sequencialmente para que traga economia de recursos financeiros ao longo do tempo. Isso significa que, ainda que o investimento inicial seja alto, a solução trará significativa redução nos custos empregados pela empresa, promovendo vantagens em diferentes aspectos.

Por mais que pareçam superiores, nem sempre certas escolhas serão fundamentais para que o resultado final seja alcançado. Faremos agora um percurso pelos principais pontos que impactam no valor financeiro das soluções, tendo em mente que o foco deverá estar nas reais necessidades do projeto.

Definindo a base de dados que alimentará o sistema

Soluções que envolvem Machine Learning (ML) são projetadas com a ajuda de algoritmos capazes de aprender novos padrões e repeti-los. Entretanto, para que os algoritmos funcionem, é preciso que uma base de dados os alimente. E são justamente os conjuntos desses dados que chamamos de datasets.

Entenda o que é e como funciona o Machine Learning aqui.

 

Quanto mais personalizado o projeto, maior será o investimento para que ele seja executado. Soluções têm seu investimento reduzido caso utilizem datasets que já existem no mercado e que são de fácil aquisição.

Entretanto, enfrenta-se um desafio ligado aos ajustes necessários para que o conjunto de dados funcione segundo as necessidades da solução que está sendo desenvolvida.

Isso acontece porque datasets prontos e disponíveis costumam ser genéricos, afinal, não foram produzidos para a função. É o caso de pessoas andando na rua que podem ser facilmente achadas através de mecanismos de buscas do Google.

Neste caso podem acontecer duas coisas, ou a aplicação necessita mesmo de dados genéricos, como detecção de aglomeração de pessoas; ou para utilizar tais datasets é preciso empregar um pouco mais de tempo na adaptação dos dados ao projeto, fazendo-se ajustes ligados a especificidades como a cor e iluminação das imagens.

Para o primeiro caso o custo de dataset se torna extremamente baixo, para o segundo, um pouco mais elevado que o anterior, mas ainda sim uma das formas mais baratas.

Quando a empresa não possui o dataset, mas consegue produzi-lo facilmente, temos um aumento no custo do processo, ainda que não seja tão relevante. É o caso de soluções em que é possível utilizar celulares, câmeras de segurança ou modelos de baixo custo para capturar as imagens que serão utilizadas.

Por exemplo, imagens de garrafas passando em linhas de produção podem ser facilmente adquiridas, sem a necessidade de grandes investimentos para a captura.

O processo se torna mais caro quando é necessário construir o dataset, como é o caso de ambientes criados em laboratório pela Pix Force para inspeção de colheres.

Há também kits voltados para a coleta de dados que podem ser empregados em um dia, o que facilita e barateia a execução. Entretanto, caso seja necessário adquirir uma câmera capaz de seguir a velocidade do processamento dos dados, o investimento sobem exponencialmente.

Por último, a situação mais complexa e consequentemente mais onerosa se dá quando o evento a ser observado é em algum local perigoso e/ou com pouca ocorrência. Nesses casos, é preciso criar um plano de coleta de dados que, por si só, pode tornar-se um projeto específico.

Captação de imagens: o impacto das câmeras nos investimentos do projeto

Outro ponto fundamental na arquitetura do projeto está ligado à escolha dos dispositivos que serão utilizados para captação das imagens. É claro que cada cenário poderá demandar o uso de determinados tipos de câmeras, entretanto, há uma premissa básica que deve ser observada para se evitar desperdícios: quanto mais sofisticado for o aparelho, maior será o custo da solução.

Entenda aqui como é feita a captação de imagens na Visão Computacional.

 

Há projetos que podem ser realizados com a ajuda de câmeras mobile, que são de fácil acesso e baixo custo. A obtenção de imagens através de celulares, entretanto, só poderá ser realizada quando a iluminação e ângulos de captura não forem relevantes para o resultado final.

Outra possibilidade é o uso de câmeras de segurança que já estão instaladas, podendo ter suas imagens aproveitadas para a formação do projeto. Funciona bem para contagem, mas não para medir tamanho de objetos com precisão.

Em ambos os casos, os dispositivos de captura representam uma expressiva economia financeira, mas só poderão ser utilizados quando a obtenção dos dados não demanda altos níveis de sofisticação.

No caso dos celulares, cada pessoa poderá fazer a imagem de uma maneira diferente, com grande variação na iluminação, ângulo e enquadramento. Há uma economia no hardware, mas os custos com o tratamento e programação podem subir de acordo com a qualidade do dado a ser obtido.

Há câmeras de mercado superiores que as de segurança, capazes de trazer resultados interessantes mantendo o custo reduzido.

Esse tipo de dispositivo costuma apresentar o melhor custo benefício se utilizado em ambiente controlado, ou seja, sem grandes variações. Já modelos avançados capazes de trabalhar em altíssima velocidade oneram o valor do projeto, podendo ser utilizados em casos bastante específicos.

Quanto maior a recorrência, menor o preço

Pensar na recorrência dos episódios que precisam ser observados também impacta nos custos da solução. Um exemplo básico pode ser encontrado em projetos que precisam capturar imagens de manchas em tecidos: quanto maior for a recorrência de manchas, mais fácil será criar uma rede neural capaz de detectar os episódios.

Ainda não sabe o que são e como funcionam as Redes Neurais? Veja aqui.

 

Imagine a seguinte situação: o sistema tem que ser capaz de detectar e classificar as manchas em uma linha de produção de tecidos, sejam manchas de gordura ou de tinta. Se temos uma média de 100 manchas por dia, sendo metade de cada tipo, em pouco tempo temos dados suficientes para criar uma rede neural que saiba o que é a mancha e classificar de qual tipo é.

Entretanto, se temos 1 mancha por dia, iremos demorar meses até termos dados suficientes para classificar as manchas, então muda-se a abordagem para detecção de anomalia. Ou seja, treinamos a rede para dizer que qualquer coisa diferente do correto é algo errado e detectamos isso. A questão é que não conseguiremos dizer qual tipo de mancha até que se tenha dataset suficiente, mas o defeito é encontrado.

Do ponto de vista de investimento, a detecção de anomalia demanda menos esforço do que a classificação, todavia, deve abrir mão de um dado, que é a classificação da anomalia. Sabe-se que tem uma mancha, mas não que tipo de mancha.

Quando não há amostras suficientes, o processo de captação do dataset pode se estender por meses, aumentando os custos do projeto. É o caso de soluções voltadas para a identificação de vazamentos em tubulações de gás, em que erros não serão provocados apenas para que as anomalias sejam identificadas. A frequência dos episódios poderá, portanto, definir a abordagem utilizada no projeto.

Processando os dados: tempo necessário para análise das imagens

A próxima etapa que precisa ser pensada está ligada ao processamento das imagens. É possível realizar a análise dos dados em tempo real, entretanto, quanto mais rápida a resposta, mais caro será o processo. O tempo de resposta pode variar em segundos, minutos ou horas, e a escolha deverá ser feita com base na real necessidade do projeto.

É preciso avaliar se a análise das imagens realmente precisa ser feita online, com resultados imediatos, ou se há a possibilidade de se trabalhar com sistemas offline capazes de reduzir consideravelmente os custos.

Outro ponto que deve ser analisado é se os dados podem ser processados em cloud – nuvem – desde que uma boa conexão de internet esteja disponível. O custo inicial da cloud é muito inferior se comparado ao investimento em hardware, mas é preciso levar em conta o valor de manutenção que precisará ser dispensado de forma recorrente.

Há projetos de Inteligência Artificial (IA) em que servidores de processamento de imagens demandam investimentos que chegam à casa dos R$ 100 mil. Em contrapartida, o valor da manutenção da cloud pode chegar a R$ 2 mil ou 3 mil, o que nos leva a repensar os prós e contras da adoção de processamentos na nuvem.

Outro fator relevante da cloud está ligado ao fluxo dos dados: mais caro do que processar 1 gigabyte é a ação de enviá-lo e recebê-lo de volta, já que o fluxo é mais oneroso do que o próprio processamento. Cada uma das decisões deve ser avaliada com cuidado, pois mudanças na trajetória dos projetos podem se tornar inviáveis.

Lembrando que o objetivo sempre deve ser atender às demandas do processo. Todos gostamos de resultados imediatos, mas isso realmente é necessário para o projeto? Os investimentos para a respostas em 1 segundo ou em 1 minuto, podem definir a viabilidade financeira do projeto.

Armazenamento das informações

O armazenamento realizado em servidores internos é mais barato do que em cloud, mas há algumas questões que precisam ser consideradas. Primeiro, se toda a estrutura de processamento foi montada para acontecer na nuvem, o armazenamento dos dados também poderá ser feito em cloud. Outra questão é o prazo de armazenamento, que encarece à medida em que se estende.

O armazenamento em cloud pode ser feito em estruturas SSD ou HD. No primeiro caso, os dados são acessados de forma extremamente ágil, mas com custo bem mais elevado. Já no segundo caso, a velocidade é um pouco inferior e o preço cai consideravelmente.

Caso a cloud da Pix Force seja utilizada, haverá um custo recorrente para manutenção dos dados. Entretanto, se a empresa que precisa da solução decidir utilizar cloud própria, haverá custos ligados à integração dos dados, afinal, é complexo permitir que pessoas externas acessem sua nuvem. Há, ainda, a possibilidade de armazenamento local utilizando computadores da empresa, saída mais barata e que pode ser viável.

Dois cenários possíveis: o mais caro e o mais barato

Para deixar tudo ainda mais claro, vamos pensar em dois cenários: o projeto mais caro possível, que chamaremos de A, e o com menor custo, que vamos chamar de B.

PROJETO A: Detecção de manchas em tecidos. Processo à 20m/s. (Exige câmera de alta velocidade), resposta de processamento em 1 segundo, ambiente agressivo por isso o processamento deve ser cloud. 1 falha por dia em média obrigatoriamente tem que se classificar a mancha entre gordura, tinta ou falha na trama do tecido.

PROJETO B: Contagem de sacos de cimento. Resposta 1x por dia, uso de celular, processamento dentro do próprio aparelho, disponibilidade constante de dados, armazenamento no próprio smartphone.

Estamos falando de algo em torno de R$ 600,00 por mês para o projeto B e de R$ 200 mil mais R$ 5 mil mensais para o projeto B. Estes são apenas valores ilustrativos.

No cenário A, há a necessidade de um sistema de captura de imagens com uma câmera superior, com velocidade avançada e alto valor no mercado.

A taxa de recorrência dos episódios que precisam ser observados é baixíssima, o que demandará bastante tempo para que o levantamento do banco de dados seja finalizado. Ainda no projeto A, temos a necessidade de uma resposta online, sendo necessário um computador com alta potência dedicado ao processamento em tempo real. Já o armazenamento é feito dentro da cloud da própria empresa.

Já no cenário B, considerado o mais barato possível, a empresa já possui as imagens, capturadas com câmera própria. A recorrência é elevada, ou seja, a todo o momento temos episódios do que se deseja observar. O acesso às imagens é fácil, assim como o manuseio da câmera, sem a necessidade de equipes externas para realizarem a tarefa.

Ainda neste cenário temos um tempo de resposta de cinco segundos, offline, sem recorrência de custo, processamento das imagens realizado de forma interna (local), com o próprio smartphone. Além disso, não há a necessidade de armazenamento de dados e o que for preciso guardar poderá ser feito internamente.

Percebemos que há uma série de variações que precisam ser levadas em conta na hora de estruturar um projeto. Alguns pontos terão impacto considerável no resultado final da solução e, por isso, abrem espaço para que se economize em recursos físicos e financeiros.

Independentemente das escolhas, o fato é que novos sistemas podem ser criados para revolucionar dores emergentes, sendo a Inteligência Artificial (IA) uma fonte inesgotável para aumentar a competitividade de diferentes segmentos do mercado.

Continue aprendendo: entenda o futuro da Visão Computacional aqui.

 

Compartilhe este artigo:

Artigos Relacionados