Visão Computacional: Um Guia Completo para tirar suas dúvidas

Popularizada nos anos 1970, a Visão Computacional tem se expandido ao longo dos anos. Mais segura do que a visão humana, essa técnica é capaz de solucionar as dores da indústria de um jeito prático e eficiente. Assim, empresas conseguem escalar exponencialmente e ficar à frente em seus setores.

Visão Computacional (V.C) é uma Inteligência Artificial (I.A.) que capta e interpreta imagens, replicando funções condicionadas à visão humana.

De forma prática, essa tecnologia é capaz de capturar imagens, classificá-las e agrupá-las de acordo com padrão estipulado

Imagem didática classificando gatos, cachorros e gatos e cachorros
Exemplo didático de como a Visão Computacional pode capturar, classificar e agrupar

Porém, para que chegasse ao que é hoje, a V.C passou por vários processos. O primeiro registro de seu uso aconteceu em 1950. Na época, os recursos conseguiam classificar objetos em categorias simples, como redondos e quadrados.

O que é visão computacional: a história do conceito

Para saber o que é visão computacional, precisamos recorrer à história. Em 1972, a empresa Texas Instruments criou a primeira câmera digital do mundo. Três anos depois, em 1975, a Cromemco Cyclops tornou-se a primeira câmera digital do mercado capaz de se conectar a um computador. A partir daí, e com a criação dos primeiros sensores, começou a ser possível interpretar as imagens.

Imagem da 1º Câmera Digital – 1975 | Cromemco Cyclops

Os primeiros projetos de V.C tinham como objetivo reconhecer e interpretar textos por meio do reconhecimento óptico dos caracteres. A ideia surgiu para que pessoas cegas fossem inseridas no mercado e, até hoje, a vertente da I.A tem papel importante no setor.

São muitas as formas que a Visão Computacional (V.C.) atua para auxiliar na inclusão e qualidade de vida das pessoas cegas. A Tecnologia Assistiva, nome dado ao grupo de recursos e serviços que proporcionam esse acesso, têm a Visão Computacional como grande aliada.

Um exemplo disso são os jogos desenvolvidos para entretenimento e até mesmo avaliação de pessoas cegas. Como a vertente da I.A. ainda é um ramo em evolução, a maioria deles segue em fase de pesquisa e testes. Mas já podem ser considerados um exemplo de como a tecnologia caminha em auxílio de diversos pilares sociais, como saúde e educação.

Os jogos – feitos inicialmente para pessoas não atípicas – tiveram uma grande importância na evolução da V.C.

O boom dos games ajudou a popularizar a tecnologia e, nos anos 1900, trouxe grande avanço para o mercado junto com a internet.

Deep Fake: Ultrapassando a realidade

A partir da primeira década dos anos 2000, o avanço tecnológico passou a escalar de forma rápida. Isso trouxe recursos à população que antes pareciam impossíveis. Uma das técnicas que melhor exemplifica isso é o Deep Fake.

Popularizado em 2020, o recurso substitui a imagem de uma pessoa por outra, ou até mesmo criar uma nova, de alguém inexistente.

O termo mistura as expressões “Deep Learning” e “Fake”. O que quer dizer que utiliza-se do modelo criado pelo Deep Learning para fazer com que máquinas aprendam padrões de comportamento humanos e produzam uma situação falsa.

O produto do Deep Fake é um vídeo capaz de reproduzir expressões, aparência e até a voz de uma pessoa. Em geral, são criados em três etapas, sendo a primeira delas responsável por captar o máximo de imagens possível de uma pessoa, com expressões, iluminação variados, etc.

Em seguida, são gravados os movimentos de uma segunda pessoa, que servirá de base para o vídeo. Por fim, acontece a junção do material capturado, nascendo o vídeo “que nunca aconteceu”.

Deep learning e inteligência artificial

Em todo o longo caminho percorrido pela Visão Computacional até aqui, um grande paradoxo se cria na evolução da função daquele que é responsável pela operação. Quando os primeiros funcionários operadores de V.C. surgiram, sua função era, acima de tudo, pesquisar. Era de responsabilidade do funcionário ser um pesquisador e coletar manualmente os dados a serem utilizados no processo.

A diferença entre ele e o funcionário de hoje é que, por meio de diversas vertentes da I.A, as próprias máquinas tornam-se capazes de pensar. Elas utilizam de Datasets para alimentar automaticamente as Redes Neurais responsáveis por definirem padrões. O operador passa a ter a função de manusear a tecnologia, que pode ser aplicada em diversos setores, sem que haja a necessidade de um especialista.

“A partir da segunda década dos anos 2000, começou a surgir uma nova revolução, e estamos agora surfando nesta onda: é a revolução do Deep learning, uma área da Inteligência Artificial”

disse Horácio Fortunato, Coordenador de Pesquisa e Desenvolvimento da Pix Force.

“Encontrou-se formas de poder treinar Redes Neurais, que são tecnologias já usadas há muito tempo. A partir de agora, juntando-se o hardware disponível com um grupo de imagens e uma melhoria nos algoritmos de processamento, consegue-se começar a treinar redes neurais que consigam aprender a partir de exemplos.”

complementou Horácio Fortunato.

Sobre as constantes mudanças em I.A., Horácio ainda acrescenta:

“O treinamento de Redes Neurais é uma revolução que continua ainda hoje. A grande diferença entre o que se fazia antes e o que se faz agora é que antes o programador tinha que pensar em como extrair informações da imagem a partir de operações minuciosas. A partir da evolução das Redes Neurais, é a própria rede que aprende por exemplos”.

Visão computacional resolvendo os problemas das empresas

Existem casos que exemplificam como a Visão Computacional tem participado ativamente de processos evolutivos em vários negócios.

A análise de sentimentos, também conhecida como mineração de emoções, é uma tecnologia que interpreta como clientes reagem em relação aos produtos de uma vitrine, por exemplo. Tudo isso acontece em tempo real, através das expressões que eles demonstram.

Uma análise deste tipo passa a ser mais segura do que a avaliação feita por um humano. A presença de um funcionário nesse processo pode inibir as pessoas e afetar os resultados.

Outra função do reconhecimento facial está na área médica. Mais especificamente no auxílio de pessoas com grandes limitações físicas.

A revista da Fundação de Amparo à Pesquisa do Estado de São Paulo publicou uma matéria sobre um sistema de V.C que torna possível o comando de uma cadeira de rodas a partir do reconhecimento de expressões faciais.

Detectar anomalias também é um trabalho que tem recebido grande investimento dessas tecnologias. Os desastres naturais, como barragens de mineração que transbordam por conta de enchentes, são um exemplo.

Para que a Rede Neural possa desempenhar seu papel, são coletadas imagens da barragem em seu estado natural. Assim é identificado como fora do padrão tudo o que seja diferente disso.

Como a visão computacional e a inteligência artificial ajudam as indústrias?

Um modelo de solução de Visão Computacional (V.C.) criado para atuar na área biológica é outro exemplo de solução de sucesso. Chamada U-Net, a Rede Neural desenvolvida pela Pix Force trabalha com um conjunto de imagens no Departamento de Ciência da Computação da Universidade de Freiburg, na Alemanha. Sua função é detectar precocemente doenças como o câncer, através da segmentação de células.

Muitos setores têm recebido benefícios diversos com a vertente da I.A. que tem revolucionado a indústria. Sistemas de rastreio dentro de uma cadeia de produção podem garantir a qualidade de um produto e agilizar sua identificação em casos de recall.

Da mesma forma, interpretações de exames médicos têm tido maior precisão. Assim como a contagem de animais em grandes áreas, cálculo de volumetria, autenticação e reconhecimento facial e sistemas de robótica.

É inegável o quanto aplicar soluções de I.A. dentro da indústria pode fazer com que ela escale rapidamente em relação à concorrência. Da mesma forma, a tecnologia tem facilitado processos que antes pareciam irreais.

Abaixo, apresentamos cases desenvolvidos pela Pix Force que utilizam da V.C. para solucionar diferentes problemas.

Pix Counter: mais avanço nas linhas de produção

Exemplo de tecnologia disruptiva que otimiza os processos industriais. O Pix Counter atua dentro de cadeias de produção, por meio de sensores e câmeras RGB.

A solução de Visão Computacional tem a função de fazer a contagem de itens em grande velocidade, operando com acurácia acima de 98%. Em relação a confiabilidade dos números, a solução chega a superar a capacidade humana, já que é automatizada.

A unidade piracicabana da ArcelorMittal, produtora multinacional de aço, realizava o processo de contagem de feixes de barras de aço manualmente. Com a implementação da solução da Pix Force em sua linha de produção, a empresa passou a ter um meio de contagem automatizado, rápido e preciso.

Um único feixe de barras de aço levava entre duas e três horas para ter sua contagem concluída. Agora, ele pode ser contado em cerca de um minuto, garantindo agilidade e segurança ao processo.

Além disso, a solução também traz precisão para a conferência de itens vendidos, já que as barras de aço são produzidas por peso, mas vendidas por unidade. Isso obrigava a multinacional a estimar a quantidade enviada para distribuição com base no peso, sem conseguir obter o número exato de itens que estavam sendo destinados ao mercado internacional.

Deeptrack: salto na indústria mineradora com a ajuda de drones

Outro exemplo de solução que otimiza processos acontece na indústria mineradora. Chamada Deeptrack, ela introduz drones na inspeção da logística realizada pelas correias transportadoras, superando a capacidade humana. Veja no vídeo abaixo:

As aeronaves equipadas com sensores infravermelho e RGB são capazes de apontar as temperaturas individuais e a localização georreferenciada de cada rolo das correias. Isso evita o superaquecimento e consequentes paradas nas operações, que podem causar incêndios de maior porte.

Sistemas de visão computacional: melhor custo benefício para as empresas

Ao pensar em soluções tão tecnológicas, a maioria das pessoas tende a se perguntar se o custo benefício é eficaz. Para isso, é importante entender o quanto esse investimento pode gerar de benefícios para a empresa.

Projetos de Visão Computacional costumam fazer com que as indústrias tenham um time de funcionários mais enxuto, desonerando aqueles que desempenhavam funções mais cansativas e perigosas e construindo um time mais estratégico. Da mesma forma, processos demorados passam a ser feitos rapidamente, e com precisão superior à mão de obra humana.

Sabemos o quanto os pilares segurança, tempo, precisão e bom aproveitamento do quadro de funcionários pode ser benéfico para que uma empresa escale exponencialmente. A ideia de aplicar V.C. dentro da indústria é sanar dores latentes, relacionadas a processos lentos, pouco seguros e ineficazes.

É importante entender que um novo projeto só faz sentido se trouxer vantagens. A ideia é que o sistema seja capaz de reduzir os custos, principalmente os que são ligados à manutenção preditiva.

Para que haja um custo benefício eficiente, a aplicação precisa trazer resultados visíveis ao longo do tempo, e não apenas de forma pontual. Da mesma forma, gestores e demais funcionários devem estar alinhados com a nova forma de trabalho.

As redes generativas são um tipo de modelo de aprendizado de máquina que se concentra em gerar novos conteúdos a partir de uma distribuição de dados de entrada. Elas podem ser usadas em várias aplicações, incluindo a visão computacional para indústria 4.0.

Na indústria 4.0, as redes generativas podem ser usadas para gerar imagens de alta qualidade a partir de imagens de baixa qualidade ou incompletas. Elas também podem ser usadas para gerar imagens de produtos que ainda não foram fabricados, o que pode ser útil na tomada de decisões de design de produtos.

Além disso, as redes generativas podem ser usadas para preencher lacunas em séries temporais de imagens, o que é útil em tarefas de monitoramento e manutenção de equipamentos.

Outro exemplo de uso das redes generativas na indústria 4.0 é na geração de dados de treinamento de aprendizado de máquina. Por exemplo, em tarefas de classificação de imagens, pode ser difícil obter uma muitas imagens etiquetadas de forma apropriada. As redes generativas podem ser usadas para gerar imagens artificialmente e etiquetá-las de acordo com o modelo de classificação. Isso pode ajudar a aumentar a precisão do modelo de classificação e a reduzir o tempo de treinamento.

Em resumo, as redes generativas são uma ferramenta poderosa para a visão computacional na indústria 4.0. Elas podem ser usadas para gerar imagens de alta qualidade, preencher lacunas em séries temporais e gerar dados de treinamento para aprendizado de máquina.

Além disso, são capazes de aprender a representar distribuições de dados complexas e podem ser usadas em várias tarefas de visão computacional.

Pix Force: tecnologia mais acessível para o mercado

No mercado desde 2016, a Pix Force surge para desenvolver soluções através de Inteligência Artificial e Machine Learning. Ela gera soluções para diferentes setores através da aquisição e interpretação automática de imagens e vídeos.

A empresa, que assume desafios do mundo real, está voltada para o desenvolvimento de novas tecnologias para solucionar dores latentes dos clientes que atende.

As empresas que chegam até a Pix Force em busca de soluções de V.C., são aquelas que procuram não apenas deixar processos mais eficazes, mas também tornar os meios de produção mais seguros, já que com o uso de máquinas, funcionários são poupados de tarefas perigosas.

A partir daí, o setor consegue englobar mecanismos de maior alcance da tecnologia, tornando viáveis passos maiores rumo ao crescimento em grande escala.

O cofundador da startup, Daniel Moura, explica a importância de trabalhar em parceria com clientes que investem em inovação, fazendo a diferença no fomento à competitividade e crescimento econômico. “Os clientes com os quais temos trabalhado, além de serem referência em seus setores, são empresas que têm muito mérito no aspecto de inovação”, afirma Daniel Moura – Cofundador da Pix Force

Por seis anos consecutivos, a Pix Force foi destaque no Ranking da 100 Open Startups, plataforma que apoia corporações e startups a gerarem negócios em inovação. Patrocinada por empresas globais, a 100 Open avalia e classifica startups que atuam em diferentes segmentos, oferecendo a grandes empresas a oportunidade de se conectarem com novos modelos de negócios.

O processo, chamado Matchmaking, viabiliza que empresas de negócio nascente se conectem a corporações já estabelecidas no mercado. Isso acaba gerando projetos de inovação de alto impacto que sejam interessantes e atrativos.

A startup gaúcha já se consolidou por meio de contratos com gigantes da indústria do aço, mineração, energia elétrica, entre outros segmentos. Os investimentos em projetos que resultaram em soluções tecnológicas ultrapassam a casa dos R$ 7 milhões.

E aí, o que você achou do nosso Guia Completo sobre Visão Computacional? Quer conhecer o trabalho da Pix Force? Escreva para gente no formulário!

Compartilhe este artigo:

Artigos Relacionados