Início / O Year in Infrastructure / Artigos do anuário 2023 / Extração de dados para criar gêmeos digitais

Extração de dados para criar gêmeos digitais

Extração de dados ocultos em arquivos CAD para construir gêmeos digitais

Como uma empresa de desenvolvimento de software de engenharia lidou com um dos principais desafios enfrentados pelas iniciativas de conversão de CAD para GIS.

Compartilhar
Bandeira canadense com um fundo vermelho.
ícone gráfico de placa de circuito para engenharia empresarial

CATEGORIA: engenharia empresarial

Este artigo, escrito pelo autor Gavin Schrock, foi publicado originalmente na GoGeomatics
8 de novembro de 2023

Em teoria, a coleta de recursos de desenhos de engenharia para preencher e aumentar o GIS deve ser uma proposta bastante simples. No entanto, a realidade é que isso raramente é fácil de executar. Certamente, se as linhas e os símbolos nos desenhos de CAD, diferenciados por níveis (ou camadas) e células (ou blocos), forem apresentados em uma estrutura de referência espacial relacionável, deverão ser traduzidos sem problemas para um esquema de GIS. Costuma-se dizer que o problema, como sempre, mora nos detalhes, mas, no caso do CAD legado, a dificuldade pode ser a incapacidade de reconhecer os detalhes.

"O que acontece com os padrões de CAD é que eles nem sempre são seguidos à risca, além de evoluírem", disse Mark Stefanchuk, diretor de Tecnologia da Phocaz Inc. "Por exemplo, antes de 2000, os níveis eram numerados e, posteriormente, evoluíram para nomes de níveis. Os projetistas têm a tendência, especialmente quando estão com pressa, de não usar os padrões de CAD. Já nos deparamos com situações em que as células são reduzidas a seus elementos básicos, como linhas, círculos, caixas de texto etc., ou são agrupadas e perdemos a atribuição que preferiríamos manter."

Há desconexões com empresas de projeto contratadas, projetos financiados que exigem padrões diferentes e a evolução da sabedoria convencional sobre esquemas de nomeação de níveis/células. Por exemplo, algumas entidades de engenharia expandiram os padrões para distinguir entre recursos puramente projetados e aqueles que foram efetivamente construídos (ou desenho de registro). "Portanto, se precisarmos, novamente, evoluir os padrões de CAD, teremos que desenvolver um meio de passar do que existia anos atrás para o que existe hoje e para o que queremos no futuro", disse Stefanchuk. "Isso acontece em praticamente qualquer empresa - algumas têm melhores controles sobre seus padrões do que outras. Certamente, em clientes do departamento de transporte, por exemplo, vemos anomalias, de projeto para projeto, pessoas se desintegrando ou explodindo células."

renderização de software do plano de projeto CAD
Um elemento fundamental do processo orientado por IA é um agente virtual, ou "carro-robô" (mostrado em vermelho no canto inferior esquerdo), que "dirige" as pistas do arquivo CAD para detectar geometrias que, de outra forma, passariam despercebidas em uma simples extração de níveis/camadas e células/blocos. Por exemplo, uma célula de um símbolo de faixa de conversão que o desenhista/designer explodiu ou colocou no nível errado.

Dados ocultos

"Uma das coisas que frequentemente surgem durante as discussões sobre a migração CAD-GIS é por que você quer trabalhar com dados legados?", disse Mary A. Ramsey, sócia fundadora e CEO da Phocaz Inc.

Nosso pensamento, e o de nossos clientes, é que qualquer pessoa que tenha dados legados investiu substancialmente, até mesmo milhões de dólares, para obter esses dados em primeiro lugar." Pode ser um grande investimento, ao longo de décadas de criação de registros de CAD; faz sentido pelo menos tentar extrair o máximo possível desses registros.

"No caso dos departamentos de transporte (DOTs), é o dinheiro do contribuinte que foi investido. Foi feito um investimento substancial nesses ativos digitais, agora você precisa colher mais recompensas com isso. Portanto, com certeza, comece a analisar os dados que estão lá. O que não pode ser extraído automaticamente por, digamos, nível e nome da célula, são os "dados ocultos". No entanto, é o desenho, como geometria - imagine o valor que existe se pudesse ser extraído por completo." Os dados obscuros na infraestrutura são um tema quente. No contexto da infraestrutura, os dados obscuros se referem a dados valiosos que não estão prontamente acessíveis devido à evolução das convenções de dados, à falta de adesão aos padrões, à dependência excessiva do conhecimento institucional e ao gerenciamento de dados deficiente. E foi exatamente essa a abordagem adotada pela Phocaz para extrair dados ocultos do arquivo CAD dos clientes do setor de transportes.

Outra pergunta é "por que não mapeamento móvel e drones?". O mapeamento móvel e a captura de dados com base em drones evoluíram muito bem nos últimos anos. Avanços na precisão, na exatidão posicional, na automação do reconhecimento de recursos e em operações de campo simplificadas. Mas a realidade é que capturar dezenas de milhares de quilômetros de corredores rodoviários custaria muitos milhões e, mesmo assim, essas tecnologias não poderiam capturar todos os recursos. Os custos irrecuperáveis de décadas de projeto CAD e desenhos de registros se destacam como um recurso potencialmente econômico a ser explorado para preencher/aumentar substancialmente um GIS corporativo (que está evoluindo para gêmeos digitais).

Aumento da produtividade

"Criamos a Phocaz como um meio de fornecer serviços de desenvolvimento de software principalmente para o espaço de projeto auxiliado por computador", disse Ramsey. "Especificamente para usuários de engenharia civil; o Civil 3D, Bentley MicroStation e OpenRoads (é claro que, na época, seria InRoads), etc. Basicamente, estávamos desenvolvendo e mantendo add-ins para nossos clientes que eram executados nessas plataformas e produtos básicos. Continuamos a fazer esse tipo de trabalho hoje, muito trabalho para DOTs nesse sentido e também para outros clientes de infraestrutura."

A Phocaz estava desenvolvendo sua solução CAD para GIS (CAD-to-GIS) quando um cliente de longa data, o GDOT (Departamento de Transportes da Geórgia), entrou em contato com eles com esta solicitação: é possível coletar dados de um arquivo CAD, automatizar a extração e colocá-los em nosso GIS corporativo? Isso foi o início do que a GDOT chamou de CLIP, sigla em inglês para "CAD Level Integration Process". A Phocaz identificou primeiro as ferramentas existentes, algumas até mesmo dentro do ambiente CAD, que foram projetadas para fazer isso. "Descobrimos rapidamente que esses processos eram um pouco lentos e não teriam sido práticos, considerando a grandiosidade do arquivo CAD que o DOT desejava explorar. Sem mencionar como gerenciar a produção e a enorme quantidade de dados que esse empreendimento produziria."

A solução precisava ser escalonável para atender às necessidades do Departamento de Transportes da Geórgia (GDOT) e de outros grandes clientes de infraestrutura. "Por exemplo, o GDOT gerencia 80.000 milhas (128,748 km) de pista central e rotas de ajuda federal", disse Stefanchuk. "Isso representa cerca de um terço das estradas rodoviárias do estado - provavelmente cerca de 250.000 milhas (402,336 km) de pistas no estado." O estado da Geórgia não é o único a ter a oportunidade (e o desafio) de "extrair" tantos quilômetros de arquivos CAD de rodovias; dê uma olhada nos totais de quilômetros de pista de cada um dos 50 estados. A Phocaz começou a desenvolver algoritmos alimentados por IA, adotou uma abordagem de gêmeos digitais e usou o ProjectWise da Bentley Systems para produção e gestão de dados.

O carro-robô virtual

No início, a ideia era simplesmente escanear os desenhos de CAD em busca de recursos reconhecíveis por nomes de níveis e células. Mas foi melhor simplesmente "dirigir as pistas digitais" uma vez e extrair os recursos de forma abrangente.

O conceito era fazer com que a IA examinasse o desenho avançando pelas pistas e capturando os recursos à medida que avançava. É quase como dirigir em cada pista com um veículo equipado com mapeamento móvel LiDAR/Imaging (mas por uma fração do custo). Mas antes que o carro com IA possa iniciar suas viagens, é necessário que exista um ambiente espacial consistente. Felizmente, como observa Stefanchuk, a abordagem de projeto em CAD tem sido trabalhar em um modelo, obter as referências e cortar folhas a partir delas. Portanto, em quase todos os casos, o desenho está pronto para "dirigir". No caso de seus clientes DOT que trabalham em um ambiente DGN (MicroStation), foi aí que a escolha do Bentley ProjectWise provou ser especialmente adequada para gerenciar os desenhos, o progresso da extração e os dados resultantes.

Aplicações futuras

Portanto, se precisarmos, novamente, evoluir os padrões de CAD, teremos que desenvolver um meio de passar do que existia anos atrás para o que existe hoje e para o que queremos no futuro.

O ProjectWise é uma suíte de gestão de projetos da Bentley Systems, que pode servir como uma central de dados de várias disciplinas e formatos, durante todo o ciclo de vida do projeto, e permite trabalhar em um ambiente de gêmeos digitais. Como muitos de seus clientes do setor de transportes trabalham principalmente em um ambiente Bentley (por exemplo, DGN e MicroStation e pacotes de software de projeto relacionados), fazia sentido gerenciar projetos CLIP nesse pacote.

"O CLIP car, ou carro robô, como o chamamos, é realmente uma ferramenta de sessão visualizada para nós, para entender o que está acontecendo com nossos algoritmos", disse Stefanchuk. "O usuário final nunca verá isso." Embora eu deva dizer que foi divertido ver o carro-robô em uma demonstração. "O que eles querem, em última análise, são os gráficos de linha central dos recursos no ambiente GIS e as propriedades atribuídas a eles."

Para descobrir quais são essas propriedades em um determinado ponto da rodovia, a Phocaz desenvolveu uma ferramenta que pode procurar e encontrar essas características. A IA é treinada nos vários aspectos espaciais dos recursos, como marcações de ciclovias (que podem variar muito, mesmo de um município para outro), e aplica outras regras, como a distância a ser observada para cobrir as larguras padrão da faixa de domínio. "Tivemos que conceituar e visualizar o que queríamos que os algoritmos fizessem", disse Stefanchuk. "Pensamos em uma estrada sinuosa que atravessa o campo, como a dirigiríamos no mundo físico e o que poderíamos ver pelas janelas dianteiras e laterais. Depois, como ensinar a IA a "viajar" pelas pistas de CAD canalizadas e aprender com o que provavelmente veria".

"Há alguns pontos em que o CLIP/robô é realmente uma vantagem", disse Stefanchuk. "Um deles é que não precisamos coletar todos os dados de uma só vez, só precisamos coletar o que vemos naquele momento, tomar decisões sobre eles, guardá-los até que estejamos prontos para relatar o que aconteceu e, então, continuar a seguir pela rodovia. Quando nos deparamos com algo como uma marca de pavimento, podemos usar alguns modelos visuais de IA para descobrir o que essa marca de pavimento representa."

"O que aprendemos com o projeto CLIP foi que podemos começar com um símbolo, como uma seta para virar à direita ou à esquerda, e podemos ensinar uma IA a detectá-lo", disse Stefanchuk. "Mas podemos tomar outras decisões com base no que podemos inferir a partir disso, como o tipo de pista em que estou dirigindo. Estamos dirigindo em uma faixa de conversão à direita, em uma faixa de passagem, em uma faixa de conversão à esquerda, em uma faixa de conversão em U e assim por diante?

A Phocaz não se concentrou apenas nas marcações da calçada. Usando a mesma abordagem utilizada para as marcações de pavimento, eles podem criar um modelo de aprendizado de máquina (Machine Learning Model) para qualquer célula que esteja em qualquer biblioteca de células. "Nosso cérebro de IA é um modelo de aprendizado de máquina (MLM)", disse Stefanchuk. "Nosso software, um aplicativo separado do CLIP (chamado Phorz AI), orientará o usuário na criação de seu próprio MLM, começando com uma ou mais células (símbolos), como uma seta de curva, ciclovia, entrada de garagem, bueiro, etc. O MLM que um usuário cria, pode ser aplicado para detectar esses objetos em qualquer modelo iTwin (gêmeo digital). A ideia era que pudéssemos facilitar a criação de um MLM que detectasse recursos em um projeto de CAD. No caso do CLIP do GDOT, ele tem um MLM que treinamos para que eles não precisem realizar essa etapa." Para outros projetos de clientes, é criado um modelo mestre, mas eles deixam a porta aberta para que qualquer usuário aumente e ensine a IA, pois as células e os símbolos podem variar de cidade para cidade, de condado para condado etc.

A Phocaz foi recentemente homenageada como finalista na categoria Engenharia Empresarial do prêmio anual Year in Infrastructure Going Digital Awards, realizado em Singapura, de 11 a 12 de outubro de 2023. No mesmo evento, no discurso de Julien Moutte, diretor de Tecnologia (Chief Technology Office) da Bentley Systems, foi demonstrado que o CLIP extrai setas para virar à esquerda de desenhos de rodovias em CAD. "O GDOT sempre acreditou que seus desenhos CAD poderiam ser uma fonte rica de dados de ativos", disse Moutte. "Mas para acessar esses dados era necessário coletar manualmente projetos e desenhos - milhares deles - e depois inspecionar visualmente cada ativo, o que levava inúmeras horas. Para iluminar os dados obscuros, a Phocaz usou o ProjectWise com o iTwin para criar gêmeos digitais que podem ser analisados com mais eficiência usando IA com detecção de recursos e referência espacial. A Phocaz foi ainda mais longe, usando uma nova técnica de IA para preencher as lacunas entre os modelos. Eles criaram um agente de IA que pode dirigir virtualmente ao longo das pistas no gêmeo digital, detectando as linhas centrais. Com a automação da IA, o processo de extração de dados não é mais proibitivo em termos de tempo ou custo para seus clientes.

Aplicações futuras

"O CLIP é um fluxo de trabalho exclusivo que desenvolvemos para resolver esse problema para nossos clientes de transporte", disse Ramsey. "Podemos começar com o contexto do pré-requisito com o qual estamos trabalhando - estradas. Portanto, não necessariamente poderíamos aplicá-lo prontamente, por exemplo, à arquitetura. No entanto, quando entendermos qual é esse contexto, poderemos começar a pensar em como coletar dados desses tipos de projetos."

A quais aplicações de infraestrutura essa abordagem poderia ser adaptada? Os serviços públicos vêm imediatamente à mente. Há redes de transmissão e distribuição e, no caso de redes de telefonia e comunicação, há elementos de conectividade baseados em regras que podem ajudar a refinar ainda mais a análise das características lineares e dos tipos de acessórios. Quando se trata de serviços públicos subterrâneos, considerando a impraticabilidade de localizar fisicamente todos os recursos, a automação na extração de recursos de CAD pode ser inestimável. Não está fora de questão que possa haver algum sucesso, usando esse tipo de solução, para a extração de recursos de desenhos de engenharia digitalizados. No entanto, há desafios de referência espacial (escala e registro posicional), além da qualidade/completude das conversões de raster para vetor (embora tenha havido muito progresso com o uso de IA para aprimorá-las também).

À medida que as prefeituras, os serviços públicos e os campi buscam criar gêmeos digitais, o custo da captura de dados físicos completos e das pesquisas as-built é um obstáculo para uma adoção mais ampla. No entanto, poucos recursos foram construídos sem algum tipo de desenho de projeto e, pelo menos para os que foram construídos nas últimas quatro décadas, é provável que existam desenhos CAD que possam ser extraídos dessa maneira. Há uma enorme quantidade de dados ocultos nos milhões de arquivos CADS existentes. É hora de fazer melhor uso dele.

Compartilhar