A internet revolucionou praticamente todas as esferas da nossa vida, e com a crescente digitalização do mundo, enormes quantidades de dados digitais são geradas a partir de transações comerciais e indivíduos. Para lidar com tal profusão de dados, movemos um esforço contínuo de inovação tecnológica que atinge outros patamares com as inteligências artificiais.
Com tais avanços, um assunto que entrou em alta nos últimos meses foi o lançamento do ChatGPT: um modelo de linguagem de inteligência artificial que tem a capacidade de processar grandes volumes de dados e gerar respostas coerentes a partir de perguntas ou comandos de texto, pretendendo imitar o comportamento humano de maneira natural e convincente.
Um exemplo disso pode ser a pesquisa pela questão “o que é vida?”. Enquanto buscadores como o Google exibem 1.500.000.000 resultados em 0,49 segundos, com mais de 100 páginas de resultados, o ChatGPT traz uma narrativa consolidada: “A definição de vida pode variar dependendo do contexto e do ponto de vista do indivíduo ou da disciplina científica em questão.
Em geral, a vida é caracterizada por processos como a capacidade de crescer, reproduzir, metabolizar e responder a estímulos do ambiente. A biologia, por exemplo, define a vida como um estado de organização molecular altamente complexo e ordenado que se autorregula e se adapta ao meio ambiente. Já a filosofia e a religião podem abordar a vida de forma mais ampla, discutindo aspectos como a consciência, a moralidade e o propósito da existência”.
Em que pese a imprecisão e a necessidade de complementação ou crítica das informações, a vantagem dessa nova ferramenta sobre buscadores como o Google é justamente a capacidade de oferecer um resumo bem estruturado do tema, em vez de vários textos para ler (muitos deles irrelevantes).
O fato é que o ChatGPT e outras inteligências artificiais trazem avanços positivos para quem trabalha com investigações, principalmente em fontes abertas. O ponto em comum, inclusive, é o fato de todas essas IAs serem treinadas com uma variedade de fontes de dados, incluindo artigos de notícias, livros eletrônicos, sites e fóruns na internet, permitindo que pesquisadores e jornalistas coletem informações e obtenham respostas mais rapidamente.
Imagine que um jornalista deseja investigar uma empresa que está envolvida em um escândalo financeiro. Usando o ChatGPT, ele poderia fazer perguntas como “Quais são os nomes dos executivos envolvidos na fraude?” ou “Qual é o valor total do dinheiro desviado?”. O sistema seria capaz de vasculhar a internet em busca de informações relevantes e retornar respostas consideráveis.
O ChatGPT é uma ferramenta que utiliza dados disponíveis em fontes abertas para fornecer respostas às perguntas dos usuários. Embora seja uma aplicação simplória de OSINT, pode ser o início de uma poderosa ferramenta que ajudará a consolidar informações disponibilizadas na web para orientar investigações.
Para além do ChatGPT, Inteligências Artificiais que fazem uso de machine learning e outras técnicas que permitem que sistemas computacionais aprendam e melhorem com base em dados já são usadas há algum tempo. Bancos e instituições financeiras usam esse tipo de ferramenta, por exemplo, com o intuito principal de identificar padrões de comportamento financeiro por detecção de anomalias algorítmicas em grandes bancos de dados.
Assim, os bancos são capazes de monitorar os parâmetros de transação das contas em tempo real e identificar comportamentos fraudulentos com alta precisão, alertando os clientes e até mesmo impedindo estas transações. O machine learning também vem sendo usado para treinar sistemas a detectar micro pagamentos e identificar técnicas de lavagem de dinheiro, como o smurfing.
Ferramentas que utilizam inteligência artificial ainda não se alimentam de dados e informações geradas em tempo real, isso significa que todas as ferramentas disponíveis no mercado atualmente possuem uma limitação temporal. No caso do ChatGPT, os bancos de dados que alimentaram o modelo foram coletados até 2021, portanto, as informações fornecidas em suas respostas provavelmente precisarão de complementação em fontes mais atualizadas.
Outro desafio para quem trabalha com investigação em fontes abertas é garantir que as informações coletadas e armazenadas sejam oriundas de fontes públicas, abertas e oficiais, para que não seja alegada nenhuma violação de direitos de quem está sendo investigado, e nem cometimento de qualquer crime. Por sua vez, ao tentar desvendar fontes das respostas que o ChatGPT traz, há uma tendência em fornecer informações erradas, incompletas ou imprecisas – e de origem indeterminada. Essas são red flags a serem consideradas.
Por fim, embora quem trabalhe com OSINT consulte informações disponibilizadas em fontes públicas e abertas, é sua capacidade analítica que faz o diferencial na ligação dos fatos e dos dados. Ferramentas, técnicas verificáveis de extração de dados, novas fontes, e, principalmente, soluções personalizadas para problemas complexos, serão habilidades que o ChatGPT ou outra IA não possuem, e dificilmente possuirão. Apesar de valiosas na busca e coleta de informações, é importante lembrar que as inteligências artificiais não são capazes de substituir completamente a expertise humana (ao menos não por enquanto).
* Escrito por Paulo Barreto e Luara Stollmeier, consultores especializados em OSINT (Open Source Strategic Intelligence) na área de Inteligência Corporativa da Aliant, plataforma de soluções digitais para Governança, Riscos, Compliance, Cibersegurança, Privacidade e ESG.
Índice