Modelos de IA de ponta / IA no local para aplicações sensíveis

Muitas organizações querem integrar a IA no seu produto ou nos seus processos internos, mas sem sacrificar a privacidade dos dados. Para essas organizações, a solução é descarregar e implementar modelos de IA nos seus próprios servidores, em vez de enviar os seus dados para a nuvem. Neste artigo, vamos discutir esta estratégia no local (também conhecida como "IA de ponta").

On-Premise AI

O que significa computação no local/computação periférica?

A computação no local ou de ponta refere-se à prática de processar e armazenar dados mais perto da sua fonte, em vez de os enviar para uma infraestrutura de nuvem centralizada. Nesta abordagem, os recursos de computação estão localizados perto dos sistemas que enviam os dados.

Por outras palavras, a computação no local e a computação periférica são expressões modernas que descrevem o facto de uma aplicação ser implementada nos seus próprios servidores em vez de utilizar um serviço externo na nuvem, como uma API SaaS.

Há dois cenários que podem ser considerados como locais: ou tem as suas próprias máquinas alojadas nas suas próprias instalações, ou utiliza um fornecedor de serviços na nuvem, como AWS, GCP, Azure... Em termos estritos, este último é menos "no local" porque não tem controlo sobre o servidor subjacente, mas, em geral, ambos podem ser considerados soluções válidas no local/no limite.

Porque é que a IA no local / IA de ponta é importante?

A computação no local ou de ponta oferece várias vantagens. Em primeiro lugar, a computação local ou periférica melhora drasticamente a privacidade e a segurança dos dados, mantendo as informações confidenciais mais próximas da fonte, reduzindo o risco de acesso não autorizado ou violações de dados durante o transporte para a nuvem e impedindo que os actores da nuvem utilizem os seus dados para fins indesejados. Também ajuda as organizações a cumprir os regulamentos e leis de dados que exigem armazenamento e processamento locais.

Além disso, reduz a latência, uma vez que os dados não têm de percorrer longas distâncias para chegar à nuvem, permitindo um processamento mais rápido e uma análise em tempo real. Além disso, minimiza a dependência da conetividade de rede, assegurando que as operações podem continuar mesmo quando a Internet não é fiável ou é interrompida.

A IA é um ótimo candidato no local.

A primeira razão é que as organizações tendem a enviar dados extremamente sensíveis para modelos de IA. Isto é especialmente verdade em domínios críticos como aplicações médicas, aplicações financeiras,... Mas não só.

A segunda razão é que os actores da IA no mercado atual tendem a reutilizar os dados dos clientes para as suas próprias actividades. A OpenAI é um bom exemplo: por exemplo, quando as organizações enviam dados para o ChatGPT, os dados são examinados e a OpenAI pode reutilizar os seus dados para treinar os seus próprios modelos de IA. As preocupações com a privacidade do ChatGPT e do GPT-4 são questões centrais que levam muitas organizações a concentrarem-se em estratégias no local.

Como implementar modelos de IA no local / na periferia?

A implantação de modelos de IA no local envolve a configuração da infraestrutura para hospedar, gerenciar e servir o modelo de IA no próprio data center ou na infraestrutura gerenciada de uma organização, em vez de na nuvem.

Eis alguns passos comuns envolvidos na implementação de um modelo de IA no local:

• Selecionar o modelo de IA adequado para a tarefa.
• Avaliar os requisitos de hardware, como as necessidades de CPU, GPU e memória, com base na complexidade e dimensão do modelo de IA.
• Configurar as estruturas de aprendizagem profunda necessárias (TensorFlow, PyTorch, etc.) e outras bibliotecas.
• Converter o modelo de IA para um formato optimizado para implementação (ONNX, TensorFlow Lite, OpenVINO, etc.), se ainda não estiver num estado implementável.
• Efetuar a quantização ou poda do modelo para otimizar a velocidade de inferência e a utilização da memória, se necessário.
• Containerize o aplicativo e as dependências, o que facilita o gerenciamento e a escala.
• Desenvolver ou adaptar uma aplicação de inferência para tratar os pedidos de entrada no modelo de IA. Este serviço inclui normalmente APIs que permitem aos utilizadores interagir com o modelo para obter previsões.

Essas etapas podem ser simplificadas confiando em um fornecedor dedicado, como o NLP Cloud, para seu modelo de IA no local. Por exemplo, no que diz respeito ao NLP Cloud, terá acesso a uma imagem Docker que contém um modelo de IA pronto a usar, optimizado para inferência.

Computação no local/computação periférica VS Computação em nuvem: Prós e contras

A computação no local ou na periferia tem limitações. Os recursos de computação disponíveis na periferia são normalmente limitados em comparação com a infraestrutura de nuvem, o que pode restringir a complexidade das aplicações que podem ser implementadas. Além disso, a manutenção e gestão de recursos de computação distribuídos em vários locais pode ser um desafio, exigindo investimentos adicionais em infra-estruturas e conhecimentos de TI.

Em geral, essa estratégia é mais dispendiosa do que confiar numa oferta SaaS gerida, como a OpenAI, Anthropic, NLP Cloud...

Por último, a privacidade dos dados só é garantida se a infraestrutura subjacente no local estiver corretamente protegida.

Conclusão

A IA no local / IA de ponta está a disparar agora que a IA está gradualmente a ganhar força entre as organizações.

Esta tendência é compreensível: A IA é utilizada em todo o tipo de aplicações críticas que têm fortes requisitos de privacidade e, por definição, os actores normais da nuvem não podem cumprir esses requisitos.

Se estiver interessado numa estratégia deste tipo para o seu projeto de IA, contacte-nos para que o possamos aconselhar: [email protected]

Maxime
Responsável pelas parcerias estratégicas na NLP Cloud